Ouça este conteúdo
A OpenAI, empresa de inteligência artificial responsável por desenvolver o ChatGPT, um modelo de linguagem generativa que pode conversar com os usuários, anunciou nesta quinta-feira (15) o lançamento de uma nova ferramenta revolucionária chamada Sora, que pode criar vídeos de até um minuto a partir de instruções em textos.
A empresa liderada por Sam Altman afirma em seu site que Sora é capaz de “gerar cenas complexas com vários personagens, tipos específicos de movimento e detalhes precisos do assunto e do fundo”. A OpenAI também menciona que seu novo modelo “entende não apenas o que o usuário pediu no prompt, mas também como essas coisas existem no mundo físico”.
Além das inovações citadas acima, Sora também pode criar várias tomadas em um único vídeo gerado, “mantendo a qualidade visual e a aderência às instruções do usuário”, pontua a empresa.
A nova ferramenta utiliza uma arquitetura semelhante aos modelos GPT, que permite escalar o desempenho e a qualidade dos vídeos.
“Sora é capaz de gerar vídeos inteiros de uma só vez ou ampliar os vídeos gerados para torná-los mais longos”, explica a OpenAI.
A OpenAI reconhece que sua nova ferramenta ainda possui algumas falhas e limitações, como dificuldade em simular com precisão a física de uma cena complexa, confundir detalhes espaciais de um prompt ou ter problemas com descrições precisas de eventos que ocorrem ao longo do tempo. Por isso, a empresa afirma que neste momento está tomando algumas medidas de segurança antes de disponibilizar a ferramenta de forma aberta para o público.
Sora está sendo avaliada por um grupo de especialistas de diversas áreas e foi disponibilizada para artistas, designers e cineastas que deverão experimentá-la e dar feedbacks sobre como deixar o modelo mais útil para os profissionais dessas áreas.
A OpenAI disse que ainda está trabalhando na construção de ferramentas para ajudar a detectar conteúdo enganoso, como um classificador de detecção que pode dizer quando um vídeo foi gerado pelo seu novo modelo.