Chinesa Alibaba lança modelo de IA e diz que ele é superior ao DeepSeek

Chinesa Alibaba lança modelo de IA e diz que ele é superior ao DeepSeek


Empresa diz que seu modelo de inteligência artificial Qwen 2.5 é melhor do que o rival, indicando que a ascensão do DeepSeek estimulou também a concorrência entre os chineses, após causar uma reviravolta no Vale do Silício. Sede do grupo Alibaba em Hangzhou, na China
Reuters
A empresa chinesa de tecnologia Alibaba lançou nesta quarta-feira uma nova versão de seu modelo de inteligência artificial, o Qwen 2.5, que, segundo ela, é superior a outro chatbot chinês, o DeepSeek-V3.
O lançamento do assistente de IA da DeepSeek, em janeiro, chocou o Vale do Silício e fez com que ações de empresas de tecnologia ao redor do mundo despencassem. Mas o sucesso também levou a uma corrida entre seus concorrentes nacionais para atualizar seus próprios modelos de IA.
O Qwen 2.5-Max, da Alibaba, foi lançado no primeiro dia do Ano Novo Lunar, quando a maioria dos chineses está de folga do trabalho. O momento escolhido indica a pressão que a ascensão meteórica do DeepSeek exerceu também sobre sua concorrência doméstica.
“O Qwen 2.5-Max supera (…) quase todos os GPT-4o, DeepSeek-V3 e Llama-3.1-405B”, disse a unidade de computação em nuvem da Alibaba em sua conta oficial na rede social WeChat, citando, além do DeepSeek, os modelos de IA de código aberto mais avançados das norte-americanas OpenAI e Meta.
Dois dias após o lançamento do DeepSeek-R1, a ByteDance, proprietária do TikTok, lançou uma atualização de seu principal modelo de IA. Segundo a ByteDance, ele superou o o1, da OpenAI, no teste AIME, que mede a capacidade de entendimento e resposta a instruções complexas por parte das tecnologias.
DeepSeek: veja perguntas e respostas sobre a IA chinesa
Criadora do ChatGPT alega que DeepSeek usou dados ilegalmente para treinar sua IA, dizem agências
DeepSeek vs. rivais chineses
O antecessor do modelo V3 da DeepSeek, o DeepSeek-V2, desencadeou uma guerra de preços de modelos de IA na China após seu lançamento em maio passado.
O fato de o DeepSeek-V2 ser de código aberto e barato, custando apenas 1 iuan (0,14 dólar) por 1 milhão de tokens (unidades de dados processados pelo modelo de IA), fez com que a unidade de computação em nuvem do Alibaba anunciasse cortes de preços de até 97% em uma série de modelos.
Outras empresas chinesas de tecnologia seguiram o exemplo, incluindo a Baidu, que lançou o primeiro equivalente chinês ao ChatGPT em março de 2023, e a empresa de tecnologia mais valiosa da China, a Tencent.
Liang Wenfeng, fundador da DeepSeek, disse em uma entrevista ao site chinês Waves, em julho, que a startup “não se importava” com guerras de preços, e que alcançar a AGI (inteligência artificial geral) é seu principal objetivo.
A OpenAI define AGI como sistemas autônomos que superam os humanos nas tarefas mais valiosas do ponto de vista econômico.
Enquanto as grandes empresas chinesas de tecnologia, como a Alibaba, têm centenas de milhares de funcionários, a DeepSeek opera como um laboratório de pesquisa, com uma equipe formada principalmente por jovens graduados e estudantes de doutorado das principais universidades chinesas.
Liang disse na entrevista que acreditava que as maiores empresas de tecnologia da China talvez não fossem adequadas para o futuro do setor de IA, contrastando seus altos custos e estruturas de cima para baixo com a operação enxuta e o estilo de gerenciamento flexível da DeepSeek.
“Grandes modelos fundamentais exigem inovação contínua, e as capacidades dos gigantes da tecnologia têm seus limites”, disse ele.
Por que a IA chinesa DeepSeek é apontada como ameaça ao protagonismo dos EUA?

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *

POSTS RECOMENDADOS