A empresa de AI de Elon Musk, XAI, lançou na quarta-feira seu mais recente modelo de IA, Grok 4, e lançou um novo plano de assinatura de IA de US $ 300 por mês, Supergrok Heavy.
Grok A resposta de Xai é para modelos como o OpenAI’s Chatgpt e Google’s Gêmeose pode analisar imagens e responder a perguntas. Nos últimos meses, Grok tornou -se mais profundamente integrado à rede social de Musk, X, que foi adquirido recentemente por Xai. No entanto, isso também colocou O mau comportamento de Grok na frente e no centro para milhões de usuários.
As expectativas são altas para Grok 4. O modelo mais recente de IA da XAI será empilhado contra o próximo modelo de IA do OpenAI, GPT-5, que deve ser lançado no final deste verão.
“Com relação às perguntas acadêmicas, o GROK 4 é melhor que o nível de doutorado em todos os assuntos, sem exceções”, disse Elon Musk durante uma transmissão ao vivo na noite de quarta -feira. “Às vezes, pode não ter bom senso, e ainda não inventou novas tecnologias ou descobriu nova física, mas isso é apenas uma questão de tempo”.
O lançamento do GROK 4 ocorre em meio a uma semana tumultuada para as empresas de Elon Musk. Mais cedo na quarta -feira, Linda Yaccarino deixou o cargo de seu papel como CEO da X após cerca de dois anos na empresa. X ainda não anunciou seu sucessor.
A partida de Yaccarino ocorre apenas alguns dias após a conta oficial do GROK, a conta X automatizada respondeu aos usuários com Comentários anti -semitas que criticam os “executivos judeus” de Hollywood e elogiam Hitler. Xai teve que limitar brevemente a conta de Grok e excluir as postagens ofensivas. Em resposta ao incidente, Xai parecia ter removeu uma seção recentemente adicionada do prompt de sistema público de Grokuma lista de instruções para o chatbot da IA seguir, que disse que não se esquivou de fazer reivindicações “politicamente incorretas”.
Os líderes de Musk e Xai evitaram amplamente discutir o incidente, concentrando -se no desempenho e nas capacidades do GROK 4.
A Xai lançou dois modelos na quarta-feira: Grok 4 e Grok 4 Heavy-este último é a “versão multi-agente” da empresa que oferece maior desempenho.
Xai afirma que o GROK 4 mostra o desempenho do nível da fronteira em vários benchmarks, incluindo o último exame da humanidade – um teste desafiador que mede a capacidade da IA de responder a milhares de perguntas de crowdsourcing sobre assuntos como matemática, humanidades e ciências naturais. De acordo com Xai, Grok 4 obteve 25,4%no último exame da humanidade sem “ferramentas”, superando o Gemini 2.5 Pro do Google, que obteve 21,6%, e o OpenAI’s O3 (alto), que obteve 21%.
Xai afirma que Grok 4 pesado, com “ferramentas”, conseguiu obter uma pontuação de 44,4%, superando o Gemini 2.5 Pro com ferramentas, que obtiveram 26,9%.
O prêmio de arco sem fins lucrativos diz que Grok alcança uma nova pontuação de última geração Em seu teste ARC-Agi-2-outro benchmark difícil que consiste em problemas semelhantes ao quebra-cabeça, onde uma IA precisa identificar padrões visuais-pontuando 16,2%. Isso é quase o dobro da pontuação do próximo melhor modelo comercial de IA, Claude Opus 4.
Ao lado da Grok 4 e Grok 4 Heavy, a Xai lançou seu plano de assinatura de IA mais caro até agora, uma assinatura de US $ 300 por mês chamada Supergrok Heavy. Os assinantes do plano terão uma prévia antecipada para Grok 4 pesado, além de acesso precoce a novos recursos. O plano é semelhante às camadas ultra-premium oferecidas pelo OpenAI, Google e antropia, mas a Xai agora oferece a assinatura mais cara entre os principais fornecedores de IA.
Os assinantes do SuperGrok Heavy podem ter acesso antecipado a alguns novos produtos que a XAI planeja lançar nos próximos meses. A empresa disse quarta-feira que um modelo de codificação de IA está chegando em agosto, um agente multimodal em setembro e um modelo de geração de vídeo em outubro.
A Xai está lançando o Grok 4 por meio de sua API, em um esforço para fazer com que os desenvolvedores criem aplicativos com o modelo. A empresa observa que o setor empresarial de Xai tem apenas dois meses, no entanto, planeja trabalhar com hiperescaladores para disponibilizar a GROK em suas plataformas em nuvem.
Apesar do desempenho no nível da fronteira de Grok nos benchmarks, pode ser difícil para Xai superar seus recentes contratempos, enquanto tenta lançar Grok para as empresas como um verdadeiro candidato ao Chatgpt, Claude e Gêmeos. Ainda não se sabe se as empresas estão prontas para adotar Grok, falhas e tudo,
Deixe um comentário