새로운 AI 회사 Deep Cogito가 첫 번째 하이브리드 AI 모델을 출시했습니다.

Photo by Steve Johnson on Unsplash

새로운 AI 회사 Deep Cogito가 첫 번째 하이브리드 AI 모델을 출시했습니다.

읽는 시간: 2 분

새로운 미국 AI 회사인 Deep Cogito가 화요일에 ‘Cogito v1’이라는 첫 번째 대형 언어 모델(LLMs)을 공개했습니다. 이 스타트업은 오픈소스 및 하이브리드 모델이 DeepSeek, Qwen, 그리고 Meta의 LLaMA를 포함한 유사한 오픈 AI 모델들을 능가한다고 주장합니다.

서둘러야 하나요? 여기 빠른 사실들이 있습니다:

  • Deep Cogito가 이번 화요일에 첫 LLM인 Cogito v1을 출시했습니다.
  • 이 신생 미국 회사는 자사의 모델이 Qwen, DeepSeek, 그리고 Meta의 LLaMA를 포함한 동등한 오픈 소스 모델들을 능가한다고 주장합니다.
  • Cogito v1 모델은 추리와 표준 모드에서 작동하며, 함수 호출, 코딩, 그리고 에이전트 사용을 위해 최적화되었습니다.

산프란시스코에 본사를 둔 딥 코기토(Deep Cogito)는 자사 웹사이트를 통해 공식 발표를 통해 Cogito v1을 소개하였습니다. 이 발표에는 LLM들에 관한 세부사항, 그 성능, 그리고 다가오는 출시에 대한 정보가 포함되어 있습니다.

“우리는 크기가 3B, 8B, 14B, 32B, 70B인 가장 강력한 LLM들을 오픈 라이선스로 공개하고 있습니다.”라고 문서에 기재되어 있습니다. “각 모델은 LLaMA, DeepSeek, Qwen의 동급 모델들을 포함한 동일한 크기의 가장 우수한 오픈 모델들을 대부분의 표준 벤치마크에서 능가합니다. 특히, 70B 모델은 최근에 공개된 Llama 4 109B MoE 모델까지 능가합니다.”

새 모델은 반복적인 증류와 증폭(IDA), 즉 일반 초지능을 위한 조정된 시스템을 구축하도록 AI 모델을 훈련시키는 프레임워크를 통해 훈련되었으며 “추론” 기능을 포함하고 있습니다. 모든 모델들은 추론 및 표준 모드에서 작동할 수 있는 하이브리드 모달리티를 가지고 있으며, 함수 호출, 코딩, 대리 사용을 위해 최적화되었습니다.

스타트업의 연구와 결과에 따르면, Cogito v1은 인기 있는 벤치마크를 고려할 때, 대부분의 동등한 모델들을 직접적이고 추론 모드에서 능가했습니다. 이 회사는 앞으로 몇 개월 안에 더 큰 모델을 출시할 예정입니다.

“우리의 다음 출시는 각 모델 크기 (3B에서 70B)에 대한 업데이트된 체크포인트를 특징으로 하며, 확장된 훈련 기간과 더불어 앞으로 몇 주와 몇 달 안에 더 큰 모델들이 출시될 것입니다.”라고 회사는 적었습니다. “모든 모델은 오픈 소스가 될 것입니다.”

Cogito v1은 Ollama 또는 Hugging Face에서 다운로드하거나, Together AI 또는 Fireworks AI의 API를 통해 접근할 수 있습니다.

TechCrunch에 따르면, Deep Cogito는 2024년 6월에 전 구글 직원인 Drishan Arora와 Dhruv Malhotra에 의해 설립되었습니다. 이 회사는 South Park Commons에 의해 후원받고 있으며, 주 목표는 인간을 능가하는 일반적인 초지능을 구축하는 것입니다.

새로운 AI 모델은 AI 시장의 강도와 속도를 따라잡고 오픈소스 트렌드에 참여하기 위해 나왔습니다. 중국 검색엔진 거인 Baidu는 2월에 새로운 오픈소스 AI 모델을 발표하였고, DeepSeek는 몇 주 전에 그 코드에 대한 더 많은 세부사항과 투명성 이니셔티브를 공유하였습니다.

이 기사가 마음에 드셨나요? 평가해 주세요!
정말 싫습니다 별로 좋아하지 않습니다 괜찮습니다 꽤 좋습니다! 정말 좋습니다!

마음에 드셨다니 기쁩니다!

Trustpilot에 여러분의 의견을 남겨 주실 수 있으실까요? 리뷰는 WizCase에게 큰 힘이 됩니다. 감사합니다!

Trustpilot에 리뷰 남기기
0 0명의 사용자가 투표
제목
코멘트
피드백을 주셔서 감사합니다