
Photo by Solen Feyissa on Unsplash
Deepseek, AI 추론 모델 R1에 대한 업데이트를 출시
AI 스타트업 DeepSeek가 목요일에 추론 AI 모델인 R1의 최신 업데이트를 Hugging Face 플랫폼에서 발표했습니다. 이 업데이트인 R1-0528은 공식적인 발표 없이, 그리고 제공된 세부 사항이 거의 없는 상태에서 출시되었습니다.
바쁘신가요? 다음은 빠른 사실들입니다:
- DeepSeek이 MIT 라이선스가 포함된 R1 모델에 대한 새로운 업데이트를 발표하였습니다.
- R1-0528은 o3와 Gemini 2.5 Pro 같은 선두 모델과 거의 비슷한 성능을 보여주었습니다.
- 최신 버전은 환각율을 줄여주는 특징을 가지고 있습니다.
TechCrunch에 따르면, 이 중국 회사는 수요일에 소셜 미디어 플랫폼 WeChat에 게시물을 공유하며 팔로워들에게 최근의 개발 상황을 알렸습니다. 이번 업데이트에는 ‘사소한’ 업그레이드가 포함되어 있습니다: 상업적으로 모델을 사용할 수 있도록 허용하는 MIT 라이선스의 채택입니다.
“최근 업데이트에서 DeepSeek R1은 컴퓨팅 자원을 늘리고 후훈련 시 알고리즘 최적화 메커니즘을 도입함으로써 추론 및 추리 능력을 크게 향상시켰습니다.” 라고 Hugging Face에 공유한 DeekSeek의 문서에 적혀 있다. “이제 그것의 전반적인 성능은 o3와 Gemini 2.5 Pro 같은 선두 모델에 근접하고 있습니다.”
벤치마크 테스트 결과의 그래픽에서, DeepSeek R1-0528은 유사한 경쟁 모델과 같거나 더 나은 성능을 보여줍니다. AIME 2025 벤치마크에서, DeepSeek R1-0528은 87.5 점을 기록하였는데, 이는 88.9 점을 기록한 OpenAI o3 모델보다는 낮지만, Gemini-2.5 Pro 0506, Qwen3-235B, 그리고 자신의 이전 버전인 DeepSeek-R1보다는 더 좋습니다.
“이 버전은 향상된 추론 능력 외에도 감소된 환각율, 함수 호출에 대한 강화된 지원, 그리고 더 나은 Vibe 코딩 경험을 제공한다”고 문서에는 나와있다.
Hugging Face의 공동 창업자이자 CEO인 클레멘트 델랑그는 소셜 미디어 플랫폼 X에서 R1 업데이트 소식을 전했다. “몇 분 후 & 우리의 추론 파트너 중 일부에서 이미 업데이트된 R1이 사용 가능하다”고 델랑그는 글을 썼다. “모델 페이지의 모든 것이 아름답다!” 여러 사용자들이 R1의 최신 버전에 대한 관심을 나타냈다.
최근 DeepSeek는 데이터 유출 사건에 연루되었습니다, 그들의 데이터베이스가 노출되었으며, 이로 인해 제3의 당사자들이 약 100만 건의 로그, API 키, 그리고 채팅 기록에 접근할 수 있었습니다. 이 취약점은 이미 DeepSeek에 의해 처리되었습니다.