소식 DeepSeek의 경제성은 신화입니다. 혁명 AI는 실제로 개발하는 데 16 억 달러가 들었습니다.

DeepSeek의 경제성은 신화입니다. 혁명 AI는 실제로 개발하는 데 16 억 달러가 들었습니다.

by Isaac Mar 16,2025

DeepSeek의 새로운 챗봇은 인상적인 소개를 자랑합니다. "안녕하세요, 나는 당신이 무엇이든 물어보고 당신을 놀라게 할 수있는 답을 얻을 수 있도록 만들어졌습니다." 중국 스타트 업 Deepseek의 제품인이 AI는 빠르게 주요 선수가되어 Nvidia의 주가가 크게 감소했습니다.

Deepseek 테스트 이미지 : ensigame.com

Deepseek의 성공은 혁신적인 건축 및 훈련 방법에서 비롯됩니다. 주요 기술에는 다음이 포함됩니다.

  • MTP (Multi-Token Prediction) : 단어를 하나씩 예측하는 대신 MTP는 여러 단어를 동시에 예측하여 정확도와 효율성을 높입니다.
  • 전문가 (MOE)의 혼합 : 이 아키텍처는 DeepSeek V3의 256 개의 신경망을 사용하여 각 토큰 처리 작업 당 8 개를 활성화하여 교육을 크게 가속화하고 성능을 향상시킵니다.
  • MLA (Multi-Head Prenatent Attention) : MLA는 텍스트 조각에서 주요 세부 정보를 반복적으로 추출하여 중요한 정보를 놓치지 않도록하여 입력 데이터에 대한 미묘한 이해를 초래합니다.
Deepseek V3 이미지 : ensigame.com

DeepSeek은 처음에는 2048 GPU를 사용하여 DeepSeek V3에 대해 6 백만 달러의 교육 비용이 6 백만 달러를 주장했지만 Semianalysis는 훨씬 더 실질적인 인프라를 나타 냈습니다. 약 50,000 NVIDIA HOPPER GPU (10,000 H800, 10,000 H100 및 추가 H20)가 여러 데이터 센터에 걸쳐 확산되었습니다. 이는 약 16 억 달러의 총 서버 투자를 나타내며 운영 비용은 9 억 9,400 만 달러로 추정됩니다.

중국 헤지 펀드 High-Flyer의 자회사 인 Deepseek는 데이터 센터를 소유하여 최적화 및 혁신 구현에 대한 비교할 수없는 통제권을 부여합니다. 이 자체 지원 접근 방식은 유연성과 의사 결정 속도를 향상시킵니다. 또한이 회사는 최고의 인재를 유치하며 일부 연구자들은 매년 130 만 달러 이상을 벌어 주로 중국 대학에서 주로 채용합니다.

Deepseek 이미지 : ensigame.com

Deepseek의 6 백만 달러의 훈련 비용 청구는 오해의 소지가 있습니다. 연구, 개선, 데이터 처리 및 인프라를 제외한 사전 훈련 GPU 사용 만 반영합니다. 회사의 AI 개발에 대한 실제 투자는 5 억 달러를 초과합니다. 그러나 린 구조는 더 큰 관료 조직에 비해 효율적인 혁신 구현을 허용합니다.

Deepseek 이미지 : ensigame.com

Deepseek의 이야기는 자금을 잘 갖춘 독립 AI 회사의 거인과 경쟁 할 수있는 능력을 보여줍니다. 그러나 그 성공은 수십억의 투자, 기술 혁신 및 강력한 팀과 의심 할 여지없이 관련이 있습니다. "혁명 예산"이야기는 상당한 과도한 단순화입니다. 그럼에도 불구하고 DeepSeek의 비용은 경쟁 업체보다 훨씬 저렴합니다. 예를 들어, DeepSeek은 R1에 5 백만 달러를 소비 한 반면 ChatGpt4는 1 억 달러가 들었습니다.