경제 관련 뉴스와 유튜브를 보다가 최근 딥시크(deepseek)에 대해 알게 되었습니다.
개발 환경이나 그들이 추구하는 방향 심지어 비용까지 매우 충격적이었습니다.
미국이 아니면 불가능하다고 생각했던 chat-GTP와 거의 유사하거나 심지어 능가할 수 있는 수준의 AI가 중국의 기술력으만들었다고 하니 매우 놀라웠습니다.
이러한 능력을 갖고 있는 중국이 부러웠고 우리나라는 불가능한 것인지 아니면 그냥 포기하는 것인지 미국에 의존하는 모습이 아쉬웠습니다.
이러한 deepseek에 대해 좀 더 자세히 소개하고자 하며 이를 바탕으로 우리가 추구해야 할 방향을 좀 생각하면 좋겠습니다.
1. DeepSeek의 탄생 과정
- DeepSeek는 중국의 AI 스타트업으로, 'AGI(인공일반지능) 실현'을 목표 로 합니다. 이 회사는 퀀트 헤지펀드에서 얻은 자금으로 AI 인재들에게 최고의 보상을 제공하며, 순수 중국 출신 엔지니어들로 구성된 팀을 운영합니다.
- DeepSeek의 창립자 량원 퍼은 저장대학교에서 정보전자공학을 전공하고 헤지펀드를 설립한 인물입니다. 그는 2021년부터 AI 프로젝트를 위해 엔비디아 GPU를 대량으로 구매하기 시작하여, 미국의 제재 이전부터 AI 개발을 준비해 왔습니다.
- DeepSeek은 초기에는 Llama 2를 기반으로 벤치마크 경쟁에 뛰어들었지만, 이후 자체적인 MoE(Mixture of Experts) 아키텍처와 MLA(Multi-Head Latent Attention) 구조를 개발하며 혁신을 가속화했습니다.
- 2023년 하반기부터 DeepSeek Coder, DeepSeek LLM 등 다양한 모델을 출시했으며, 특히 DeepSeek-Coder-V2는 코딩 분야에서 뛰어난 성능을 보여줍니다. 2024년에는 DeepSeekMoE, DeepSeekMath, DeepSeek-VL 등 효율적인 모델들을 잇달아 공개했습니다.
- 최근에는 DeepSeek-V3와 R1 모델을 출시하여 오픈 AI 모델과 경쟁 하고 있으며, R1 모델은 오픈 AI의 o1 모델과 비슷한 수준의 성능을 보이면서도 훨씬 저렴한 비용으로 제공됩니다.
2. DeepSeek의 영향
- DeepSeek은 고성능 AI 모델을 저렴한 비용으로 제공하여 AI 기술의 접근성을 높이고 있습니다. 이는 정보 민주화를 촉진하고, 개발자, 창작자, 학생 등 누구나 고성능 AI를 사용할 수 있게 합니다.
- DeepSeek 모델은 오픈소스로 제공되어 사용자 맞춤 설정이 가능하며, 다양한 비즈니스 및 개발 환경에서 손쉽게 활용할 수 있습니다. API 사용료 또한 매우 저렴하여, 기업들이 AI 기술을 도입하는 데 드는 비용을 절감할 수 있습니다.
- DeepSeek의 등장으로 인해 기존 AI 모델의 높은 가격과 복잡한 구조에 대한 의문이 제기되고 있습니다. 이는 AI 시장 경쟁을 심화시키고, 기술 혁신을 가속화하는 요인으로 작용합니다.
- DeepSeek은 자체적인 기술력으로 미국의 기술 제재를 극복했으며, 이는 중국이 기술 자립을 이루는 데 중요한 역할을 합니다. 이는 미국 중심의 AI 기술 패권에 도전하는 중요한 사례로 평가받고 있습니다.
- DeepSeek의 성공은 다른 국가들도 자체 AI 모델 개발에 뛰어들 수 있게 하는 촉매제 역할을 합니다. 이는 글로벌 AI 경쟁 구도를 재편할 가능성을 시사합니다.
3. 기존 생성형 AI와의 비교
- OpenAI의 GPT 모델:
- 장점: 깊이 있는 대화, 창의적인 글쓰기, 다양한 분야의 지식 제공에서 강점을 보이며, 자연어 처리 능력이 뛰어납니다.
- 단점: 높은 운영 비용, 과도한 정책 제한, 느린 응답 속도가 단점으로 지적됩니다.
- DeepSeek 모델:
- 장점: 빠른 응답 속도, 낮은 연산 비용, 저렴한 API 사용료, 오픈소스 제공을 통한 높은 유연성을 제공합니다.
- 단점: OpenAI 모델에 비해 세부적인 이해력과 맥락 유지 능력이 부족할 수 있다는 평가가 있습니다.
- DeepSeek의 차별점:
- 비용 효율성: DeepSeek은 훨씬 적은 비용으로 유사하거나 더 나은 성능을 달성합니다. DeepSeek R1 모델의 API 가격은 OpenAI의 gpt-4o 모델에 비해 27배 정도 저렴합니다.
- 기술 혁신: MLA, MoE 등 독자적인 기술을 개발하여 효율성을 극대화했습니다.
- 오픈소스: 모델을 오픈소스로 공개하여 사용자의 접근성을 높이고 기술 발전을 촉진합니다.
- 다양한 모델 제공: 다양한 크기의 모델과 미세 조정 모델을 제공하여 사용자의 필요에 맞는 선택을 가능하게 합니다.
4. 저비용 개발 환경이 미국 빅테크 투자에 미치는 영향
- DeepSeek의 저비용 개발 성공 사례는 미국 빅테크 기업들에게 큰 충격을 주고 있습니다. 특히, 적은 GPU 자원으로 고성능 AI 모델을 개발할 수 있다는 사실은 미국의 AI 개발 전략에 대한 근본적인 의문 을 제기합니다.
- 미국 빅테크 기업들은 AI 개발에 막대한 투자를 해왔지만, DeepSeek과 같은 저비용 고효율 모델의 등장은 이러한 투자 전략에 변화를 요구합니다.
- 일부에서는 DeepSeek의 효율적인 모델 개발 방식이 엔비디아와 같은 고가 AI 칩 제조업체의 매출에 부정적인 영향을 줄 수 있다는 분석도 나옵니다.
- 미국 빅테크 기업들은 DeepSeek의 기술을 모방하거나 자체적인 효율성 개선 방안을 모색할 가능성이 높습니다. 또한, AI 기술 개발에 대한 투자를 확대하여 경쟁력을 유지하려 할 것입니다.
- AI 개발 비용의 민주화는 더 많은 스타트업과 기업들이 AI 시장에 진입할 수 있도록 하며, 이는 장기적으로 AI 생태계의 다양성을 높일 수 있습니다.
- 미국 정부는 AI 규제 정책을 재검토하고 기술 개발을 장려하는 방향으로 정책을 수정할 가능성이 있습니다.
5. 결론
DeepSeek은 저비용, 고효율 AI 모델 개발의 새로운 기준을 제시하고 있습니다. 이는 기존 AI 시장의 판도를 바꾸고, 기술 경쟁의 새로운 국면을 열었습니다. 미국 빅테크 기업들은 DeepSeek의 성공을 통해 AI 개발 전략을 재검토하고 기술 혁신에 대한 투자를 더욱 확대해야 할 것입니다. DeepSeek이 AI 시장에서 지속적으로 성장해 나갈 수 있을지, 향후 AI 산업에 어떤 영향을 미칠지 계속해서 주목해야 합니다.
이와 연관된 기술들이 계속 발전한다면 엔비디아와 그와 연관된 사업들이 지금과 같은 지위를 유지할 수 있을지 모르겠습니다.
관련 기사를 보니 H100을 사용하지 않고 저렴한 GPU를 사용했다고 하는데..
중국기업이니 100% 신뢰히진 않지만 주의 깊게 지켜볼 현상인 것은 맞아 보입니다.
'생활' 카테고리의 다른 글
중국 AI 챗봇 딥시크(DeepSeek)의 개인정보 유출 및 보안 논란: 2025년 현재, 사용해도 괜찮을까? (6) | 2025.02.04 |
---|---|
데이터 분석 자격증 총정리: ADsP vs ADP (7) | 2025.02.01 |
구글 노트북 LM 완벽 활용 가이드! (0) | 2025.01.17 |
이것만은 꼭 확인하세요! : 어린이 무선 헤드셋 심층 비교 가이드 (0) | 2025.01.12 |
"2024 서울 전시 기획전: 따뜻한 실내에서 만나는 예술과 과학" (0) | 2025.01.11 |