DeepSeek은 중국 스타트업 DeepSeek이 개발한 오픈소스 AI 모델이다. DeepSeek-R1은 수학·코딩 추론에서 OpenAI o1에 필적하는 성능을 보이면서 개발 비용이 대폭 낮아 AI 업계에 충격을 줬다.
목차
DeepSeek이 주목받는 이유
공식 발표에 따르면 DeepSeek-R1은 약 600만 달러의 GPU 비용으로 훈련됐다. 이는 GPT-4 훈련 비용(추정 1억 달러 이상) 대비 현저히 낮은 수준이다. 2025년 1월 DeepSeek-R1이 미국 앱스토어 1위를 기록하면서 AI 업계 전반에 비용 효율성에 대한 재논의가 시작됐다.
DeepSeek 모델 비교
| 모델 | 특징 | 접근 | 파라미터 |
|---|---|---|---|
| DeepSeek-V3 | 일반 목적, GPT-4급 | 웹·API | 671B MoE |
| DeepSeek-R1 | 수학·코딩 추론 특화 | 웹·API·오픈소스 | 671B |
| DeepSeek-R1 (7B) | 경량 로컬 실행 | Ollama 지원 | 7B |
| DeepSeek-Coder V2 | 코딩 특화 | 오픈소스 | 236B MoE |
DeepSeek 사용 방법
웹에서 바로 사용
chat.deepseek.com에서 계정 없이 바로 사용 가능하다. DeepSeek-V3(일반 대화)와 DeepSeek-R1(추론 모드)을 선택해 사용할 수 있다. 한국어 지원은 양호한 편이다.
로컬에서 Ollama로 실행
# Ollama 설치 후
ollama run deepseek-r1:7b # 경량 버전 (4.7GB)
ollama run deepseek-r1:32b # 고성능 (19GB)Ollama 로컬 AI 가이드를 참고해 PC에서 완전 무료로 실행할 수 있다. 7B 버전은 일반 노트북에서도 실행 가능하다.
DeepSeek vs ChatGPT vs Claude 비교
| 항목 | DeepSeek-R1 | ChatGPT o4-mini | Claude 3.5 |
|---|---|---|---|
| 수학 추론 | 최상위 | 최상위 | 높음 |
| 코딩 | 높음 | 높음 | 매우 높음 |
| 한국어 | 보통 | 우수 | 우수 |
| 오픈소스 | O (MIT) | X | X |
| API 비용 | 매우 저렴 | 중간 | 중간 |
| 개인정보 | 중국 서버 | 미국 서버 | 미국 서버 |
DeepSeek 사용 시 주의사항
데이터는 중국 서버에 저장되며, 중국 정부의 검열 정책이 적용될 수 있다. 정치적으로 민감한 주제에 대한 응답이 필터링되는 사례가 보고됐다. 기업 환경에서 기밀 정보를 처리하거나 민감한 주제를 다루는 경우에는 사용에 주의가 필요하다.
순수 기술적 업무(수학 문제, 코딩 도움, 오픈소스 프로젝트)에는 비용 효율이 높다. 민감한 비즈니스 데이터나 개인정보는 입력하지 않는 것을 권장한다.
관련 글
→ OpenAI o3·o4-mini 추론 모델 가이드
→ Ollama 로컬 AI 실행 가이드
→ Claude 3.5 vs GPT-4o 비교
자주 묻는 질문
Q. DeepSeek-R1은 정말 ChatGPT o1만큼 좋나?
수학·코딩 벤치마크에서 유사한 성능을 보이는 것은 사실이다. 단, 한국어 성능, 창작 능력, 안전 필터는 GPT 모델이 더 성숙하다는 평가가 많다.
Q. DeepSeek를 무료로 쓸 수 있나?
chat.deepseek.com에서 무료로 사용 가능하다. API는 저렴한 종량제로 제공된다. 오픈소스 모델은 Hugging Face에서 다운로드해 로컬 실행이 가능하다.
Q. 한국 기업이 DeepSeek를 업무에 사용해도 되나?
데이터가 중국 서버를 거치는 점을 고려해야 한다. 공공기관, 금융, 의료, 방산 분야는 보안 지침을 확인 후 사용해야 한다. 일반 기업도 민감한 정보는 입력을 피하고, 필요하면 로컬 버전을 내부 서버에 구축하는 방식이 안전하다.
이 글은 AI 도구의 도움을 받아 공개된 자료를 정리한 편집 콘텐츠입니다. 정확한 정보는 각 AI 서비스 공식 페이지에서 확인하세요.