
딥시크 ai가 연일 난리입니다. 미국 나스닥 장을 박살을 내버릴 정도의 파급력이 있는 중국의 생성형 AI (LLM)의 서비스 입니다. 이게 기존의 chatGPT와는 어떻게 다른지, 뭐길래 이렇게 난리인지 지켜보시고, 앞으로 AI관련주들의 움직임이 어떻게 흘러갈지 함께 지켜보시는 시간 되면 좋을것 같습니다.
딥시크가 화제가 되는 이유는 크게 3가지 입니다.
- 중국발 대형 AI 모델 : 기존에는 OpenAI, Anthropic, Google등 서구권 기업이 주도 했었지만, 중국의 기술력이 글로벌 수준으로 올라왔음을 의미합니다. 하긴 중국에서 각종 규제없이 AI에 정책과 재정지원을 아끼지 않고 있어서 얼굴인식용 데이터는 가장 많이 보유하고 있고 가공하고 있어요. 길거리 CCTV데이터를 다 학습에 쓰고 있을 정도니깐요.
- 강력한 성능 : 공개된 벤치마크 결과에서 Llama2, Mistral등 기존 오픈소스 모델보다 뛰어난 성능을 보이고 있습니다. 그런데 단순 성능뿐 아니고, 알고리즘적으로 기존의 LLM보다 학습시 훨씬 더 적은 GPU를 사용해서 학습하도록 하여서 효율화를 이뤘다는 부분때문에 NVIDIA가 폭락했던것으로 이해하시면 됩니다.
- 비교적 개방적인 접근 : 일부 모델은 오픈소스로 공개해 개발자들이 활용할수 있도록 제공하고 있습니다. 또한 한국어에 대해서 인지하는 능력이 조금더 좋은것 같습니다. chatGPT에서 o3가 나오면 다시 성능은 우위는 openAI에서 가져갈것 같습니다.
1. 기존 AI 모델과 비교 (딥시크 vs GPT-4 vs Claude vs Llama 2 vs Mistral)
딥시크를 OpenAI의 GPT-4, Anthropic의 Claude 3, Meta의 Llama 2, Mistral 등의 기존 모델과 비교하면 다음과 같은 차이가 있습니다.
항목
|
딥시크(DeepSeek-V2)
|
GPT-4
|
Claude 3
|
Llama 2
|
Mistral
|
출시 기업
|
DeepSeek AI (중국)
|
OpenAI (미국)
|
Anthropic (미국)
|
Meta (미국)
|
Mistral AI (프랑스)
|
파라미터 크기
|
100B+
|
1.76T (GPT-4)
|
? (비공개, 추정 200B+)
|
65B (최대)
|
7B~8x22B (Mixture of Experts)
|
성능
|
GPT-4 수준에 근접 (벤치마크 우수)
|
현재 최상급
|
GPT-4와 경쟁하는 성능
|
준수한 성능
|
가성비 높은 경량 모델
|
오픈소스 여부
|
일부 공개
|
비공개
|
비공개
|
공개
|
공개
|
특징
|
중국어 특화 + 다국어 지원, 자체 추론 엔진
|
강력한 성능, 대중화된 API
|
장문의 문맥 유지 강점, 안전성 강화
|
무료 사용 가능, 페이스북 생태계 강점
|
경량화 모델로 빠른 성능
|
추가 설명
- Claude 3 (Anthropic)는 GPT-4와 경쟁할 정도로 뛰어난 성능을 보이며, 특히 긴 문맥 유지력과 안전성에서 강점을 가집니다. 제가 써볼때는 코딩하는 부분이 매우 성능이 좋다고 느낍니다. 성능을 놓고 비교해보면, GPT-4와 claude3는 스타일에 다소간 차이가 있지만, 초기코딩은 틀 잡는건 claude가 조금 나은것 같고, 디버깅 등은 GPT-4에서 최근 적용된 canvas가 더 쓰기 좋다고 느낍니다.
- DeepSeek은 Llama 2, Mistral보다 강력하지만 GPT-4, Claude 3와 동급인지 여부는 논쟁의 여지가 있습니다. 직접써볼때 한국에대한 이해도 부분에 있어서는 조금더 뛰어난것으로 느껴지긴 합니다.
- OpenAI와 Anthropic은 여전히 성능 최상위권을 유지하며, 특히 Claude 3는 대화형 AI 및 컨텍스트 처리 면에서 가장 자연스럽다는 평가를 받습니다. DeepSeek는 저렴한 비용으로 서버를 운용하고 있으며, 현재 B2C는 무료로 제공중이고, 오픈소스라서 모델을 다운로드해서 수정할수도 있습니다.
2. 나의 개인정보는 안전할까?
개인정보 보호 및 데이터 수집 방식 비교
항목
|
딥시크(DeepSeek)
|
GPT-4
|
Claude 3
|
Llama 2
|
Mistral
|
데이터 수집 범위
|
웹 크롤링 기반, 중국 내 데이터 활용 가능
|
웹 데이터 + 유료 데이터셋
|
웹 데이터 + 강화된 검증 데이터
|
오픈소스 데이터 기반
|
오픈소스 데이터 기반
|
개인정보 보호 정책
|
상대적으로 불명확
|
GDPR 준수, 개인정보 보호
|
개인정보 보호 및 AI 안전성 강화
|
오픈소스 모델로 사용자 통제 가능
|
오픈소스 모델로 사용자 통제 가능
|
데이터 규제 영향
|
중국 정부 규제 영향
|
미국, EU 규제 준수
|
미국, EU 규제 준수, 안전성 우선
|
미국, EU 규제 준수
|
유럽 중심 규제 준수
|
AI 안전성
|
보통 수준
|
높은 수준
|
가장 높은 수준
|
보통 수준
|
보통 수준
|
원문은 링크를 확인해보시기를 추천드립니다.
https://chat.deepseek.com/downloads/DeepSeek%20Privacy%20Policy.html
아래 내용으로 요약해봤는데 요약해도 기네요 ㅎㅎ 황당한 부분은 탈퇴를 해도 삭제하지 않는다는 부분에 있습니다.
🚨 사용자들이 놓칠 수 있는 주요 리스크
✅ 데이터 저장 위치: 모든 개인정보는 중국 내 서버에 저장됨 → 중국 법률 적용을 받음
✅ 사용자 입력 데이터 활용 가능성: AI 모델 개선을 위한 학습 데이터로 사용될 수 있음
✅ 정부 요청 시 정보 제공 가능: 중국 정부의 데이터 요청을 따를 가능성 있음
✅ 광고 및 분석 목적의 데이터 공유: 사용자의 온라인 활동이 광고 및 타사 분석 업체에 전달될 수 있음
✅ 계정 삭제 후에도 일부 데이터 보존 가능: 약관 위반 등 특정 사유로 일부 데이터는 유지될 수 있음
결론
- 개인정보 보호에 민감한 사용자는 신중하게 이용할 필요 있음
- 중국 내 데이터 저장 및 정부 요청 시 제공 가능성이 있다는 점이 핵심 리스크
- 데이터가 AI 학습에 활용될 가능성이 있으며, 광고 및 분석을 위한 공유도 이루어짐
- 기본적으로 GDPR 수준의 개인정보 보호보다는 상대적으로 낮은 수준의 규제 적용 예상
🚨 DeepSeek을 사용할 때는 데이터 처리 방식과 보안 이슈를 충분히 고려해야 함!
조금 더 자세히 알고 싶으신 분은 아래 내용을 참고해주세요.
DeepSeek 개인정보 처리방침 요약 (중요 사항)
1. 데이터 수집 및 저장 방식
- 사용자가 제공한 데이터 수집
- 계정 생성 시: 이메일, 전화번호, 생년월일(해당 시), 비밀번호
- 사용자의 입력 데이터: 채팅 내용, 음성 입력, 업로드된 파일, 대화 기록, 피드백
- 고객 문의 시: 신원 증명 정보, 서비스 이용 관련 문의 내용
- 자동으로 수집되는 데이터
- 디바이스 정보: 운영체제, 키보드 입력 패턴, IP 주소, 시스템 언어
- 활동 정보: 서비스 사용 내역, 기능 사용 기록
- 쿠키 및 트래킹 기술: 웹사이트 및 서비스 이용 방식 분석
- 제3자로부터 수집하는 데이터
- 타사 로그인 정보: Google, Apple 등 계정을 사용하여 로그인할 경우 해당 서비스에서 일부 정보 수집
- 광고 및 분석 파트너: 타 사이트에서의 활동 데이터, 광고 클릭 내역, 구매 내역 등의 정보 공유
2. 개인정보 이용 목적
- 서비스 운영 및 사용자 지원
- 약관 및 정책 준수를 위한 모니터링 (입력된 채팅 내용 및 대화 내역 검토 가능)
- 보안 및 부정 사용 방지 (스팸, 사기 탐지 등)
- 서비스 품질 향상 및 AI 모델 개선을 위한 학습 데이터로 활용 가능
3. 개인정보 공유 대상
- 서비스 제공업체: 데이터 저장, 콘텐츠 전달, 보안, 기술 지원 등
- 비즈니스 파트너: 광고 및 분석 업체 (맞춤형 광고 제공 가능)
- 자회사 및 계열사: DeepSeek의 기업 그룹 내 데이터 공유
- 법적 요구 시 제공 가능
- 정부 기관, 법 집행 기관 요청 시 개인정보 제공 가능
- 저작권 침해, 법적 분쟁, 서비스 약관 위반 조사 목적
- 긴급 상황(생명 또는 안전 위협) 시 사용자 정보 공유 가능
4. 개인정보 저장 위치 및 보관 기간
- 데이터 저장 위치: 중국 내 서버에서 저장 및 처리
- 데이터 보관 기간
- 계정이 존재하는 동안 데이터 유지
- 계정 삭제 시 대부분의 데이터 삭제되지만, 약관 위반 등의 사유로 일부 데이터는 보관 가능
5. 사용자 권리 및 선택권
- 개인 정보 열람, 수정, 삭제 요청 가능
- 채팅 기록 삭제 가능 (설정에서 관리 가능)
- 계정 삭제 시 모든 데이터 삭제되며 복구 불가능
- 쿠키 및 트래킹 데이터 거부 가능 (브라우저 설정에서 제어)
6. 보안 및 데이터 보호
- 업계 표준 보안 조치 적용 (기술적·관리적 보호 조치)
- 이메일 및 인터넷 통신의 완전한 보안은 보장할 수 없음
- 개인정보 보호 설정을 우회하려는 제3자 접근에 대한 책임 없음
7. 민감한 개인정보 및 아동 보호 정책
- 18세 미만 사용자는 부모 또는 보호자 동의 필요
- 14세 미만 아동의 데이터는 수집하지 않으며, 발견 시 즉시 삭제 조치