내 PC에서 AI 실행하기: Ollama로 로컬 LLM 완전 정복

ChatGPT 같은 클라우드 AI는 강력하지만, 개인정보 보호와 비용 문제가 걸린다. 이제는 내 컴퓨터에서 직접 AI 모델을 실행할 수 있는 시대가 됐다. Ollama를 이용한 로컬 LLM 구축 방법을 소개한다.

Ollama란?

Ollama는 Llama, Mistral, Gemma, Qwen 등 오픈소스 대형 언어 모델을 로컬에서 쉽게 실행할 수 있게 해주는 도구다. Docker처럼 간단한 명령어로 AI 모델을 다운받고 실행할 수 있다.

1. Ollama 다운로드: ollama.ai에서 운영체제에 맞는 설치 파일을 다운로드한다.

2. 모델 설치: 터미널에서 다음 명령어를 실행한다:

ollama pull llama3.2
ollama pull mistral
ollama pull gemma2

3. 실행: 설치 후 바로 대화 시작:

ollama run llama3.2

터미널 대신 브라우저 인터페이스로 사용하고 싶다면 Open WebUI를 설치한다:

docker run -d -p 3000:8080 --add-host=host.docker.internal:host-gateway ghcr.io/open-webui/open-webui:main

설치 후 localhost:3000에 접속하면 ChatGPT와 비슷한 UI로 로컬 AI를 사용할 수 있다.

7B 파라미터 모델 기준: RAM 8GB 이상, 저장공간 5GB 이상. GPU가 없어도 CPU만으로 실행 가능하지만 속도가 느릴 수 있다. NVIDIA GPU가 있다면 훨씬 빠른 응답을 경험할 수 있다.

#No Tag