포스트

gpt보다 싼 qwen3.5 0.8b - 겁나 빠른, 하지만 틀리는 경량 모델

qwen3.5 0.8b

이 녀석의 강점은 정말 빠르고 가볍다는건데, CLI와 간단한 도구 호출이 매우 강점으로 보인다. 보통의 7b모델만 해도 M1칩 맥에서 돌리기 어려운 경우가 꽤 되기 때문에 편하게 사용하기는 어려운데 0.8b 면 10배 더 가벼운거니 그만큼 부담없는 결과 확인이 가능해 보인다.

ollama 설치 이후에 아래를 실행하면 콘솔에서 qwen3.5 를 써볼수 있다.

ollama run qwen3.5:0.8b

장점

  • 빠르다.
  • tool calling지원

단점

  • 중국산(사용 못하는 기업들도 있다)
  • 빠르지만 무한 루프를 도는 경우가 많다.

결과

총평

  • 영문 질의에서만 올바르게 나오고 한국어 질의에는 너무 많은 시간이 걸린다.
  • 기업에서는 차라리 돈을 내고 다른 모델을 쓰거나 GPU장비를 더 쓰는게 좋고, 개인들 특히 openclaw 처럼 토큰 잡아 먹는 괴물들을 상대하게 하는데 매우 강점이 있어보인다.
  • 모델 크키가 작아서 iphone에 포팅하는것도 괜찮아 보인다.

실행 시간 비교

그럼 한국어를 영어로 번역하는데 걸리는 시간은???

“안녕?” 의 처리 결과

미쳐 버린 “안녕”의 실행 화면

우주로 가는 한글과 영문의 find 스크립트 결과 차이

이 기사는 저작권자의 CC BY 4.0 라이센스를 따릅니다.