Skip to content

2025.07.23 - #43 - Claude code, Qwen3-Coder, Gemma3n, EXAONE 4.0, RL math, OpenAI에서 일한 경험 #45

@changh95

Description

@changh95

Claude Code

  • 요즘 가장 핫한 Vibe coding 툴
  • CLI에서 동작
Image Image

Qwen3

  • 알리바바의 Qwen LLM 모델. Qwen 2.5가 굉장히 핫했었음.
  • Dense 버전: 0.6B, 1.7B, 4B, 8B, 14B, 32B
  • MoE 버전: 30B-a3B, 235B-a22B
  • Qwen3-235B-A22B는 DeepSeek-R1, o1, o3-mini, Grok-3, Gemini-2.5-Pro와 같은 최신 모델들과 비슷하거나 더 좋은 결과를 기록했습니다.
  • Qwen3-30B-A3B는 MoE 구조를 통해 적은 활성 파라미터 수(3B)로도 기존 32B 모델 수준의 성능을 넘었습니다.
  • 작은 모델인 Qwen3-4B조차도 이전 Qwen2.5-72B-Instruct 모델과 비슷한 성능을 보였습니다.
  • Thinking/Non-thinking 버전 스위칭 가능
Image Image

Qwen3-Coder

  • Qwen3-Coder-480B-A35B-Instruct, context length of 256K tokens natively and 1M tokens with extrapolation methods
  • Agentic Coding, Agentic Browser-Use, and Agentic Tool-Use, comparable to Claude Sonnet 4.
Image Image
demo1.mp4

EXAONE 4.0

  • LG AI 연구원의 최신 모델
  • 영어, 한국어, 스페인어 지원
  • MCP, Agentic Coding 지원!!
Image

Gemma-3n

Image Image

Mathematical Foundation of Reinforcement Learning 강의/책

Image

Metadata

Metadata

Labels

No labels
No labels

Projects

No projects

Milestone

No milestone

Relationships

None yet

Development

No branches or pull requests

Issue actions