-
Notifications
You must be signed in to change notification settings - Fork 6
Open
Description
Claude Code
- 요즘 가장 핫한 Vibe coding 툴
- CLI에서 동작
Qwen3
- 알리바바의 Qwen LLM 모델. Qwen 2.5가 굉장히 핫했었음.
- Dense 버전: 0.6B, 1.7B, 4B, 8B, 14B, 32B
- MoE 버전: 30B-a3B, 235B-a22B
- Qwen3-235B-A22B는 DeepSeek-R1, o1, o3-mini, Grok-3, Gemini-2.5-Pro와 같은 최신 모델들과 비슷하거나 더 좋은 결과를 기록했습니다.
- Qwen3-30B-A3B는 MoE 구조를 통해 적은 활성 파라미터 수(3B)로도 기존 32B 모델 수준의 성능을 넘었습니다.
- 작은 모델인 Qwen3-4B조차도 이전 Qwen2.5-72B-Instruct 모델과 비슷한 성능을 보였습니다.
- Thinking/Non-thinking 버전 스위칭 가능
Qwen3-Coder
- Qwen3-Coder-480B-A35B-Instruct, context length of 256K tokens natively and 1M tokens with extrapolation methods
- Agentic Coding, Agentic Browser-Use, and Agentic Tool-Use, comparable to Claude Sonnet 4.
demo1.mp4
EXAONE 4.0
- LG AI 연구원의 최신 모델
- 영어, 한국어, 스페인어 지원
- MCP, Agentic Coding 지원!!
Gemma-3n
- Google이 만든 On-device 용도로 만들어진 멀티모달 AI (오디오, 텍스트, 이미지)
- Android 핸드폰에서 action 가능함
- https://youtu.be/eJFJRyXEHZ0?si=iUFsN6hiXJh3AopA
Mathematical Foundation of Reinforcement Learning 강의/책
- https://github.com/MathFoundationRL/Book-Mathematical-Foundation-of-Reinforcement-Learning
- https://youtube.com/playlist?list=PLEhdbSEZZbDaFWPX4gehhwB9vJZJ1DNm8&si=0-Mak_uI2gzzgSaw

Reactions are currently unavailable
Metadata
Metadata
Assignees
Labels
No labels