你好!我是李秀奇,可以叫我筱可(xiaoke),一名热爱编程的开发者。我专注于Python、JavaScript和Rust等语言,主要使用FastAPI和React框架。我非常擅长RAG系统开发、Agent系统开发、多模态Agent或RAG系统开发。我也会大语言模型(LLM)的微调和预训练(我曾复现过nanochat的LLM预训练流程),以及多模态模型的微调(如self-llm的Qwen3-VL-4B-Instruct LoRA 可视化微调案例 - LaTeXOCR)和embedding模型的微调(如代码检索场景微调实战,基于pytorch微调BGE-M3 embedding模型)。欢迎交流和合作!
| Repository | Description | Stars |
|---|---|---|
| data_analysis_agent | 数据分析智能体 (Data Analysis Agent):基于LLM的智能数据分析智能体 | 125 |
| financial_research_report | 金融多模态研究报告生成 | 109 |
| XiaokeAILabs | 筱可的工程实验仓库! | 103 |
| Smartlmager | 一个基于多模态向量模型及视觉多模态模型构建的图片搜索引擎&管理系统,实现精准的以文搜文,文搜图、以图搜图多种智能检索方式。An image search engine management system built upon multimodal vector models and visual multimodal models, implementing multiple intelligent search methods including precise text-to-text, text-to-image, and image-to-image retrieval. | 74 |
| spark_multi_rag | 科大讯飞多模态RAG图文问答挑战赛 | 55 |
| HearSight | HearSight智能音视频内容分析工具,支持多源视频(包括 URL和上传文件方式)导入能够从输入的视频源中提取上下文信息,从而提供更精准的 AI问答交互。平台基于视频语义单元进行智能切片,用户可通过问答方式灵活调整切片维度,快速定位所需内容同时,HearSight支持自动生成字幕与要点分段,并具备多语言翻译能力,可对输入视频进行语言转换帮助学生和职场人士高效捕捉视频核心信息,显著提升学习与工作效率。 | 27 |
| x-pdf2md | 本项目借助飞桨平台,构建起一套创新的多模型协同系统,实现 PDF 文件到 Markdown 文件的高效、精准转换。 | 27 |
| Text2Video | 输入内容主题或者内容,本项目可以生成对应的主题视频(超过1分钟的内容讲解视频) | 20 |
| gen_financial_report | 公司、行业、宏观多模态金融研报生成。 | 11 |
| remote_pdf_parse_serve | 基于mineru封装的远程pdf解析服务。 | 11 |


