目前共计 80 个标签
3D并行 Agent Bert CNN CV ChatGPT DPO DeepResearch DeepSearch DeepSeek GQA Gemma2 GopherCite InstructGPT KV Cache LLM LaMDA Llama MLA Meta MoE NLP Qwen RL RM RS Reasoning RoPE SFT Sparrow UI WebGPT agent attention batchnorm layernorm normalization positional encoding post-norm post-training pre-norm pretrain prompt压缩 reasoning压缩 routing scaling law sliding window attention sparse attention transformer 代码能力 偏好对齐 分布式 创业 参数复用 复读机 多模态 学习率 对齐 小米 强化学习 微调 微软 技术报告 推理加速 数据 数据合成 无监督学习 无限大 智能助手 模型融合 涌现能力 窗口外推 端侧模型 算法题 苹果 蒸馏 重复生成 长上下文 预训练 高效训练