GSM8K چیست؟ دیتاست مسائل ریاضی برای آموزش LLMها
خلاصه دیتاست دیتاست GSM8K (مخفف Grade School Math…
ارسال شده توسط مدیریت سایت
156 بازدید
درک مقاله DeepSeek R1
فهرست مطالب مقدمه و خلاصه مقاله لحظه دستیابی…
ارسال شده توسط مدیریت سایت
477 بازدید
مقدمهای بر Reinforcement Learning و نقش آن در LLMها
در این پست قراره به Reinforcement Learning (RL)…
ارسال شده توسط مدیریت سایت
473 بازدید