چطور مدلها را سادهتر با انسان همراستا کنیم: از RLHF تا DPO
مدلهای زبان بزرگ (LLM) هر روز هوشمندتر میشوند،…
ارسال شده توسط مدیریت سایت
55 بازدید
PPO به زبان ساده: چگونه هوش مصنوعی یاد میگیرد مثل ما فکر کند؟
دنیای هوش مصنوعی و بهخصوص مدلهای زبانی بزرگ…
ارسال شده توسط مدیریت سایت
314 بازدید
۴۰ معیار برتر مدلهای زبان بزرگ (LLM) با پشتوانه تحقیقاتی و موارد استفاده آنها
با توسعه روزافزون هوش مصنوعی مولد (GenAI)، تمرکز…
ارسال شده توسط مدیریت سایت
100 بازدید
درک مقاله DeepSeek R1
فهرست مطالب مقدمه و خلاصه مقاله لحظه دستیابی…
ارسال شده توسط مدیریت سایت
135 بازدید
مقدمهای بر Reinforcement Learning و نقش آن در LLMها
در این پست قراره به Reinforcement Learning (RL)…
ارسال شده توسط مدیریت سایت
180 بازدید
فاینتیونینگ کارآمد از نظر پارامتر (PEFT) چیست؟
فاینتیونینگ کارآمد از نظر پارامتر (Parameter-efficient fine-tuning) روشی…
ارسال شده توسط مدیریت سایت
194 بازدید
فاینتیونینگ (Fine-tuning) چیست؟
فاینتیونینگ (Fine-tuning) چیست؟ در دنیای یادگیری ماشین، فاینتیونینگ…
ارسال شده توسط مدیریت سایت
355 بازدید
ارزیابی مدلهای زبانی بزرگ (LLM) و بنچمارکها
معیارهای ارزیابی مدلهای زبانی بزرگ مدلهای زبانی بزرگ…
ارسال شده توسط مدیریت سایت
286 بازدید
Foundation model یا مدل بنیادی
مدل پایه چیست؟ چه چیزی مدلهای پایه را…
ارسال شده توسط مدیریت سایت
1.16k بازدید
- 1
- 2