هاگینگ فیس (Hugging Face) چیست؟

هاگینگ فیس (Hugging-Face) یک پلتفرم و جامعه یادگیری ماشین (ML) و علم داده است که به کاربران در ساخت، استقرار و آموزش مدلهای یادگیری ماشین کمک میکند.
این پلتفرم زیرساخت لازم برای نمایش، اجرا و استقرار هوش مصنوعی (AI) در برنامههای زنده را فراهم میکند. کاربران همچنین میتوانند مدلها و مجموعه دادههایی را که دیگران بارگذاری کردهاند مرور کنند. هاگینگ فیس اغلب GitHub یادگیری ماشین نامیده میشود زیرا به توسعهدهندگان اجازه میدهد کار خود را به صورت آزاد به اشتراک بگذارند و آزمایش کنند.
هاگینگ فیس به خاطر کتابخانه پایتون Transformers خود شناخته شده است که فرآیند دانلود و آموزش مدلهای ML را ساده میکند. این کتابخانه روشی کارآمد به توسعهدهندگان میدهد تا یکی از مدلهای ML میزبانی شده در هاگینگ فیس را در جریان کار خود قرار دهند و پایپلاین ML ایجاد کنند.
این پلتفرم به دلیل ماهیت متنباز و ابزارهای استقرار آن مهم است. به کاربران اجازه میدهد منابع، مدلها و تحقیقات را به اشتراک بگذارند و زمان آموزش مدل، مصرف منابع و تأثیر زیستمحیطی توسعه هوش مصنوعی را کاهش دهند.
Hugging Face Inc. شرکت آمریکایی است که پلتفرم هاگینگ فیس را ایجاد کرده است. این شرکت در سال 2016 در نیویورک توسط کارآفرینان فرانسوی کلمنت دلانگ، جولین شاموند و توماس ولف تأسیس شد. این شرکت در ابتدا یک برنامه چتبات با همین نام برای نوجوانان توسعه داد. شرکت پس از متنباز کردن مدل پشت برنامه چتبات، تمرکز خود را به یک پلتفرم یادگیری ماشین تغییر داد.
در سال 2023، این شرکت همکاری با Amazon Web Services را اعلام کرد تا محصولات هاگینگ فیس را برای مشتریان AWS برای ساخت برنامههای سفارشی در دسترس قرار دهد. گوگل، آمازون و انویدیا تنها چند شرکتی هستند که تا زمان نگارش این متن در این استارتاپ سرمایهگذاری کردهاند.
چگونه از هاگینگ فیس استفاده میشود؟
هاگینگ فیس یک پلتفرم هوش مصنوعی و جامعه پشتیبان است. جامعه از هاگینگ فیس برای موارد زیر استفاده میکند:
- پیادهسازی مدلهای یادگیری ماشین: کاربران میتوانند مدلهای یادگیری ماشین را در پلتفرم بارگذاری کنند. مدلهایی برای انواع عملکردها وجود دارد، از جمله پردازش زبان طبیعی (NLP)، بینایی کامپیوتر، تولید تصویر و صوت.
- به اشتراکگذاری و کشف مدلهای یادگیری ماشین: از طریق Spaces و کتابخانه Transformers هاگینگ فیس، محققان و توسعهدهندگان میتوانند مدلها را با جامعه به اشتراک بگذارند. سایر کاربران میتوانند این مدلها را دانلود کنند و در برنامههای خود استفاده کنند.
- به اشتراکگذاری و کشف مجموعه دادهها: محققان و توسعهدهندگان میتوانند مجموعه دادهها را برای آموزش مدلهای یادگیری ماشین به اشتراک بگذارند یا مجموعه دادهها را برای آموزش مدلهای خود از طریق کتابخانه Datasets کشف کنند.
- فاینتیونینگ مدلها: کاربران میتوانند با استفاده از ابزارهای API هاگینگ فیس، مدلهای یادگیری عمیق را فاینتیون و آموزش دهند.
- میزبانی نسخههای نمایشی: هاگینگ فیس به کاربران اجازه میدهد دموهای تعاملی و داخل مرورگر از مدلهای یادگیری ماشین ایجاد کنند. این به کاربران اجازه میدهد مدلها را راحتتر نمایش دهند و آزمایش کنند.
- تحقیق: هاگینگ فیس در پروژههای تحقیقاتی مشارکتی، مانند کارگاه تحقیقاتی BigScience، با هدف پیشرفت در زمینه NLP مشارکت داشته است. این سایت همچنین صفحهای با فهرست منتخبی از مقالات تحقیقاتی را میزبانی میکند.
- توسعه برنامههای تجاری: Enterprise Hub هاگینگ فیس به کاربران تجاری اجازه میدهد با ترنسفورمرها، مجموعه دادهها و کتابخانههای متنباز در یک محیط میزبانی خصوصی کار کنند.
- ارزیابی مدلهای ML: هاگینگ فیس دسترسی به یک کتابخانه کد برای ارزیابی مدلهای یادگیری ماشین و مجموعه دادهها را فراهم میکند.
ویژگیهای هاگینگ فیس
Hugging Face Hub جایی است که میتوان برخی از ویژگیهای اصلی هاگینگ فیس را پیدا کرد، از جمله موارد زیر:
- مدلها: هاگینگ فیس کتابخانه بزرگی از مدلها را میزبانی میکند که کاربران میتوانند بر اساس نوع فیلتر کنند. در زمان نگارش این متن، بیش از 300,000 مدل در هاگینگ فیس وجود دارد. هاگینگ فیس همچنین برخی از مدلهای برتر متنباز ML را در پلتفرم میزبانی میکند. برخی از مدلهای موجود در جدول رتبهبندی در زمان نگارش این متن عبارتند از:
- stabilityai/stable-diffusion-xl-base-1.0
- WizardLM/WizardCoder-Python-34B-V1.0
- Phind/Phind-CodeLlama-34B-v2
- مجموعه دادهها: مجموعه دادهها به آموزش مدلها برای درک الگوها و روابط بین دادهها کمک میکنند – و ایجاد یک مجموعه داده خوب میتواند دشوار باشد. هاگینگ فیس دسترسی به مجموعه دادههای بارگذاری شده توسط جامعه را فراهم میکند که کاربران میتوانند به آنها دسترسی داشته باشند. برخی از نمونههای مجموعه دادهها در کتابخانه هاگینگ فیس عبارتند از:
- the_pile_books3، که شامل تمام دادههای Bibliotik به صورت متن ساده است. Bibliotik مخزنی از 197,000 کتاب است.
- wikipedia، که شامل دادههای ویکیپدیا است.
- Anthropic/hh-rlhf، که شامل دادههای ترجیح انسانی درباره مفید بودن و بیضرر بودن خروجیهای هوش مصنوعی است.
- imdb، که شامل مجموعه بزرگی از نقدهای فیلم است.
- Spaces: مدلهای یادگیری ماشین به تنهایی معمولاً برای پیادهسازی و استفاده نیاز به دانش فنی دارند. Spaces مدلها را در یک تجربه کاربرپسند بستهبندی میکند که به کاربران اجازه میدهد کار خود را نمایش دهند. هاگینگ فیس منابع محاسباتی لازم برای میزبانی نسخههای نمایشی را فراهم میکند. استفاده از Spaces نیازی به دانش فنی ندارد. برخی از نمونههای Hugging Face Spaces عبارتند از:
- تولیدکننده تصویر LoRA the Explorer: کاربران میتوانند تصاویر را در سبکهای مختلف بر اساس یک پرامپت تولید کنند.
- تولیدکننده موسیقی MusicGen: MusicGen به کاربران اجازه میدهد بر اساس توصیفی از خروجی مورد نظر یا نمونه صوتی، موسیقی تولید کنند.
- Image to Story: کاربران میتوانند تصویری را بارگذاری کنند و یک مدل زبانی بزرگ با استفاده از تولید متن، داستانی بر اساس آن مینویسد.
چگونه در هاگینگ فیس ثبتنام کنیم
ثبتنام در هاگینگ فیس به عنوان یک مشارکتکننده جامعه رایگان است. کاربران یک مخزن مبتنی بر Git دریافت میکنند که میتوانند در آن مدلها، مجموعه دادهها و Spaces را ذخیره کنند. پس از ایجاد حساب کاربری، کاربران میتوانند موارد زیر را انجام دهند:
- بررسی فید فعالیت
- دسترسی به Hugging Face Hub
- ایجاد سازمانها یا مخازن خصوصی
- کاوش در پروفایل خود و تنظیم تنظیمات
- شروع یک مدل، مجموعه داده یا Space جدید
- کشف آخرین روندها در جامعه هاگینگ فیس
- بررسی سازمانهایی که کاربر عضو آنها است و دسترسی به بخشهای خاص آنها
- دسترسی به منابع و مستندات مفید ML
هاگینگ فیس همچنین یک حساب کاربری حرفهای پولی ارائه میدهد که به کاربران دسترسی به ویژگیهای بیشتری میدهد، و یک حساب سازمانی با نرخ کمی بالاتر. حساب سازمانی ویژگیهای امنیتی و کنترل دسترسی سطح سازمانی و همچنین پشتیبانی مشتری اختصاصی را اضافه میکند.
مزایای استفاده از هاگینگ فیس
ماهیت متنباز و اشتراکی هاگینگ فیس چندین مزیت ارائه میدهد:
- دسترسیپذیری: هاگینگ فیس به کاربران کمک میکند از الزامات محاسباتی و مهارتی محدودکننده معمول در توسعه هوش مصنوعی عبور کنند. این واقعیت که هاگینگ فیس مدلهای از پیش آموزشدیده، اسکریپتهای فاینتیونینگ و APIهایی برای استقرار ارائه میدهد، فرآیند ایجاد LLMها را آسانتر میکند.
- یکپارچهسازی: هاگینگ فیس به کاربران کمک میکند چندین چارچوب ML را یکپارچه کنند. به عنوان مثال، کتابخانه Transformer با سایر چارچوبهای ML مانند PyTorch و TensorFlow یکپارچه میشود.
- نمونهسازی سریع: هاگینگ فیس نمونهسازی سریع و استقرار برنامههای NLP و ML را امکانپذیر میکند.
- جامعه: هاگینگ فیس دسترسی به یک جامعه گسترده، مدلهای بهروز شده مداوم، و مستندات و آموزشها را فراهم میکند.
- مقرون به صرفه: هاگینگ فیس راهحلهای مقرون به صرفه و مقیاسپذیر برای کسبوکارها ارائه میدهد. ساخت مدلهای بزرگ ML از ابتدا میتواند گران باشد، و استفاده از مدلهای میزبانی شده هاگینگ فیس در هزینه صرفهجویی میکند.
چالشها و ملاحظات
همچنین برخی ملاحظات و خطرات وجود دارد که باید در برابر مزایای هاگینگ فیس سنجیده شوند، از جمله موارد زیر:
- تعصب: مانند هر مدل یادگیری ماشین از پیش آموزشدیده، مدلهای موجود در هاگینگ فیس مستعد تعصب هستند، که ممکن است باعث شود مدل محتوای جنسیتگرا، نژادپرستانه یا همجنسهراسانه تولید کند.
- نیازهای محاسباتی: مدلهای بزرگتری در هاگینگ فیس وجود دارند که به قدرت محاسباتی بیشتری نسبت به مقدار پیشفرض ارائه شده توسط پلتفرم نیاز دارند، که کاربران باید آن را خریداری کنند. به عنوان مثال، Bloom یک مدل زبانی چندزبانه بزرگ است که میتواند اجرای آن بالقوه پرهزینه باشد.
- پشتیبانی: نسخههای رایگان و حرفهای پلتفرم پشتیبانی مشتری اختصاصی ندارند.
- جستجوی مدل: گاهی اوقات پیدا کردن مدلها یا کتابخانههای مناسب در میان تعداد زیادی که در پلتفرم میزبانی میشوند، دشوار است.
- امنیت: سازمانهایی که از هاگینگ فیس استفاده میکنند باید اطمینان حاصل کنند که پلتفرم اقدامات امنیتی ارائه میدهد که با نیازهای امنیت داده کسبوکار مطابقت دارد.
هاگینگ فیس و اکوسیستم گستردهتر هوش مصنوعی
هاگینگ فیس رویکردی مشارکتیتر به توسعه هوش مصنوعی در مقایسه با سایر استارتاپهای معاصر هوش مصنوعی تقویت میکند، که یک سرویس هوش مصنوعی توسعه میدهند و برای استفاده از آن هزینه میگیرند در حالی که جزئیات داخلی فناوری را به عنوان راز تجاری نگه میدارند.
با افزایش تعداد شرکتهایی که به دنبال توسعه مدلهای هوش مصنوعی خود هستند، هاگینگ فیس ابزارهایی را برای انجام این کار در اختیار توسعهدهندگان قرار میدهد. همانطور که ضربالمثل میگوید: در تب طلا، بیل بفروش. بسیاری از شرکتهای بزرگ قبلاً با هاگینگ فیس همکاری میکنند تا از پلتفرم توسعه آن بهرهمند شوند.
Hugging Face تلاش میکند دسترسی به هوش مصنوعی را برای افراد بیشتری فراهم کند، نه اینکه آن را در اختیار چند شرکت بزرگ محدود نگه دارد. برخی از کارمندان شرکتهای فعال در زمینه هوش مصنوعی مولد بر این باورند که هوش مصنوعی متنباز میتواند از رقبای متنبسته مانند OpenAI و گوگل پیشی بگیرد. در اوایل سال ۲۰۲۳، یکی از محققان گوگل در یک پیام افشاشده اعلام کرده بود که گوگل در این صنعت «برتری خاصی ندارد» و گفته بود: «در حالی که ما درگیر بحث و جدل بودیم، یک گروه سوم بیسروصدا در حال تصاحب بازار ما بود.»
While we’ve been squabbling, a third faction has been quietly eating our lunch
منبع: https://www.techtarget.com/whatis/definition/Hugging-Face
دیدگاهتان را بنویسید