مجموعه داده عظیم گیاهان PlantCLEF
دادههای ImageCLEF دو مسابقه بین المللی در حوزه بینایی کامپیوتر هستند که برای ارزیابی روشهای بینایی کامپیوتر و شناسایی الگوها و استخراج اطلاعات در تصاویر استفاده میشوند. در ادامه به توضیح این دیتاست و چالش و همچنین دیتای گیاهان آن میپردازیم.
ImageCLEF
مسابقه ImageCLEF از سال ۲۰۰۳ شروع شده و هدف آن تقویت الگوریتمهای تحلیل تصویر است. هدف اصلی ImageCLEF در پشتیبانی کاربران چند زبانه از جوامع جهانی برای دسترسی به اطلاعات تصویری در حال افزایش است. این پروژه با توسعه زیرساخت های لازم برای ارزیابی سیستم های بازیابی اطلاعات تصویری در دو محیط مونولینگوال، چند زبانه و بیزبانه، به پیشرفت در زمینه تجزیه و تحلیل رسانه های تصویری، فهرستبندی و بازیابی کمک میکند. هدف اصلی این پروژه، ایجاد منابع قابل استفاده برای این پایگاههای ارزیابی است. ImageCLEF در سال 2003 با هدف پشتیبانی از ارزیابی روشهای نازل وابسته به زبان برای برچسبگذاری خودکار تصاویر با مفاهیم، روشهای بازیابی اطلاعات چند حالته بر اساس ترکیب ویژگی های بصری و متنی و روشهای بازیابی تصویر چند زبانه شروع به کار کرد. در حال حاضر، پروژه ImageCLEF با همکاری گروههای تحقیقاتی و صنعتی جهانی در جوامع مختلف از جمله بازیابی اطلاعات (بصری)، بازیابی اطلاعات بینزبانی، دید کامپیوتری و شناخت الگو، علوم پزشکی، تعامل انسان-کامپیوتر و غیره، شرکت کرده است.
LifeCLEF
مسابقه LifeCLEF از سال 2014 شروع شده است و هدف آن تشخیص و شناسایی گونههای مختلف حیات وحش و گیاهان است. دادههای این مسابقه شامل تصاویری از حیوانات و گیاهان در طبیعت هستند که قابلیت شناسایی و دستهبندی برای مسابقه را دارند. این مسابقه با هدف حفظ تنوع زیستی و بهبود شناسایی جانوران و گیاهان برای افرادی که به دنبال مطالعه و محافظت از محیط زیست هستند، برگزار میشود.
PlantCLEF
PlantCLEF یک رقابت برای تشخیص انواع مختلف گیاهان است که با استفاده از تصاویر آنها انجام میشود. در این رقابت، شرکت کنندگان به وسیله الگوریتمهای هوش مصنوعی و یادگیری ژرف، تلاش میکنند تا گونههای مختلف گیاهی را با دقت بالا تشخیص دهند. PlantCLEF به منظور توسعه و بهبود سیستمهای خودکارشناسی گیاهی و بررسی جدیدترین پیشرفتهای علمی در این زمینه، برگزار میشود.
تخمین زده شده است که بیش از ۳۰۰٬۰۰۰ گونه گیاهی در سراسر جهان وجود دارند. افزایش دانش ما درباره این گونهها از اهمیت بالایی برای توسعه تمدن بشر (کشاورزی، ساخت و ساز، داروسازی و غیره) به خصوص در زمان بحران تنوع زیستی است. با این حال، بار شناسایی سیستماتیک گیاهان توسط کارشناسان انسان برای یکجمعآوری داده و دانش جدید، بسیار سنگین است. از آنجا که شناسایی خودکار در سالهای اخیر پیشرفت قابل توجهی داشته است، به خصوص در PlantCLEF، تکنیک های یادگیری ژرف به نظر میرسد که الان برای مقابله با مشکل شناسایی جهانی تنوع گیاهی، با وجود مشکلاتی که دادهها ممکن است دارا باشند (تعداد بسیار زیاد گونهها، کلاسهای نامتوازن بسیار قوی، شناساییهای جزئیا خطا دار، تکرارها، کیفیت بصری متغیر، تنوع محتوای بصری مانند عکسها یا برگهای هرباریوم و غیره)، به نظر میرسند. PlantCLEF2022 در این راستا یک قدم به جلو برای رفع مشکلات در این زمینه میباشد و با برخورداری از تعداد زیادی کلاس (۸۰ هزار گونه گیاهی)، یک مسئله دستهبندی چند تصویر را پیشنهاد میدهد.
وب سایت چالش و دیتاست
سایت زیر متعلف به این چالش است:
و جدیدترین قسمت مربوط به گونه های گیاهی در اینجا قابل مشاهده است:
https://www.imageclef.org/PlantCLEF2023
اما لینک دانلود دیتاست در همه سالها در سایت به راحتی قابل مشاهده نیست.
دانلود دیتاست بدون نیاز به تکمیل فرم
با یک سرچ ساده میشه به دایرکتوری لیست فایلهای دانلودی هر سال رسید که در این صورت میتوان مستقیماو بدون نیاز به درخواست و نامه نگاری دیتا را دانلود کرد:
دیدگاهتان را بنویسید