هوش مصنوعی Med-Gemini گوگل GPT-4 را شکست داد!!

آیا هوش مصنوعی Med-Gemini گوگل می تواند مرزهای جدیدی در پزشکی ایجاد کند؟!

هوش مصنوعی گوگل

هوش مصنوعی Med-Gemini گوگل، که به عنوان یک "متخصص پزشکی هوش مصنوعی" شناخته می‌شود، می تواند دنیای پزشکی را متحول کند. این مدل هوش مصنوعی که توسط گروه تحقیقاتی Google Research و آزمایشگاه هوش مصنوعی DeepMind گوگل توسعه یافته است، در انجام برخی وظایف پزشکی از جمله تشخیص بیماری و درک پرونده‌های پزشکی پیچیده، عملکردی حتی بهتر از پزشکان از خود به نمایش گذاشت. محققان گوگل ادعا می‌کنند Med-Gemini فقط مخصوص حرفه پزشکی طراحی و آموزش داده شده است. با وجود این که هنوز مراحل تحقیقات و توسعه آن به پایان نرسیده اما در تشخیص های بالینی خیلی بهتر از چت بات GPT-4 شرکت OpenAI عمل می کند.

بنابراین می توان این طور استنباط کرد که Med-Gemini گوگل دانش عمیق‌تری در حوزه پزشکی نسبت به سایر هوش‌های مصنوعیِ ساخته‌شده مانند GPT-4 دارد. Med-Gemini می‌تواند اصطلاحات پزشکی پیچیده را درک کند، روابط بین علائم و بیماری‌ها را تشخیص دهد و حتی در برخی موارد، از پزشکان انسانی در تشخیص دقیق‌تر بیماری‌ها سبقت بگیرد. البته با توجه به این هنوز مراحل توسعه آن پایان نیافته باید منتظر آزمایش های بیشتر برای ارزیابی توانایی ها ی آن بود. چرا هوش مصنوعی پزشکی گوگل عملکرد بهتری نسبت به GPT-4 دارد؟ این موضوع به چند علت خیلی عجیب است:

دلیل اول: تخصص در برابر عمومیت


هر مدلی که روی یک سری داده های خاص یا محدودی مانند پزشکی، آموزش دیده باشد به احتمال زیاد درک و ظرافت بیشتری نسبت به یک مدل زبان بزرگ عمومی مانند 4GPT- خواهد داشت که با داده‌های مختلف آموزش دیده است. Med-Gemini روی یک مجموعه داده ای بزرگ پزشکی به نام «مرکز اطلاعات پزشکی مراقبت‌های ویژه» (یا MMIC-III) آموزش دیده است. این پایگاه داده اطلاعات سلامتی بیماران بستری در بخش مراقبت‌های ویژه را شامل می‌شود.

چت بات GPT-4 روی بستر اینترنت یا بخش قابل توجهی از آن آموزش دیده است. بنابراین، از این مدل می توان به عنوان یک ابزار عمومی استفاده کرد. به عنوان نمونه: اگر به اطلاعاتی در مورد نقاشی های ون گوگ نیاز داشته باشید، GPT-4 می‌تواند به شما کمک کند. اما Med-Gemini قادر به انجام این کار نیست. تمرکز دقیق Med-Gemini باعث می‌شود به کاربردی بودن اطلاعات آن اطمینان بیشتری داشته باشید.

دلیل دوم: به‌روزرسانی


آخرین اطلاعات 4GPT- فقط حداکثر تا سپتامبر 2021 را شامل می شود. این در حالی است که اطلاعات Med-Gemini تا ماه مه 2024 را در بر می گیرد. بنابراین، مدل گوگل نه تنها از نظر تکنیک‌های پزشکی، بلکه از نظر نوع داده‌هایی که می‌تواند پردازش کند و چگونگی پردازش آن‌ها، نسبت به مدل OpenAI به‌روزتر خواهد بود.

از زمان معرفی اولیه Gemini ، تمام مدل‌های آن قادر به پردازش متن، تصاویر، صدا و ویدیو بوده‌اند. این قابلیت، آن‌ها را از همان ابتدا چند قدم جلوتر از GPT-4 قرار داده است.
از طرف دیگر آموزش GPT-4 مدت‌ها پیش از سال ۲۰۲۳ متوقف شده است. سالی که در آن هوش مصنوعی تولیدکننده (Generative AI) به شدت مورد توجه قرار گرفت و در زمینه‌های مختلفی از خدمات مشتری گرفته تا تشخیص تومور در اسکن‌های سرطانی به کار گرفته شد. بنابراین، ادعاهای محققان گوگل تا حدی با عالم واقعیت انطباق دارد.

Med-Gemini یک مدل زبانی پیشرفته است که توانایی پردازش متن را با در نظر گرفتن بافت گسترده (Long-context processing) دارد. به عبارت دیگر، Med-Gemini می‌تواند معانی کلمات و جملات را در یک متن با در نظر گرفتن جملات و پاراگراف‌های اطراف آنها درک کند. این قابلیت به Med-Gemini اجازه می‌دهد تا وظایف مختلفی را با دقت و ظرافت بیشتری انجام دهد. محققان بر این باورند که این قابلیت «مرزهای جدیدی در عملکرد و امکانات کاربردی جدید که پیش از این غیرقابل تصور بود برای سیستم‌های هوش مصنوعی پزشکی ایجاد می‌کند.»

البته Med-Gemini زمانی که در دسترس پزشکان قرار نگیرد، نمی‌توان در مورد عملکرد واقعی آن اظهار نظر کرد. اما اگر قابلیت‌های پردازش بافت گسترده آن به همان اندازه که ادعا می‌شود چشمگیر باشد، Med-Gemini می‌تواند انقلابی در تشخیص و درمان بیماری‌ها ایجاد کند.


چاپ