وبلاگ
همکاری مرسدسبنز و گوگل برای ارتقای هوش مصنوعی در خودرو
همکاری مرسدسبنز و گوگل برای ارتقای هوش مصنوعی در خودرو: نقش Gemini در سیستمهای مکالمه و ناوبری
در عصر تحول دیجیتال و هوش مصنوعی، خودروها دیگر فقط وسیله نقلیه نیستند؛ بلکه پلتفرم هوشمند متحرک به شمار میآیند. یکی از نوآوریهای برجسته در این زمینه، همکاری شرکتهای خودروسازی لوکس با شرکتهای بزرگ فناوری است. مرسدسبنز به تازگی همکاری خود را با گوگل به سطحی ارتقاء داده است که هوش مصنوعی مولد Gemini نقش کلیدی در سیستم مکالمه و ناوبری خودروهای آینده خواهد داشت. این مقاله به بررسی ابعاد مختلف این همکاری، فرصتها، چالشها و تأثیرات آن بر صنعت خودرو میپردازد.
Gemini چیست؟ معماری و قابلیتها
- «جمینی (Gemini)» مدل زبانی بزرگ (LLM) چندرسانهای گوگل است که میتواند ورودیهای متنی، صوتی، تصویری و ترکیبی را پردازش کند.
- این مدل از معماری نسل جدید بهره میبرد، با قابلیت درک زمینه (context) بهتر، توانایی مکالمه چندگانه، پاسخدهی بهتر و حافظهی مکالمهای.
- گوگل در قسمت «Automotive AI Agent» پلتفرم گوگل کلود، از Gemini استفاده کرده و آن را بهینهسازیهایی مخصوص صنعت خودرو داده است تا مکالمه و ناوبری هوشمند در خودروها ممکن شود.
همکاری مرسدسبنز و گوگل: انگیزهها و پیشینه
- مرسدسبنز و گوگل (بهخصوص قسمت گوگل کلود) در ژانویه ۲۰۲۵ اعلام کردند که قصد دارند همکاری خود را گسترش دهند تا قابلیتهای جستجو مکالمهای (Conversational Search) را به سیستم MBUX مرسدس بیاورند.
- بخش مهم این همکاری، بهرهگیری از «Automotive AI Agent» گوگل است، که بر پایه Gemini در محیط Vertex AI ساخته شده است.
- هدف این است که سیستم مکالمه مرسدس بتواند بهتر به سوالات راننده پاسخ دهد، مکالمههای چند مرحلهای را حفظ کند و خاطره مکالمات قبلی را در طول مسیر نگه دارد، تا تجربه رانندگی طبیعیتر و هوشمندتر شود.
- این همکاری شامل دسترسی به پایگاه داده گوگل مپس (Google Maps Platform) است، با دادههای مکانی غنی شامل بیش از ۲۵۰ میلیون مکان در سراسر جهان و بهروزرسانیهای مداوم.
- مرسدس یکی از اولین خودروسازانی است که از این نوع فناوری مکالمه هوشمند پیشرفته در ناوبری خودرو استفاده خواهد کرد، از جمله در سری جدید .
نقش Gemini و “Automotive AI Agent” در سیستم MBUX
- سیستم MBUX Virtual Assistant مرسدس وظیفه تعامل صوتی با راننده را بر عهده دارد. با ورود Gemini و “Automotive AI Agent”، این دستیار توانایی بیشتری در پاسخدهی طبیعی و پیچیده کسب میکند.
- «Agent خودرویی» گوگل به MBUX امکان میدهد تا از دادههای گوگل مپس برای پاسخ به سوالاتی مانند “نزدیکترین رستوران لوکس کجاست؟” استفاده کند و در طول مکالمه بتواند سؤال پیدرپی را پاسخ دهد (“نظر کاربران چگونه است؟”)
- یکی از امکانات مهم، توانایی مکالمه چند مرحلهای (multi-turn dialogue) و حفظ حافظه مکالمات است، یعنی اگر راننده در ابتدا درخواست کرد “به نزدیکترین کافیشاپ ببرم” و سپس سوال کند “کیفیت قهوهش چطوره؟”، سیستم قادر باشد ادامه بدهد و به سؤال دوم هم پاسخ دهد.
- نسخه جدید MBUX که در مدلهایی مانند CLA عرضه خواهد شد، دارای چهرههای شخصیتی (personality traits) از جمله “طبیعی”، “پیشبینیگر”، “شخصی (Personal)” و “دلسوز (Empathetic)” است تا تعامل انسانیتر به نظر برسد.
- همچنین ادغام عمیق با ناوبری و دادههای زنده گوگل مپس به راننده امکان میدهد از اطلاعات ترافیک زنده، پیشنهاد مسیر جایگزین، وضعیت توقفگاهها و اطلاعات رستورانها استفاده کند.
قابلیتها و مزایای هوش مکالمهای در خودرو
- تعامل طبیعی با زبان گفتاری عادی
راننده نیازی به حفظ دستورات خاص ندارد؛ میتواند به زبان عادی با خودرو صحبت کند. - پاسخ کامل و پیچیده به سوالات
نه فقط دستور ساده، بلکه سؤالهای پیچیده مانند «کافهای نزدیک مسیرم معرفی کن که رتبه بالا داشته باشد» پاسخ داده میشود. - حافظه مکالمات و پیگیری درخواستها
سیستم میتواند در طول مسیر مکالمات قبلی را درک کند و ارتباط دهید (مثلاً «همان رستورانی که گفتی بازه؟») - پیشنهادات هوشمند و شخصیسازی شده
بر اساس عادات راننده، سیستم میتواند پیشنهاد مسیر، سرگرمی، رستوران یا توقفگاه ارائه دهد. - کاهش حواسپرتی راننده
چون اکثر کارها با گفتار انجام میشوند، نیاز به لمس نمایشگر یا جستجوی دستی کم میشود. - بهروزرسانیهای هوایی (OTA)
سیستم میتواند بهمرور با بهروزرسانیهای نرمافزاری ارتقاء یابد و هوشمندی آن بیشتر شود.
چالشها، محدودیتها و ملاحظات امنیتی
- حریم خصوصی و دادهها
ذخیره مکالمهها و دادههای شخصی نیازمند سیاستهای محکم حفظ حریم خصوصی و رمزنگاری است. - پایداری و پاسخدهی در شرایط ضعیف شبکه
وقتی اتصال اینترنت ضعیف باشد، عملکرد بعضی ویژگیها ممکن است محدود شود. - اشتباهات و تفسیر اشتباه دستورات
مثل هر سیستم هوشمند دیگری، احتمال خطا وجود دارد، مخصوصاً در شرایط نویز زیاد یا لهجههای گوناگون. - مسائل قانونی و مسئولیتپذیری
اگر به دلیل فرمان اشتباه سیستم حادثهای رخ دهد، مسئولیت آن به کدام سمت برمیگردد؟ - سازگاری با خودروهای قدیمیتر
برخی مدلهای قبلی ممکن است امکان پذیری عملکرد کامل این سیستم را نداشته باشند.
مقایسه مرسدس با سایر همکاریها (مثلاً ولوو)
نکته قابل توجه: ولوو (Volvo) یکی از برندهای اعلامشده است که قصد دارد Gemini را در سیستم داخلی خود نصب کند و گوگل مپس + Gemini جایگزین Google Assistant فعلی شود.
اما تفاوت مرسدس در این است که مرسدس از همان ابتدا قصد دارد سیستم مکالمه هوشمند را در ناوبری خود ادغام کند و تجربهی شخصیتری ارائه دهد.
در گزارشی آمده است که گوگل و مرسدس در نسل جدید CLA نشان دادهاند چگونه Gemini داخل خودروی واقعی کار میکند و تعامل زنده انجام میدهند.
چشمانداز آینده
- انتظار میرود در سالهای آینده، بسیاری از مدلهای مرسدس به سیستم مکالمه مبتنی بر Gemini مجهز شوند.
- این فناوری ممکن است به سطوح بالاتری از رانندگی خودکار و ارتباط خودرو با زیرساخت شهری هم برسد.
- ادغام با خانه هوشمند، تقویم، برنامههای کاربری کاربر و اکوسیستم دیجیتال شخص راننده ممکن میشود.
- توسعه تواناییهای چندرسانهای (مثلاً تحلیل تصویر، تشخیص صحنه) میتواند به دستیار خودرو اجازه دهد محیط را بهتر درک کند و پیشنهادهای مرتبط بدهد.