Inside the Tech یک سری وبلاگ است که ما را همراهی می کند پادکست Tech Talks. در قسمت 19 پادکست، بین المللیدیوید بازوکی، مدیرعامل Roblox، با ژن فانگ، مدیر ارشد محصول، در مورد استراتژی بینالمللی Roblox و چالشهای فنی که ما برای اطمینان از تجربه محلی دهها میلیون نفر در سراسر جهان حل میکنیم، صحبت کرد. در این نسخه Inside the Tech، با مدیر مهندسی Ravali Kandur صحبت کردیم تا درباره یکی از آن چالشهای فنی، جستجوی چند زبانه و معنایی، و اینکه چگونه کار تیم Growth به کاربران Roblox در سراسر جهان کمک میکند تا برای جستجو و یافتن سریع آنها بیشتر بیاموزیم. هر چیزی که آنها می خواهند در پلت فرم ما.
بزرگترین چالش فنی تیم شما چیست؟
تا حدود یک سال پیش، جستجوی Roblox از یک سیستم واژگانی برای تطبیق نتایج با جستجوهای کاربران استفاده می کرد، به این معنی که فقط بر روی تطبیق متن تمرکز می کرد. اما رفتارهای جستجو به سرعت در حال تغییر است و این رویکرد دیگر برای ارائه محتوای مرتبط به کاربران کافی نیست. در عین حال، برخی از کاربران Roblox ممکن است از املای نادرست در جستارهای خود استفاده کنند. بنابراین، ما باید بتوانیم نتایجی را پیشنهاد کنیم که با آنچه آنها به دنبال آن هستند مطابقت داشته باشد، که به معنای درک مقصود آنهاست.
یکی دیگر از مشکلات عمده در جستجو، کمبود داده های آموزشی در بین زبان ها است. قبل از جستجوی معنایی، اولین قدم ما استفاده از ترجمه ماشینی در سیستم Roblox بود. ترجمه ها را نمایه کردیم و سپس متن را مطابقت دادیم. اما این برای همیشه نشان دادن محتوای مرتبط به کاربران کافی نیست. بنابراین، ما یک تکنیک پیشرفتهتر ML به نام مدل دانشآموز-معلم را اتخاذ کردهایم: معلم از بزرگترین منبع زمینه ما برای هر سناریوی خاصی یاد میگیرد.
انگلیسی پرکاربردترین زبان در Roblox است، به همین دلیل است که ما تا آنجا که می توانیم روابط معنایی را در انگلیسی یاد می گیریم - مدل معلم - و سپس با گسترش آن به زبان های دیگر، آن را به مدل دانش آموز تقطیر می کنیم. این به ما کمک میکند تا آن مشکل را حل کنیم، حتی اگر دادههای زیادی در زبانهای خاصی نداریم. این امر منجر به افزایش 15 درصدی نمایشنامههای منشا جستجو در ژاپن شده است.
ما اخیراً برای پشتیبانی بهتر از سؤالات کاتالوگمان مانند "đua xe (مسابقه)" کار کرده ایم. اما کاربران اغلب درخواستهای طولانی و آزاد را ارسال میکنند، مانند: «هی، یادم میآید بازیای را انجام میدادم که در آن یک اژدها و یک دختر با آن مبارزه میکردند. آیا می توانید به من کمک کنید تا آن را پیدا کنم؟» این چالشهای فنی بیشتری را به همراه دارد و ما به بهبود سیستمهای خود در این مسیر ادامه میدهیم.
برخی از رویکردهای نوآورانه برای ترکیب زمینه بیشتر و جستجوی معنایی بیشتر چیست؟
ما یک سیستم جستجوی ترکیبی ساختهایم که جستجوی واژگانی را میگیرد و آن را با تکنیکها و مدلهای ML ترکیب میکند که از جستجوی معنایی و درک هدف یک پرس و جو استفاده میکند. ما به طور مداوم در حال توسعه سیستم های خود برای ایجاد درک زمینه، رسیدگی به پرس و جوهای پیچیده و بازگرداندن محتوای مرتبط هستیم.
جادوی جستجوی معنایی در جاسازیها است، که نمایشهای غنی از سیگنالهای مختلفی است که ما از سراسر Roblox دریافت میکنیم. به عنوان مثال، ما سیگنال هایی مانند اطلاعات جمعیتی کاربر، پرس و جوی کاربر، مدت زمان آن یا جنبه های منحصر به فرد آن را ترکیب می کنیم.
ما همچنین سیگنالهای محتوا را بررسی میکنیم، مانند تجربیات، آیتمهای آواتار، و تعامل - این بازی چند بار بازی شده است یا چند کاربر و از چند کشور بوده است؟ همچنین مواردی مانند کسب درآمد و حفظ، و همچنین ابرداده هایی مانند عنوان، توضیحات یا سازنده یک تجربه وجود دارد. ما همه اینها را از طریق یک معماری مبتنی بر ترانسفورماتور مبتنی بر BERT قرار می دهیم و از a استفاده می کنیم چند لایه پرسپترون در پایان برای ایجاد تعبیههایی که منبع حقیقت ما میشوند.
نوآوری دیگر سیستم جستجوی شباهت داخلی ما است. هنگامی که شخصی درخواست جستجو می کند، جاسازی های مرتبط را بازیابی می کنیم و آنها را رتبه بندی می کنیم تا مطمئن شویم با آنچه کاربر به دنبال آن است مرتبط هستند. و سپس نتایج را به کاربران برمی گردانیم.
برخی از نکات کلیدی که از انجام این کار فنی آموخته اید چیست؟
هر زبانی چالش منحصر به فرد خود را ارائه می دهد. و به خصوص با جستجو، باید بفهمیم که کاربران در نقاط مختلف جهان به دنبال چه چیزی هستند تا بتوانیم مرتبط ترین نتایج را به آنها نشان دهیم. ما باید عناصر مختلف زبان را درک کنیم. به عنوان مثال، ترانسفورماتورهای از پیش آموزش دیده برای درک لهجه های چندگانه ژاپنی ضروری بوده اند.
ثانیاً، الگوهای پرس و جوی جستجو تا حد زیادی تغییر کرده اند و ما باید به طور مداوم پشته فناوری خود را تکامل دهیم تا به آن ادامه دهیم. در عین حال، ما باید به کاربران خود در مورد آنچه در پلتفرم ما امکان پذیر است اطلاع دهیم، زیرا ممکن است متوجه آن نباشند. به عنوان مثال، میتوانیم به کاربران خود بگوییم که جستجو میتواند مواردی مانند جستارهای سبک آزاد (مانند بازیهای مسابقهای یا بازیهای محبوب غذایی) را پشتیبانی کند و میفهمد که مردم به دنبال چه چیزی هستند و میتواند نتایج مناسبی را ارائه دهد.
تیم شما با کدام ارزش Roblox هماهنگی بیشتری دارد؟
داشتن دیدگاه طولانی هسته اصلی تیم ما است و این یکی از دلایلی است که من عاشق کار در Roblox هستم.
یکی از نمونههای تیم من، پشته فناوری ما است که از سیستمهای جستجوی مبتنی بر ML و NLP تشکیل شده است - جستجوی معنایی، تکمیل خودکار و تصحیح املا با استفاده از مدلهای بزرگ از قبل آموزش دیده.
ما این را با در نظر گرفتن قابلیت استفاده مجدد در انواع مختلف جستجوهای انجام شده توسط ده ها میلیون کاربر فعال روزانه خود ساخته ایم. این بدان معناست که ما میتوانیم نوع متفاوتی از دادهها (به عنوان مثال، آیتمهای آواتار به جای تجربیات) را وصل کنیم و باید با تغییرات بسیار کم کار کند.
ما جستجوی معنایی را برای تجربیات ترکیب کردهایم، و آن را با سایر عمودیها مانند Marketplace به اشتراک گذاشتهایم، و آنها فقط توانستهاند به معماری موجود بپرند. این کاملاً plug-and-play نیست، اما با برخی تنظیمات دقیق، میتوانیم آن را در موارد استفاده مختلف تطبیق دهیم.
چه چیزی شما را بیشتر در مورد جایی که Roblox و تیم شما هدایت می کند هیجان زده می کند؟
جستجو تنها سطحی است که در آن کاربران قصد صریح خود را بیان می کنند. و این بدان معناست که ضروری است که بفهمیم آنها چه می خواهند و مرتبط ترین نتایج را به آنها بدهیم. بنابراین برای من واقعاً هیجان انگیز است که روی درک این هدف و آموزش کاربرانمان در مورد آنچه ممکن است، حتی گاهی قبل از اینکه کاربر متوجه شود، کار کنم.
یک کاربر در هر کشوری میتواند چیزی بپرسد و ما میتوانیم دقیقاً همان چیزی را که میخواهد به او بدهیم و این برای او بسیار مرتبط است. این باعث ایجاد اعتماد می شود که به نوبه خود حفظ را بهبود می بخشد. برای من هیجان انگیز است که چالش بهبود جستجو را برای ایجاد اعتماد و کمک به Roblox در دستیابی به هدف خود که داشتن یک میلیارد کاربر است، انجام دهم.
- محتوای مبتنی بر SEO و توزیع روابط عمومی. امروز تقویت شوید.
- PlatoData.Network Vertical Generative Ai. به خودت قدرت بده دسترسی به اینجا.
- PlatoAiStream. هوش وب 3 دانش تقویت شده دسترسی به اینجا.
- PlatoESG. کربن ، CleanTech، انرژی، محیط، خورشیدی، مدیریت پسماند دسترسی به اینجا.
- PlatoHealth. هوش بیوتکنولوژی و آزمایشات بالینی. دسترسی به اینجا.
- منبع: https://blog.roblox.com/2023/11/inside-the-tech-solving-for-multilingual-semantic-search/
- 19
- a
- قادر
- درباره ما
- رسیدن
- در میان
- فعال
- وفق دادن
- به تصویب رسید
- پیش
- تراز
- معرفی
- در امتداد
- همچنین
- همیشه
- an
- و
- هر
- روش
- رویکردها
- مناسب
- معماری
- هستند
- دور و بر
- as
- پرسیدن
- جنبه
- At
- تکمیل خودکار
- نماد
- BE
- شدن
- بوده
- قبل از
- رفتار
- بهتر
- بزرگترین
- بیلیون
- بیت
- بلاگ
- ساختن
- می سازد
- ساخته
- اما
- by
- نام
- CAN
- موارد
- کاتالوگ
- مدیر عامل شرکت
- معین
- به چالش
- چالش ها
- تغییرات
- متغیر
- ترکیب
- پیچیده
- تشکیل شده است
- محتوا
- زمینه
- مداوم
- به طور مداوم
- هسته
- میتوانست
- کشور
- کشور
- خالق
- روزانه
- کاربران فعال روزانه
- داده ها
- داود
- جمعیت
- شرح
- DID
- مختلف
- مدیر
- میکند
- عمل
- اژدها
- چاپ
- آموزش دادن
- عناصر
- پایان
- مهندسی
- اطمینان حاصل شود
- قسمت
- به خصوص
- ضروری است
- حتی
- تکامل
- در حال تحول
- کاملا
- مثال
- مهیج
- موجود
- تجربه
- تجارب
- صریح
- گسترش
- دعوا کردن
- پیدا کردن
- نام خانوادگی
- متمرکز شده است
- غذا
- برای
- غالبا
- از جانب
- بازی
- بازیها
- تولید می کنند
- گرفتن
- دادن
- زمین
- هدف
- رشد
- دسته
- است
- آیا
- داشتن
- به رهبری
- کمک
- کمک
- کمک می کند
- چگونه
- HTTPS
- ترکیبی
- i
- بهبود
- را بهبود می بخشد
- بهبود
- in
- گنجانده شده است
- گنجاندن
- افزایش
- نمایه شده
- اطلاع دادن
- ابداع
- ابتکاری
- داخل
- در عوض
- قصد
- بین المللی
- Is
- IT
- اقلام
- ITS
- ژاپن
- ژاپنی
- پرش
- تنها
- نگه داشتن
- کلید
- عدم
- زبان
- زبان ها
- بزرگ
- یاد گرفتن
- آموخته
- می آموزد
- رهبری
- قدرت نفوذ
- پسندیدن
- خطوط
- طولانی
- دیگر
- به دنبال
- خیلی
- عشق
- دستگاه
- ساخته
- جادویی
- عمده
- باعث می شود
- مدیر
- بسیاری
- بازار
- مسابقه
- مطابق
- ممکن است
- me
- معنی
- به معنی
- فراداده
- میلیون ها نفر
- ذهن
- ML
- مدل
- مدل
- کسب درآمد
- بیش
- اکثر
- چندگانه
- my
- نیاز
- نه
- نه
- of
- غالبا
- on
- یک
- فقط
- or
- سرچشمه
- دیگر
- ما
- خود
- بخش
- الگوهای
- مردم
- کاملا
- سکو
- افلاطون
- هوش داده پلاتو
- پلاتوداتا
- بازی پلاتو
- بازی
- بازی
- نقش
- برق وصل کردن
- پادکست
- محبوب
- ممکن
- هدیه
- مشکل
- محصول
- قرار دادن
- نمایش ها
- به سرعت
- کاملا
- مسابقه
- بازی های مسابقه ای
- رتبه بندی
- تحقق بخشیدن
- واقعا
- دلایل
- تازه
- روابط
- مربوط
- به خاطر بسپار
- نتایج
- نگهداری
- برگشت
- ثروتمند
- Roblox
- همان
- سناریو
- جستجو
- جستجو
- ارشد
- سلسله
- به اشتراک گذاشته شده
- باید
- نشان
- سیگنال
- So
- فقط
- حل
- حل کردن
- برخی از
- کسی
- چیزی
- گاهی
- منبع
- خاص
- هجی
- پشته
- وضعیت هنر
- گام
- استراتژی
- دانشجو
- چنین
- کافی
- نشان می دهد
- پشتیبانی
- مطمئن
- سطح
- سیستم
- سیستم های
- گرفتن
- طول می کشد
- مصرف
- مذاکرات
- معلم
- تیم
- فن آوری
- فنی
- تکنیک
- تکنیک
- پیشرفته
- گفتن
- ده ها
- متن
- که
- La
- جهان
- شان
- آنها
- سپس
- آنجا
- اینها
- آنها
- اشیاء
- این
- کسانی که
- گرچه
- از طریق
- زمان
- عنوان
- به
- آموزش
- ترانسفورماتور
- ترجمه
- اعتماد
- حقیقت
- دور زدن
- نوع
- انواع
- درک کن
- درک
- درک می کند
- منحصر به فرد
- up
- us
- استفاده کنید
- استفاده
- کاربر
- کاربران
- با استفاده از
- با استفاده از
- ارزش
- تنوع
- عمودی
- بسیار
- چشم انداز
- می خواهم
- بود
- we
- خوب
- چی
- چه شده است
- چه زمانی
- جایی که
- چرا
- ویکیپدیا
- با
- در داخل
- مهاجرت کاری
- کارگر
- جهان
- سال
- شما
- خود را
- زفیرنت