Semalt: តើវិគីភីឌាធ្វើការជាភាសាផ្សេងៗយ៉ាងដូចម្តេច?

អូលីវឺរឃីងអ្នកគ្រប់គ្រងជោគជ័យអតិថិជន Semalt និយាយថាវិគីភីឌាមានទិន្នន័យអត្ថបទនិងមាតិកាជាច្រើនខុសគ្នាហើយអ្នកកែសម្រួលត្រូវបានលើកទឹកចិត្តឱ្យបង្កើតអត្ថបទដែលបាត់នៅលើសព្វវចនាធិប្បាយដ៏ធំមួយនេះ។ វាមានសុវត្ថិភាពក្នុងការនិយាយថាវិគីភីឌាមានច្រើនជាងបីរយភាសាប៉ុន្តែភាគច្រើននៃពួកគេមិនពេញលេញនិងមានចំនួនតិចតួច។ ប្រជាជនមកពីគ្រប់ទិសទីនៃពិភពលោកទស្សនាវីគីភីឌាជារៀងរាល់ថ្ងៃនិងអានអត្ថបទជាង ៣០០ ភាសា។ ពួកគេខ្លះស្វែងរកអត្ថបទជាក់លាក់និងខ្លឹមសារដែលសរសេរដោយអ្នកស្ម័គ្រចិត្តរាប់រយទៅរាប់ពាន់នាក់ដែលទទួលខុសត្រូវក្នុងការកសាងនិងថែរក្សាសព្វវចនាធិប្បាយដ៏ល្បីល្បាញនិងសេរីមួយនេះ។ អ្នកទស្សនាវិគីភីឌាភាគច្រើនស្វែងរកអត្ថបទជាភាសាអង់គ្លេសហើយភាសាផ្សេងទៀតមានចំនួនវិគីចំនួន ៣០ លាន។

លទ្ធិប្រជាធិតេយ្យទទួលបានចំណេះដឹង

ដើម្បីជួយអ្នកនិពន្ធនិងអ្នកកែសម្រួលសហគមន៍ភាសាផ្សេងៗវាយតម្លៃអត្ថបទដែលបាត់អ្នកជំនាញកុំព្យូទ័រនៅឯមូលនិធិវិគីមេឌានិងស្ទែនហ្វដបានបង្កើតឧបករណ៍មួយចំនួនដោយជោគជ័យ។ អត្ថបទមួយក្នុងចំណោមអត្ថបទទាំងនោះជួយកំណត់អត្ថបទសំខាន់ៗដែលមិនទាន់មានជាភាសាជាក់លាក់។ អ្នកកែសំរួលប្រើអនុសាសន៍ទាំងនេះដើម្បីរៀបចំអត្ថបទថ្មីៗ។ ប្រសិនបើអ្នកកែសម្រួលនិងអ្នកនិពន្ធមានច្រើនភាសាដូច្នេះការស្វែងរកអត្ថបទជាភាសាទីពីរហើយបកប្រែវាទៅជាភាសាក្នុងស្រុកសម្រាប់អ្នកអានវិគីភីឌាគឺងាយស្រួលណាស់។

ដូច្នេះប្រព័ន្ធនេះនឹងកំណត់អត្តសញ្ញាណដំបូងអ្នកកែសំរួលរបស់ម៉ាដាហ្គាស្ការដែលចង់សរសេរជាភាសាបារាំងហើយនឹងស្នើសុំអោយអ្នកកែសម្រួលបំពេញនូវផ្នែកដែលបាត់នៃអត្ថបទហើយយកទៅចុះផ្សាយនៅក្នុងវិគីភីឌាម៉ាឌ្រីក។ វិធីនេះអ្នកកែសំរួលអាចបង្កើតអត្ថបទសំរាប់មនុស្សផ្សេងៗគ្នានៅលើពិភពលោកដែលអាចជះឥទ្ធិពលដល់បទពិសោធន៍អ្នកប្រើប្រាស់ទូទៅ។

អ្នកស្រាវជ្រាវមូលនិធិវិគីមេឌាឈ្មោះ Leila Zia និងលោក Ellery Wulczyn បានសហការជាមួយនិស្សិត Robert West ដើម្បីធ្វើបទបង្ហាញរបាយការណ៍នៅឯសន្និសីទពិភពលោកវ៉េលវ៉ាយអន្តរជាតិម៉ុងត្រេអាល់។ យោងទៅតាមពួកគេវិគីភីឌាមានទិន្នន័យយ៉ាងទូលំទូលាយហើយមានទំនាក់ទំនងរឹងមាំក្នុងចំណោមអត្ថបទរបស់វា។

អ្នកវិទ្យាសាស្ត្របានចាប់ផ្តើមបង្កើតបញ្ជីអត្ថបទជាភាសាផ្សេងៗគ្នានិងបញ្ជីឯកសារយោងដើម្បីរកមើលថាតើអត្ថបទណាដែលបាត់នៅក្នុងភាសាណាមួយ។ បន្ទាប់មកពួកគេបានប៉ាន់ប្រមាណសារៈសំខាន់នៃអត្ថបទដែលបាត់ទាំងអស់ដោយផ្អែកលើភាពពាក់ព័ន្ធភូមិសាស្ត្រនិងវប្បធម៌។ ពួកគេមានបំណងបោះពុម្ពផ្សាយអត្ថបទដែលបាត់ឱ្យបានឆាប់និងដើម្បីឱ្យពួកគេទទួលបានចំណាត់ថ្នាក់ល្អប្រសើរ។

ដោតចន្លោះប្រហោង

ក្រុមអ្នកស្រាវជ្រាវបានសាកល្បងការសន្និដ្ឋាននេះជាមួយនឹងការពិសោធន៍ជាច្រើន។ ពួកគេបានចាប់ផ្តើមគម្រោងជាមួយនឹងអត្ថបទជាង ៤ លានដែលត្រូវបានសរសេរជាភាសាអង់គ្លេសហើយបានរកឃើញថាមានអត្ថបទជាង ១,៥ លានត្រូវបានបាត់នៅក្នុងផ្នែកវីគីភីឌាបារាំង។ បន្ទាប់មកអ្នកជំនាញបានជ្រើសរើសអត្ថបទជាភាសាអង់គ្លេសសំខាន់ៗចំនួន ៣០០.០០០ ហើយបកប្រែជាភាសាបារាំង។ អត្ថបទត្រូវបានបែងចែកជាបីក្រុមធំ ៗ ជាង ១០ ម៉ឺនអត្ថបទក្នុងមួយអត្ថបទហើយត្រូវបានប្រគល់ទៅឱ្យនិពន្ធនាយកឆ្នើមនិងមានបទពិសោធន៍បំផុត។ ការសាកល្បងមានពាក់ព័ន្ធនឹងក្រុមនិពន្ធសំខាន់និងអ្នកសរសេរចំនួន ៦ ក្រុមចំនួន ២ ក្រុមដែលបានធ្វើការកែសម្រួលជាច្រើនទាំងភាសាបារាំងនិងអង់គ្លេសក្នុងរយៈពេល ១២ ខែមុនពេលបញ្ចប់ការសាកល្បង។ នៅខែមិថុនាឆ្នាំ ២០១៥ អ្នកកែសំរួលទាំងអស់បានទទួលអ៊ីម៉ែលមួយដែលចង្អុលបង្ហាញអំពីអត្ថបទដែលបាត់ហើយពួកគេត្រូវបានស្នើសុំឱ្យបកប្រែបញ្ជីពេញលេញនៃអត្ថបទពីភាសាអង់គ្លេសទៅភាសាបារាំង។ មួយខែក្រោយមកអ្នកជំនាញបានចូលមើលការបង្កើតអត្ថបទដែលបាត់ហើយឃើញថាពួកគេអាចបង្កើនអត្រាបង្កើតអត្ថបទសរីរាង្គ។ ផ្អែកលើលទ្ធផលទាំងអស់នេះមូលនិធិវិគីភីឌាបានបង្កើតឧបករណ៍ពិសោធន៍មួយចំនួនដែលអ្នកកែសម្រួលនិងអ្នកនិពន្ធអាចរកឃើញចន្លោះប្រហោងជាភាសាក្នុងស្រុករបស់ពួកគេនិងចង្អុលបង្ហាញអំពីធាតុជាក់លាក់។

mass gmail