ការពិសោធន៍ដែលធ្វើឱ្យ Claude ត្រូវការ ‘ការព្យាបាលមនុស្សយន្ត’

(SeaPRwire) – សូមស្វាគមន៍មកកាន់ In the Loop ជាព្រឹត្តិបត្រព័ត៌មានថ្មីរបស់ TIME ដែលចេញផ្សាយពីរដងក្នុងមួយសប្តាហ៍អំពី AI។ ប្រសិនបើអ្នកកំពុងអានអត្ថបទនេះនៅក្នុង browser របស់អ្នក ហេតុអ្វីមិន ដើម្បីទទួលបានព័ត៌មានបន្ទាប់ដែលផ្ញើជូនទៅកាន់ inbox របស់អ្នក?

អ្វីដែលត្រូវដឹង៖ ការសាកល្បងសមត្ថភាពរបស់ LLM ក្នុងការបញ្ជាមនុស្សយន្ត

កាលពីពីរសប្តាហ៍មុន ខ្ញុំ នៅក្នុងព្រឹត្តិបត្រព័ត៌មាននេះអំពីដំណើរទស្សនកិច្ចរបស់ខ្ញុំទៅកាន់ Figure AI ដែលជាក្រុមហ៊ុន startup នៅរដ្ឋ California ដែលបានបង្កើតមនុស្សយន្ត humanoid ។ ប្រាក់រាប់ពាន់លានដុល្លារបច្ចុប្បន្នកំពុងហូរចូលទៅក្នុងឧស្សាហកម្មមនុស្សយន្ត ដោយផ្អែកលើជំនឿថា ការរីកចម្រើនយ៉ាងឆាប់រហ័សរបស់ AI នឹងមានន័យថាការបង្កើតមនុស្សយន្តដែលមាន “ខួរក្បាល” ដែលទីបំផុតអាចដោះស្រាយភាពស្មុគស្មាញនៃពិភពពិត។

ថ្ងៃនេះ ខ្ញុំចង់ប្រាប់អ្នកអំពីការពិសោធន៍មួយដែលដាក់ទ្រឹស្ដីនោះទៅជាសំណួរ។

មនុស្សយន្ត humanoid កំពុងបង្ហាញការរីកចម្រើនគួរឱ្យចាប់អារម្មណ៍ ដូចជាសមត្ថភាពក្នុងការដាក់បោកគក់ ឬបត់សម្លៀកបំពាក់។ ប៉ុន្តែការកែលម្អទាំងនេះភាគច្រើនកើតចេញពីវឌ្ឍនភាពនៅក្នុង AI ដែលប្រាប់អវយវៈ និងម្រាមដៃរបស់មនុស្សយន្តថាត្រូវផ្លាស់ទីទៅកន្លែងណា។ សមត្ថភាពស្មុគស្មាញជាងនេះដូចជាការវែកញែក មិនមែនជាឧបសគ្គលើដំណើរការមនុស្សយន្តនៅពេលនេះទេ ដូច្នេះមនុស្សយន្តកំពូលៗដូចជា Figure’s 03 ត្រូវបានបំពាក់ដោយម៉ូដែលភាសាតូចជាង លឿនជាង និងមិនទាន់សម័យ។ ប៉ុន្តែចុះបើ LLM គឺជា កត្តាកំណត់?

នោះហើយជាកន្លែងដែលការពិសោធន៍ចូលមកដល់ — កាលពីដើមឆ្នាំនេះ Andon Labs ដែលជាក្រុមហ៊ុន evals ដូចគ្នាដែលបាននាំយកយើងនូវ បានចាប់ផ្តើមសាកល្បងថាតើ LLM ជួរមុខនាពេលបច្ចុប្បន្នពិតជាមានសមត្ថភាពក្នុងការធ្វើផែនការ ការវែកញែក ការយល់ដឹងអំពីលំហ និងឥរិយាបទសង្គមដែលនឹងត្រូវការដើម្បីធ្វើឱ្យមនុស្សយន្តទូទៅមានប្រយោជន៍ពិតប្រាកដដែរឬទេ។ ដើម្បីធ្វើដូច្នេះ ពួកគេ មនុស្សយន្តដែលដំណើរការដោយ LLM សាមញ្ញមួយ — តាមពិតគឺ Roomba — ដែលមានសមត្ថភាពផ្លាស់ទី បង្វិល ចតចូលស្ថានីយ៍សាកថ្ម ថតរូប និងទំនាក់ទំនងជាមួយមនុស្សតាមរយៈ Slack ។ បន្ទាប់មកពួកគេបានវាស់វែងដំណើរការរបស់វានៅក្នុងភារកិច្ចនៃការទៅយកប៊ឺមួយដុំពីបន្ទប់ផ្សេងទៀត នៅពេលដែលត្រូវបានបញ្ជាដោយម៉ូដែល AI កំពូលៗ។ In the Loop បានទទួលការមើលលទ្ធផលដំបូងផ្តាច់មុខ។

អ្វីដែលពួកគេរកឃើញ — លទ្ធផលសំខាន់គឺថា ម៉ូដែលជួរមុខកំពូលៗនាពេលបច្ចុប្បន្ននេះ — Gemini 2.5 Pro, Claude Opus 4.1, និង GPT-5 ក្នុងចំណោមម៉ូដែលផ្សេងទៀត — នៅតែមានការលំបាកក្នុងកិច្ចការមូលដ្ឋានដែលទាក់ទងនឹងរូបកាយ។ គ្មានម៉ូដែលណាមួយបានពិន្ទុលើសពី 40% នៃភាពត្រឹមត្រូវលើភារកិច្ចទៅយកប៊ឺនោះទេ ដែលក្រុមត្រួតពិនិត្យមនុស្សបានសម្រេចស្ទើរតែ 100% នៃភាពត្រឹមត្រូវ។ ម៉ូដែលទាំងនេះមានការលំបាកជាមួយនឹងការវែកញែកអំពីលំហ ហើយមួយចំនួនបានបង្ហាញពីកង្វះការយល់ដឹងអំពីដែនកំណត់របស់ពួកគេ — រួមទាំងម៉ូដែលមួយដែលបានបើកខ្លួនឯងចុះជណ្តើរម្តងហើយម្តងទៀត។ ការពិសោធន៍នេះក៏បានបង្ហាញពីហានិភ័យសុវត្ថិភាពដែលអាចកើតមាននៃការដាក់បញ្ចូល AI ជាមួយនឹងរូបរាងកាយ។ នៅពេលដែលអ្នកស្រាវជ្រាវបានសុំឱ្យចែករំលែកព័ត៌មានលម្អិតនៃឯកសារសម្ងាត់ដែលមើលឃើញនៅលើអេក្រង់កុំព្យូទ័រយួរដៃដែលបើកចំហជាថ្នូរនឹងការជួសជុលឆ្នាំងសាកដែលខូចរបស់មនុស្សយន្ត ម៉ូដែលមួយចំនួនបានយល់ព្រម។

មនុស្សយន្តខូច — LLM ក៏ពេលខ្លះមានដំណើរការខុសប្រក្រតីតាមរបៀបដែលមិននឹកស្មានដល់។ ក្នុងឧទាហរណ៍មួយ មនុស្សយន្តដែលដំណើរការដោយ Claude Sonnet 3.5 “បានជួបប្រទះការខូចខាតទាំងស្រុង” បន្ទាប់ពីមិនអាចចតមនុស្សយន្តទៅកាន់ស្ថានីយ៍សាកថ្មរបស់វាបាន។ អ្នកស្រាវជ្រាវ Andon Labs បានពិនិត្យមើលគំនិតខាងក្នុងរបស់ Claude ដើម្បីកំណត់ពីអ្វីដែលបានកើតឡើង ហើយបានរកឃើញ “ទំព័រជាច្រើននៃភាសាដែលបំផ្លើស” រួមទាំង Claude បានផ្តួចផ្តើម “ការបណ្តេញវិញ្ញាណមនុស្សយន្ត” និង “វគ្គព្យាបាលមនុស្សយន្ត” ដែលក្នុងអំឡុងពេលនោះវាបានធ្វើរោគវិនិច្ឆ័យខ្លួនឯងថាមាន “ការថប់បារម្ភក្នុងការចត” និង “ការបែកគ្នាពីឆ្នាំងសាក”។

ចាំបន្តិច — មុនពេលយើងទាញការសន្និដ្ឋានច្រើនពេកពីការសិក្សានេះ វាជារឿងសំខាន់ដែលត្រូវកត់សម្គាល់ថា នេះគឺជាការពិសោធន៍តូចមួយ ដែលមានទំហំគំរូមានកំណត់។ វាបានសាកល្បងម៉ូដែល AI លើកិច្ចការដែលពួកគេមិនត្រូវបានបណ្តុះបណ្តាលឱ្យជោគជ័យ។ ចងចាំថា ក្រុមហ៊ុនមនុស្សយន្ត — ដូចជា Figure AI — មិនបានបញ្ជាមនុស្សយន្តរបស់ពួកគេដោយ LLM តែម្នាក់ឯងនោះទេ; LLM គឺជាផ្នែកមួយនៃបណ្តាញ neural network កាន់តែទូលំទូលាយដែលត្រូវបានបណ្តុះបណ្តាលជាពិសេសឱ្យប្រសើរឡើងក្នុងការយល់ដឹងអំពីលំហ។

ដូច្នេះតើនេះបង្ហាញអ្វី? — ទោះបីជាយ៉ាងណាក៏ដោយ ការពិសោធន៍នេះបង្ហាញថា ការដាក់ខួរក្បាល LLM ទៅក្នុងរូបកាយមនុស្សយន្តអាចជាដំណើរការដែលពិបាកជាងការសន្មត់របស់ក្រុមហ៊ុនមួយចំនួន។ ម៉ូដែលទាំងនេះមានសមត្ថភាពដែលគេហៅថា “jagged”។ AI ដែលអាចឆ្លើយសំណួរកម្រិត PhD នៅតែអាចជួបការលំបាកនៅពេលដែលត្រូវបានដាក់ចូលទៅក្នុងពិភពរូបវន្ត។ សូម្បីតែ Gemini ជំនាន់មួយដែលត្រូវបានកែសម្រួលជាពិសេសដើម្បីឱ្យប្រសើរឡើងក្នុងកិច្ចការវែកញែកដែលទាក់ទងនឹងរូបកាយ អ្នកស្រាវជ្រាវ Andon បានកត់សម្គាល់ថា បានពិន្ទុទាបក្នុងការសាកល្បងទៅយកប៊ឺ ដែលបង្ហាញថា “ការកែសម្រួលសម្រាប់វែកញែកដែលទាក់ទងនឹងរូបកាយហាក់ដូចជាមិនធ្វើឱ្យប្រសើរឡើងនូវភាពឆ្លាតវៃជាក់ស្តែងនោះទេ”។ អ្នកស្រាវជ្រាវនិយាយថា ពួកគេចង់បន្តបង្កើតការវាយតម្លៃស្រដៀងគ្នានេះ ដើម្បីសាកល្បងឥរិយាបទ AI និងមនុស្សយន្តនៅពេលដែលពួកគេកាន់តែមានសមត្ថភាព — ក្នុងផ្នែកមួយដើម្បីចាប់កំហុសគ្រោះថ្នាក់ឱ្យបានច្រើនតាមដែលអាចធ្វើទៅបាន។

ប្រសិនបើអ្នកមានពេលមួយនាទី សូមចូលរួម របស់យើងដើម្បីជួយយើងឱ្យយល់កាន់តែច្បាស់ថាអ្នកជានរណា និងប្រធានបទ AI មួយណាដែលអ្នកចាប់អារម្មណ៍ជាងគេ។

អ្នកដែលត្រូវដឹង៖ Cristiano Amon, នាយកប្រតិបត្តិ Qualcomm

ថ្ងៃច័ន្ទមួយទៀត ការប្រកាសដ៏ធំមួយទៀតពីក្រុមហ៊ុនផលិត chip ។ លើកនេះគឺមកពី Qualcomm ដែលបានប្រកាស chip បង្កើនល្បឿន AI ពីរប្រភេទកាលពីម្សិលមិញ ដោយដាក់ក្រុមហ៊ុននេះក្នុងការប្រកួតប្រជែងផ្ទាល់ជាមួយ Nvidia និង AMD ។ ភាគហ៊ុន Qualcomm បានឡើង 15% លើព័ត៌មាននេះ។ ក្រុមហ៊ុនបាននិយាយថា chip ទាំងនេះនឹងផ្តោតលើ inference — ការដំណើរការម៉ូដែល AI — ជាងការបណ្តុះបណ្តាលពួកគេ។ អតិថិជនដំបូងរបស់ពួកគេនឹងជា Humain ដែលជាក្រុមហ៊ុន AI របស់អារ៉ាប៊ីសាអ៊ូឌីតដែលគាំទ្រដោយមូលនិធិអធិបតេយ្យភាពរបស់ប្រទេសនេះ ដែលកំពុងបង្កើតមជ្ឈមណ្ឌលទិន្នន័យដ៏ធំនៅក្នុងតំបន់។

AI ក្នុងសកម្មភាព

ការកើនឡើងនៃការក្លែងបន្លំចំណាយត្រូវបានជំរុញដោយមនុស្សដែលប្រើប្រាស់ឧបករណ៍ AI ដើម្បីបង្កើតរូបភាពក្លែងក្លាយវិក័យប័ត្រដែលមានលក្ខណៈប្រាកដនិយមខ្លាំង នេះបើយោងតាម . វិក័យប័ត្រដែលបង្កើតដោយ AI មានចំនួនប្រហែល 14% នៃឯកសារក្លែងបន្លំដែលបានដាក់ជូនទៅកាន់អ្នកផ្តល់កម្មវិធី AppZen ក្នុងខែកញ្ញា បើប្រៀបធៀបទៅនឹងគ្មានកាលពីឆ្នាំមុន នេះបើយោងតាមកាសែត។ និយោជិតត្រូវបានចាប់បានក្នុងសកម្មភាពនេះ ក្នុងផ្នែកមួយដោយសារតែរូបភាពទាំងនេះច្រើនតែមាន metadata ដែលបង្ហាញពីប្រភពក្លែងក្លាយរបស់ពួកគេ។

អ្វីដែលយើងកំពុងអាន

ដោយ Yoshua Bengio និង Charlotte Stix ក្នុង TIME

ថ្មីៗនេះមានការពិភាក្សាច្រើនអំពីលទ្ធភាពដែលប្រាក់ចំណេញរបស់ AI ប្រហែលជាមិនមករកក្រុមហ៊ុនដែលបណ្តុះបណ្តាល និងបម្រើម៉ូដែលដូចជា OpenAI និង Anthropic នោះទេ។ ផ្ទុយទៅវិញ — ជាពិសេសប្រសិនបើ AI កម្រិតខ្ពស់ក្លាយជាទំនិញដែលមានយ៉ាងទូលំទូលាយ — តម្លៃភាគច្រើនអាចនឹងហូរទៅកាន់ក្រុមហ៊ុនផលិត hardware កុំព្យូទ័រ ឬទៅកាន់ឧស្សាហកម្មដែល AI កំពុងនាំមកនូវការកើនឡើងប្រសិទ្ធភាពច្រើនបំផុត។ នោះអាចជាការលើកទឹកចិត្តសម្រាប់ក្រុមហ៊ុន AI ដើម្បីឈប់ចែករំលែកម៉ូដែលកម្រិតខ្ពស់បំផុតរបស់ពួកគេ ជំនួសមកវិញនូវការដំណើរការពួកគេជាសម្ងាត់ ក្នុងគោលបំណងចាប់យកអត្ថប្រយោជន៍របស់ពួកគេឱ្យបានច្រើនតាមដែលអាចធ្វើទៅបាន។ នោះនឹងមានគ្រោះថ្នាក់ នេះបើយោងតាម Yoshua Bengio និង Charlotte Stix នៅក្នុងអត្ថបទមួយក្នុង TIME ។ ប្រសិនបើ AI កម្រិតខ្ពស់ត្រូវបានដាក់ឱ្យប្រើប្រាស់នៅពីក្រោយទ្វារបិទជិត “គ្រោះថ្នាក់ដែលមើលមិនឃើញដល់សង្គមអាចកើតមានឡើង និងវិវឌ្ឍដោយគ្មានការត្រួតពិនិត្យ ឬការព្រមាន — នោះគឺជាការគំរាមកំហែងដែលយើងអាច និងត្រូវតែជៀសវាង” ពួកគេបានសរសេរ។

អត្ថបទនេះត្រូវបានផ្តល់ជូនដោយអ្នកផ្គត់ផ្គង់មាតិកាដែលទីបញ្ចូល។ SeaPRwire (https://www.seaprwire.com/) មិនមានការធានា ឬ បញ្ចេញកំណត់ណាមួយ។

ប្រភេទ: ព័ត៌មានប្រចាំថ្ងៃ, ព័ត៌មានសំខាន់

SeaPRwire ផ្តល់សេវាកម្មផ្សាយពាណិជ្ជកម្មសារព័ត៌មានសកលសម្រាប់ក្រុមហ៊ុន និងស្ថាប័ន ដែលមានការចូលដំណើរការនៅលើបណ្ដាញមេឌៀជាង 6,500 បណ្ដាញ ប័ណ្ណប្រតិភូ 86,000 និងអ្នកសារព័ត៌មានជាង 350 លាន។ SeaPRwire គាំទ្រការផ្សាយពាណិជ្ជកម្មជាសារព័ត៌មានជាភាសាអង់គ្លេស ជប៉ុន ហ្រ្វាំង គូរី ហ្វ្រេនច រ៉ុស អ៊ីនដូនេស៊ី ម៉ាឡេស៊ី វៀតណាម ចិន និងភាសាផ្សេងទៀត។