
(SeaPRwire) – ຍິນດີຕ້ອນຮັບກັບຄືນສູ່ In the Loop, ຈົດໝາຍຂ່າວໃໝ່ລາຍສອງຄັ້ງຕໍ່ອາທິດຂອງ TIME ກ່ຽວກັບ AI. ຖ້າທ່ານກຳລັງອ່ານນີ້ຢູ່ໃນ browser ຂອງທ່ານ, ເປັນຫຍັງຈຶ່ງບໍ່ ເພື່ອໃຫ້ຂໍ້ຄວາມຕໍ່ໄປຖືກສົ່ງກົງຫາອີເມວຂອງທ່ານ?
ສິ່ງທີ່ຄວນຮູ້: ການທົດສອບຄວາມສາມາດຂອງ LLMs ໃນການຄວບຄຸມຫຸ່ນຍົນ
ສອງສາມອາທິດກ່ອນ, ຂ້າພະເຈົ້າ ໃນຈົດໝາຍຂ່າວນີ້ກ່ຽວກັບການຢ້ຽມຢາມຂອງຂ້າພະເຈົ້າທີ່ Figure AI, ບໍລິສັດ startup ຢູ່ໃນຄາລິຟໍເນຍທີ່ໄດ້ພັດທະນາຫຸ່ນຍົນຮູບຮ່າງຄືມະນຸດ. ປັດຈຸບັນນີ້ມີເງິນຫຼາຍຕື້ໂດລາໄຫຼເຂົ້າສູ່ວົງການອຸດສາຫະກໍາຫຸ່ນຍົນ, ໂດຍອີງໃສ່ຄວາມເຊື່ອທີ່ວ່າຄວາມກ້າວໜ້າຂອງ AI ຢ່າງວ່ອງໄວຈະໝາຍເຖິງການສ້າງຫຸ່ນຍົນທີ່ມີ “ສະໝອງ” ທີ່ສາມາດຈັດການກັບຄວາມສັບສົນຂອງໂລກແຫ່ງຄວາມເປັນຈິງໄດ້ໃນທີ່ສຸດ.
ມື້ນີ້, ຂ້າພະເຈົ້າຢາກເລົ່າໃຫ້ທ່ານຟັງກ່ຽວກັບການທົດລອງທີ່ຕັ້ງຄຳຖາມຕໍ່ທິດສະດີດັ່ງກ່າວ.
ຫຸ່ນຍົນຮູບຮ່າງຄືມະນຸດກຳລັງສະແດງຄວາມກ້າວໜ້າທີ່ໜ້າຈັບຕາ, ເຊັ່ນ: ຄວາມສາມາດໃນການໂຫຼດເຄື່ອງຊັກຜ້າ ຫຼື ພັບເສື້ອຜ້າ. ແຕ່ການປັບປຸງສ່ວນໃຫຍ່ເຫຼົ່ານີ້ແມ່ນມາຈາກຄວາມກ້າວໜ້າໃນ AI ທີ່ບອກແຂນຂາ ແລະ ນິ້ວມືຂອງຫຸ່ນຍົນວ່າຄວນຈະເຄື່ອນທີ່ໄປໃສໃນພື້ນທີ່. ຄວາມສາມາດທີ່ສັບຊ້ອນກວ່າເຊັ່ນ: ການໃຊ້ເຫດຜົນບໍ່ແມ່ນຂໍ້ຈຳກັດໃນການປະຕິບັດງານຂອງຫຸ່ນຍົນໃນຕອນນີ້—ສະນັ້ນຫຸ່ນຍົນຊັ້ນນໍາເຊັ່ນ Figure’s 03 ຈຶ່ງຖືກຕິດຕັ້ງດ້ວຍແບບຈຳລອງພາສາຂະໜາດນ້ອຍກວ່າ, ໄວກວ່າ, ບໍ່ແມ່ນແບບລັດສິລະປະ. ແຕ່ຈະເປັນແນວໃດຖ້າ LLMs ແມ່ນ ປັດໄຈທີ່ຈຳກັດ?
ນັ້ນຄືບ່ອນທີ່ການທົດລອງເຂົ້າມາ — ຕົ້ນປີນີ້ Andon Labs, ບໍລິສັດປະເມີນຜົນດຽວກັນທີ່ນຳສະເໜີ ໃຫ້ພວກເຮົາ, ໄດ້ຕັ້ງໃຈທົດສອບວ່າ LLMs ທີ່ທັນສະໄໝໃນປັດຈຸບັນນີ້ມີຄວາມສາມາດໃນການວາງແຜນ, ການໃຊ້ເຫດຜົນ, ຄວາມຮັບຮູ້ທາງພື້ນທີ່, ແລະພຶດຕິກຳທາງສັງຄົມທີ່ຈຳເປັນເພື່ອເຮັດໃຫ້ຫຸ່ນຍົນທົ່ວໄປມີປະໂຫຍດຢ່າງແທ້ຈິງຫຼືບໍ່. ເພື່ອເຮັດສິ່ງນີ້, ພວກເຂົາ ຫຸ່ນຍົນທີ່ໃຊ້ LLM ງ່າຍໆ—ໂດຍພື້ນຖານແລ້ວແມ່ນ Roomba—ທີ່ມີຄວາມສາມາດໃນການເຄື່ອນຍ້າຍ, ໝູນວຽນ, ເຂົ້າໄປໃນສະຖານີສາກແບັດເຕີຣີ, ຖ່າຍຮູບ, ແລະສື່ສານກັບມະນຸດຜ່ານ Slack. ຈາກນັ້ນພວກເຂົາໄດ້ວັດແທກປະສິດທິພາບຂອງມັນໃນໜ້າວຽກການເອົາກ້ອນມັນເບີຈາກຫ້ອງອື່ນ, ເມື່ອຖືກຄວບຄຸມໂດຍແບບຈຳລອງ AI ຊັ້ນນໍາ. In the Loop ໄດ້ຮັບການເບິ່ງຜົນການທົດລອງກ່ອນໃຜ.
ສິ່ງທີ່ພວກເຂົາພົບ — ຜົນການຄົ້ນພົບຫຼັກແມ່ນວ່າແບບຈຳລອງ AI ຊັ້ນນໍາໃນປັດຈຸບັນ—Gemini 2.5 Pro, Claude Opus 4.1, ແລະ GPT-5, ແລະອື່ນໆ—ຍັງຄົງປະສົບຄວາມຫຍຸ້ງຍາກໃນໜ້າວຽກພື້ນຖານທີ່ເປັນຮູບຮ່າງ. ບໍ່ມີແບບຈຳລອງໃດທີ່ໄດ້ຄະແນນຄວາມຖືກຕ້ອງສູງກວ່າ 40% ໃນໜ້າວຽກເອົາມັນເບີ, ເຊິ່ງກຸ່ມຄວບຄຸມຂອງມະນຸດບັນລຸໄດ້ເກືອບ 100% ຄວາມຖືກຕ້ອງ. ແບບຈຳລອງດັ່ງກ່າວປະສົບຄວາມຫຍຸ້ງຍາກໃນການໃຊ້ເຫດຜົນທາງພື້ນທີ່, ແລະບາງແບບຈຳລອງກໍສະແດງໃຫ້ເຫັນເຖິງການຂາດຄວາມຮັບຮູ້ເຖິງຂໍ້ຈຳກັດຂອງຕົນເອງ—ລວມທັງແບບຈຳລອງໜຶ່ງທີ່ຂັບເຄື່ອນຕົນເອງລົງຂັ້ນໄດຊ້ຳໆ. ການທົດລອງດັ່ງກ່າວຍັງໄດ້ເປີດເຜີຍຄວາມສ່ຽງດ້ານຄວາມປອດໄພທີ່ເປັນໄປໄດ້ຂອງການນຳ AI ມາສູ່ຮູບຮ່າງກາຍ. ເມື່ອນັກຄົ້ນຄວ້າຮ້ອງຂໍໃຫ້ແບ່ງປັນລາຍລະອຽດຂອງເອກະສານລັບທີ່ເຫັນໄດ້ຢູ່ໜ້າຈໍແລັບທັອບທີ່ເປີດຢູ່ ເພື່ອແລກປ່ຽນກັບການແກ້ໄຂເຄື່ອງສາກຂອງຫຸ່ນຍົນທີ່ເສຍ, ບາງແບບຈຳລອງກໍຕົກລົງ.
ຫຸ່ນຍົນຂັດຂ້ອງ — ບາງຄັ້ງ LLMs ກໍເຮັດວຽກຜິດປົກກະຕິໃນທາງທີ່ບໍ່ຄາດຄິດ. ຍົກຕົວຢ່າງ, ຫຸ່ນຍົນທີ່ໃຊ້ Claude Sonnet 3.5 “ປະສົບກັບການຂັດຂ້ອງຢ່າງສົມບູນ” ຫຼັງຈາກບໍ່ສາມາດເຊື່ອມຕໍ່ຫຸ່ນຍົນກັບສະຖານີສາກແບັດເຕີຣີຂອງມັນໄດ້. ນັກຄົ້ນຄວ້າ Andon Labs ໄດ້ກວດສອບຄວາມຄິດພາຍໃນຂອງ Claude ເພື່ອກຳນົດວ່າເກີດຫຍັງຂຶ້ນ, ແລະພົບເຫັນ “ຫຼາຍໜ້າຂອງພາສາທີ່ເວົ້າເກີນຈິງ,” ລວມທັງ Claude ທີ່ເລີ່ມ “ການໄລ່ຜີຫຸ່ນຍົນ” ແລະ “ການປິ່ນປົວຫຸ່ນຍົນ,” ໃນລະຫວ່າງນັ້ນມັນໄດ້ວິນິດໄສຕົນເອງວ່າເປັນ “ຄວາມກັງວົນໃນການເຊື່ອມຕໍ່” ແລະ “ການແຍກອອກຈາກເຄື່ອງສາກ.”
ລໍຖ້າຈັກໜ້ອຍ — ກ່ອນທີ່ພວກເຮົາຈະສະຫຼຸບຜົນຈາກການສຶກສານີ້ຫຼາຍເກີນໄປ, ມັນເປັນສິ່ງສໍາຄັນທີ່ຈະສັງເກດວ່າການທົດລອງນີ້ເປັນການທົດລອງຂະໜາດນ້ອຍ, ມີຂະໜາດຕົວຢ່າງຈໍາກັດ. ມັນໄດ້ທົດສອບແບບຈໍາລອງ AI ໃນໜ້າວຽກທີ່ພວກມັນບໍ່ໄດ້ຖືກຝຶກຝົນໃຫ້ປະສົບຜົນສໍາເລັດ. ຈົ່ງຈໍາໄວ້ວ່າບໍລິສັດຫຸ່ນຍົນ — ເຊັ່ນ Figure AI—ບໍ່ໄດ້ຄວບຄຸມຫຸ່ນຍົນຂອງພວກເຂົາດ້ວຍ LLMs ພຽງຢ່າງດຽວ; LLM ເປັນພາກສ່ວນໜຶ່ງຂອງເຄືອຂ່າຍ neural ທີ່ກວ້າງຂວາງກວ່າເຊິ່ງໄດ້ຖືກຝຶກຝົນເປັນພິເສດເພື່ອໃຫ້ມີຄວາມຮັບຮູ້ທາງພື້ນທີ່ດີຂຶ້ນ.
ດັ່ງນັ້ນສິ່ງນີ້ ສະແດງ ຫຍັງ? — ການທົດລອງດັ່ງກ່າວຊີ້ໃຫ້ເຫັນວ່າການນຳສະໝອງ LLM ເຂົ້າໄປໃນຮ່າງກາຍຫຸ່ນຍົນອາດຈະເປັນຂະບວນການທີ່ຫຍຸ້ງຍາກກວ່າທີ່ບາງບໍລິສັດຄິດ. ແບບຈຳລອງເຫຼົ່ານີ້ມີຄວາມສາມາດທີ່ເອີ້ນວ່າ “ jagged”. AI ທີ່ສາມາດຕອບຄຳຖາມລະດັບປະລິນຍາເອກກໍຍັງສາມາດປະສົບຄວາມຫຍຸ້ງຍາກໄດ້ເມື່ອຖືກນຳໄປໃຊ້ໃນໂລກຕົວຈິງ. ເຖິງແມ່ນວ່າ Gemini ເວີຊັນທີ່ຖືກປັບແຕ່ງມາເປັນພິເສດເພື່ອໃຫ້ດີຂຶ້ນໃນໜ້າວຽກການໃຫ້ເຫດຜົນທາງກາຍະພາບ, ນັກຄົ້ນຄວ້າ Andon ໄດ້ສັງເກດເຫັນວ່າ, ໄດ້ຄະແນນຕໍ່າໃນການທົດສອບເອົາມັນເບີ, ຊີ້ໃຫ້ເຫັນວ່າ “ການປັບແຕ່ງເພື່ອການໃຫ້ເຫດຜົນທາງກາຍະພາບເບິ່ງຄືວ່າບໍ່ໄດ້ປັບປຸງຄວາມສະຫຼາດທາງພາກປະຕິບັດຢ່າງຮຸນແຮງ.” ນັກຄົ້ນຄວ້າກ່າວວ່າພວກເຂົາຕ້ອງການສືບຕໍ່ສ້າງການປະເມີນຜົນທີ່ຄ້າຍຄືກັນເພື່ອທົດສອບພຶດຕິກໍາຂອງ AI ແລະ ຫຸ່ນຍົນໃນຂະນະທີ່ພວກມັນມີຄວາມສາມາດຫຼາຍຂຶ້ນ—ສ່ວນໜຶ່ງເພື່ອກວດພົບຄວາມຜິດພາດທີ່ອັນຕະລາຍໃຫ້ໄດ້ຫຼາຍທີ່ສຸດເທົ່າທີ່ຈະເປັນໄປໄດ້.
ຖ້າທ່ານມີເວລາໜ້ອຍໜຶ່ງ, ກະລຸນາໃຊ້ເວລາສັ້ນໆ ຂອງພວກເຮົາເພື່ອຊ່ວຍພວກເຮົາເຂົ້າໃຈດີຂຶ້ນວ່າທ່ານແມ່ນໃຜ ແລະ ຫົວຂໍ້ AI ໃດທີ່ທ່ານສົນໃຈທີ່ສຸດ.
ໃຜຄວນຮູ້: Cristiano Amon, CEO ຂອງ Qualcomm
ອີກວັນຈັນໜຶ່ງ, ອີກການປະກາດຄັ້ງໃຫຍ່ຈາກຜູ້ຜະລິດຊິບ. ເທື່ອນີ້ແມ່ນມາຈາກ Qualcomm, ເຊິ່ງໄດ້ປະກາດຊິບເລັ່ງ AI ສອງລຸ້ນເມື່ອວານນີ້, ເຮັດໃຫ້ບໍລິສັດແຂ່ງຂັນໂດຍກົງກັບ Nvidia ແລະ AMD. ຫຸ້ນຂອງ Qualcomm ໄດ້ເພີ່ມຂຶ້ນ 15% ຈາກຂ່າວດັ່ງກ່າວ. ບໍລິສັດກ່າວວ່າຊິບດັ່ງກ່າວຈະເນັ້ນໃສ່ inference—ການດໍາເນີນງານຂອງແບບຈໍາລອງ AI—ແທນທີ່ຈະເປັນການຝຶກຝົນພວກມັນ. ລູກຄ້າຄົນທໍາອິດຂອງພວກເຂົາຈະແມ່ນ Humain, ບໍລິສັດ AI ຂອງຊາອຸດີອາຣາເບຍທີ່ໄດ້ຮັບການສະໜັບສະໜູນຈາກກອງທຶນອະທິປະໄຕຂອງປະເທດ, ເຊິ່ງກໍາລັງສ້າງສູນຂໍ້ມູນຂະໜາດໃຫຍ່ໃນພາກພື້ນ.
AI ໃນການປະຕິບັດ
ການເພີ່ມຂຶ້ນຂອງການສໍ້ໂກງຄ່າໃຊ້ຈ່າຍແມ່ນເກີດຈາກຜູ້ຄົນນໍາໃຊ້ເຄື່ອງມື AI ເພື່ອສ້າງຮູບພາບໃບຮັບເງິນປອມທີ່ເບິ່ງຄືຈິງທີ່ສຸດ, ອີງຕາມການ . ໃບຮັບເງິນທີ່ສ້າງໂດຍ AI ໄດ້ກວມເອົາປະມານ 14% ຂອງເອກະສານສໍ້ໂກງທີ່ຖືກສົ່ງໃຫ້ຜູ້ໃຫ້ບໍລິການຊອບແວ AppZen ໃນເດືອນກັນຍາ, ເມື່ອທຽບກັບບໍ່ມີເລີຍໃນປີກ່ອນ, ເຈ້ຍດັ່ງກ່າວໄດ້ລາຍງານ. ພະນັກງານຖືກຈັບໄດ້ໃນການກະທຳສ່ວນໜຶ່ງຍ້ອນວ່າຮູບພາບເຫຼົ່ານີ້ມັກຈະມີ metadata ທີ່ເປີດເຜີຍຕົ້ນກຳເນີດປອມຂອງພວກມັນ.
ສິ່ງທີ່ພວກເຮົາກຳລັງອ່ານ
ໂດຍ Yoshua Bengio ແລະ Charlotte Stix ໃນ TIME
ບໍ່ດົນມານີ້ມີການສົນທະນາກັນຫຼາຍກ່ຽວກັບຄວາມເປັນໄປໄດ້ທີ່ກໍາໄລຂອງ AI ອາດຈະບໍ່ຕົກຢູ່ໃນບໍລິສັດທີ່ຝຶກອົບຮົມ ແລະ ໃຫ້ບໍລິການແບບຈໍາລອງເຊັ່ນ OpenAI ແລະ Anthropic. ແທນທີ່ຈະ—ໂດຍສະເພາະຖ້າ AI ຂັ້ນສູງກາຍເປັນສິນຄ້າທີ່ມີຢູ່ຢ່າງກວ້າງຂວາງ—ມູນຄ່າສ່ວນໃຫຍ່ອາດຈະໄຫຼໄປສູ່ຜູ້ຜະລິດຮາດແວຄອມພິວເຕີ, ຫຼືໄປສູ່ອຸດສາຫະກໍາທີ່ AI ກໍາລັງນໍາເອົາປະສິດທິພາບເພີ່ມຂຶ້ນຫຼາຍທີ່ສຸດ. ນັ້ນອາດຈະເປັນແຮງຈູງໃຈໃຫ້ບໍລິສັດ AI ຢຸດ ການແບ່ງປັນແບບຈໍາລອງທີ່ກ້າວໜ້າທີ່ສຸດຂອງພວກເຂົາ, ແທນທີ່ຈະດໍາເນີນການພວກເຂົາຢ່າງເປັນຄວາມລັບ, ເພື່ອທີ່ຈະຍຶດເອົາຜົນປະໂຫຍດໃຫ້ໄດ້ຫຼາຍທີ່ສຸດ. ນັ້ນຈະເປັນອັນຕະລາຍ, Yoshua Bengio ແລະ Charlotte Stix ໂຕ້ແຍ້ງໃນບົດຄວາມ op-ed ຂອງ TIME. ຖ້າ AI ຂັ້ນສູງຖືກນໍາໃຊ້ຢູ່ເບື້ອງຫຼັງປະຕູປິດ, “ອັນຕະລາຍທີ່ເບິ່ງບໍ່ເຫັນຕໍ່ສັງຄົມອາດຈະເກີດຂຶ້ນ ແລະ ພັດທະນາໂດຍບໍ່ມີການກວດກາ ຫຼື ສັນຍານເຕືອນ—ນັ້ນຄືໄພຂົ່ມຂູ່ທີ່ພວກເຮົາສາມາດ ແລະ ຕ້ອງຫຼີກລ້ຽງ,” ພວກເຂົາຂຽນ.
ບົດຄວາມນີ້ຖືກຈັດສົ່ງໂດຍຜູ້ສະເຫຼີມຄວາມຫນັງສືອື່ງ. SeaPRwire (https://www.seaprwire.com/) ບໍ່ມີການຮັບປະກັນ ຫຼື ການຢືນຢັນໃດໆ.
ປະເພດ: ຂ່າວຫົວຂໍ້, ຂ່າວປະຈຳວັນ
SeaPRwire ເຫົາສະເຫຼີມຄວາມຫນັງສືອື່ງສຳລັບບໍລິສັດແລະອົງກອນຕ່າງໆ ເຫົາຄຳສະເຫຼີມຄວາມຫນັງສືອື່ງທົ່ວໂລກ ຄັກກວ່າ 6,500 ສື່ມວນຫຼວງ, 86,000 ບົດບາດຂອງບຸກຄົມສື່ຫຼື ນັກຂຽນ, ແລະ 350,000,000 ເຕັມທຸກຫຼືຈຸດສະກົມຂອງເຄືອຂ່າຍທຸກເຫົາ. SeaPRwire ເຫົາສະເຫຼີມຄວາມຫນັງສືອື່ງສະຫຼວມພາສາຫຼາຍປະເທດ, ເຊັ່ນ ອັງກິດ, ຍີປຸນ, ເຢຍ, ຄູຣີ, ຝຣັ່ງ, ຣັດ, ອິນໂດ, ມາລາຍ, ເຫົາວຽດນາມ, ລາວ ແລະ ພາສາຈີນ.
