paint-brush
2025 AI නියෝජිතයින්ගේ වසර විය හැකිය, ඔවුන්ට ව්‍යවසාය අපායෙන් බේරීමට හැකි නම්විසින්@yahiabsat
8,561 කියවීම්
8,561 කියවීම්

2025 AI නියෝජිතයින්ගේ වසර විය හැකිය, ඔවුන්ට ව්‍යවසාය අපායෙන් බේරීමට හැකි නම්

විසින් Yahia Bsat15m2025/01/13
Read on Terminal Reader

දිග වැඩියි; කියවීමට

AI නියෝජිතයන් ව්‍යවසාය ස්වයංක්‍රීයකරණයේ නවෝත්පාදනයන් ගෙන යමින්, සංකීර්ණ කාර්ය ප්‍රවාහයන් සඳහා අවසානය දක්වා විසඳුම් ලබා දෙයි. කෙසේ වෙතත්, පද්ධති අභිරුචිකරණය, බිඳෙනසුලු GUIs සහ සත්‍යාපන බාධක වැනි අභියෝග පූර්ණ ස්වයංක්‍රීයකරණය නොපැහැදිලි කරයි. Claude Computer Use, BrowserBase, සහ Salesforce's AgentForce වැනි විශේෂිත මෙවලම් පොරොන්දුව පෙන්වන නමුත් සීමිතව පවතී. අනාගතය පවතින්නේ වසම්-විශේෂිත නියෝජිතයන් පටු කාර්යයන් සමඟ කටයුතු කරන අතර ක්‍රමයෙන් අන්තර් සම්බන්ධිත ස්වයංක්‍රීයකරණයන් කරා ගොඩනැංවීමයි.
featured image - 2025 AI නියෝජිතයින්ගේ වසර විය හැකිය, ඔවුන්ට ව්‍යවසාය අපායෙන් බේරීමට හැකි නම්
Yahia Bsat HackerNoon profile picture

දශක ගණනාවක් තිස්සේ, ව්‍යාපාර පසු කාර්යාල කාර්යයන්, දත්ත ඇතුළත් කිරීම්, බිල්පත් ක්‍රියාවලීන් සහ වෙනත් පුනරාවර්තන කාර්ය ප්‍රවාහයන් ස්වයංක්‍රීය කිරීමට උත්සාහ කර ඇත. නමුත් මෘදුකාංගය පරිණාමය වී ඇතත්, බොහෝ ව්‍යවසායන් සඳහා සැබෑ අන්තයේ සිට අවසානය දක්වා ස්වයංක්‍රීයකරණය නොපැහැදිලි වේ. දැන්, විශාල භාෂා මාදිලියේ (LLMs) සීඝ්‍ර නැගීමත් සමඟ සහ ස්වයංක්‍රීයව තර්ක කිරීමට සහ ක්‍රියා කිරීමට හැකියාව ඇති “AI නියෝජිතයන්” බිහිවීමත් සමඟ, 2025 අවසානයේ ව්‍යවසාය ස්වයංක්‍රීයකරණයේ සැලකිය යුතු ඉදිරි පිම්මක් දකින වසර විය හැකි බවට විශ්වාසයක් වර්ධනය වෙමින් පවතී.


සෑම් ඇල්ට්මන් ප්‍රසිද්ධියේ ප්‍රකාශ කර ඇත්තේ “2025 දී, පළමු AI නියෝජිතයන් ශ්‍රම බලකායට එකතු වී සමාගම්වල ප්‍රතිදානය ද්‍රව්‍යමය වශයෙන් වෙනස් කිරීම අපට දැකිය හැකි” බවත්, මාර්ක් බෙනියෝෆ් විකුණුම් බලකාය “AgentForce” දෙසට යොමු කරන්නේ අනාගතයක් අපේක්ෂාවෙන් බව ය. විශේෂිත නියෝජිතයින්ට. මෙම අනාවැකි කේන්ද්‍රීය ප්‍රශ්නයක් මතු කරයි: AI නියෝජිතයින්ට සැබෑ ලෝක ව්‍යවසාය පද්ධතිවල සංකීර්ණ බාධක ජය ගත හැකිද? මෙම ලිපියෙන්, අපි ව්‍යවසාය ස්වයංක්‍රීයකරණයේ අද්විතීය දුෂ්කරතා පරීක්ෂා කර අද දින පොරොන්දු වූ (නමුත් තවමත් කල් පිරෙන) විසඳුම් කිහිපයක් ගවේෂණය කරන්නෙමු. අපි නව ගිණුමක් සඳහා නැවත විකුණුම් ඇණවුමක් නිර්මාණය කරමින් - - තිරය පිටුපස සැඟවී ඇති සංකීර්ණත්වය හෙළි කරන - සේල්ස්ෆෝර්ස් (SFDC) හි පෙනෙන සරල කාර්ය ප්‍රවාහයක් සමඟ ප්‍රායෝගික පරීක්ෂණ බෙදා ගන්නෙමු.

ව්‍යවසාය ස්වයංක්‍රීයකරණය එතරම් අභියෝගාත්මක වන්නේ ඇයි?

කඩදාසි මත, ව්‍යවසාය කාර්යයන් ස්වයංක්‍රීය කිරීම සරල ලෙස පෙනේ: ලොග් වීමට ස්ක්‍රිප්ට් එකක් කරකවන්න, පෝරම පුරවන්න, සහ "ඉදිරිපත් කරන්න" ක්ලික් කරන්න. ප්රායෝගිකව, සංකීර්ණත්වය විශ්මයජනකයි. ව්‍යවසායයන් Salesforce, SAP, Oracle, සහ බොහෝ ස්වදේශීය විසඳුම් වැනි වාර්තාගත පද්ධති ගණනාවක් මත රඳා පවතී. සෑම පද්ධතියකටම තමන්ගේම වෙබ් අවසර, සත්‍යාපන ප්‍රවාහ සහ අභිරුචි ව්‍යාපාරික තර්ක ඇත. එපමණක්ද නොව, මෙම පද්ධති බොහෝ විට දැඩි ලෙස අභිරුචිකරණය කර ඇත. ව්‍යාපාරයෙන් ව්‍යාපාරයට වෙනස් වන විශේෂිත UI, අමතර දත්ත ක්ෂේත්‍ර සහ නියමිත වැඩ ප්‍රවාහයන් දැකීම සාමාන්‍ය දෙයකි.


MuleSoft සහ Deloitte විසින් කරන ලද ඒකාබද්ධ සමීක්ෂණයකට අනුව, විශාල ව්‍යවසායන් දෛනික මෙහෙයුම් සඳහා සහාය වීම සඳහා සාමාන්‍යයෙන් විවිධ පද්ධති 976ක් භාවිතා කළ හැකිය ( මූලාශ්‍රය ). මෙම ඛණ්ඩනය යන්නෙන් අදහස් වන්නේ ස්වයංක්‍රීය මෙවලමක් බහු පද්ධති සමඟ කතා කළ යුතු බවයි, ඒ සෑම එකක්ම එහි සූක්ෂ්මතාවයෙන් යුක්ත වේ. සමහරක් ශක්තිමත් API සහිත, අනෙක් ඒවා කිසිසේත්ම නැත. බොහෝ විට, සරලම කාර්යයන් වන්නේ පැරණි, ලෙගසි යෙදුම් සහ නව වලාකුළු මත පදනම් වූ සේවාවන් හරහා දත්ත සම්බන්ධ කිරීමයි. අභිරුචි කාර්ය ප්‍රවාහ සහ තුන්වන පාර්ශ්ව ඒකාබද්ධ කිරීම් ක්‍රියාත්මක වූ පසු Salesforce වැනි සම්මත වේදිකා පවා ලිබිරින්තියක් බවට පත්විය හැකිය.


මෙම පසුබිමට එරෙහිව, LLM බලයෙන් ක්‍රියා කරන නියෝජිතයන් වඩාත් නම්‍යශීලී ප්‍රවේශයක් පොරොන්දු වෙති: ඔවුන්ට දත්ත විග්‍රහ කිරීමට, ඊළඟ පියවර ගැන තර්ක කිරීමට සහ සංකීර්ණ GUIs සැරිසැරීමට පවා හැකිය - අවම වශයෙන් න්‍යායාත්මකව. නමුත් පහත උදාහරණයෙන් ඔබට පෙනෙන පරිදි, මූලික විකුණුම් බලකායේ කාර්ය ප්‍රවාහයක් පවා මිනිස් උදව් නොමැතිව සිදු කිරීමට AI නියෝජිතයෙකු ලබා ගැනීමේ යථාර්ථය බොහෝ දෙනා වටහා ගන්නවාට වඩා සංකීර්ණ ය.

ප්‍රායෝගික උදාහරණයක්: විකුණුම් බලකායේ අභිරුචි නැවත විකුණුම් ඇණවුමක් නිර්මාණය කිරීම

කාර්යය

ඔබ සේල්ස්ෆෝර්ස් භාවිතා කරන පාපැදි නිෂ්පාදන සමාගමක විකුණුම් සහකරුවෙකු බව සිතන්න. ඔබ මේ දැන් විශාල Dynamo X1 බයිසිකලයක් ඩොලර් 5,000 කට “Northern Trail Cycling” නමින් නව අලෙවිකරුවෙකුට විකුණා ඇත. ඔබේ කාර්යය වන්නේ:

1 - Salesforce වෙත සත්‍යාපනය කරන්න (සපයා ඇති අක්තපත්‍ර සමඟ).

2 - නැවත විකුණන්නා සඳහා නව ගිණුමක් සාදන්න.

3 - නැවත විකුණුම් ඇණවුමක් සාදා රේඛා අයිතමය (බයිසිකලය) එක් කරන්න.

4 - එම ඇණවුම අනුමැතිය සඳහා නිෂ්පාදනයට ඉදිරිපත් කරන්න.


සාර්ථක ක්‍රියාවක් සඳහා, අවසාන ප්‍රතිඵලය පහත පරිදි දිස්වනු ඇතැයි අපි බලාපොරොත්තු වෙමු:

SalesForce හි සාර්ථක අභිරුචි ප්‍රවාහ ක්‍රියාත්මක කිරීම


එය ප්‍රමාණවත් තරම් සරල බව පෙනේ, නමුත් යක්ෂයා විස්තර වල සිටී. සමාගමේ විකුණුම් බලකා නිදසුන අභිරුචිකරණය කර ඇත: එය අභිරුචි “නැවත විකුණුම් ඇණවුම්” වස්තුවක් සහ ප්‍රවාහයක්, නිෂ්පාදන එකතු කිරීම සඳහා විශේෂ ඇදගෙන යාමේ විශේෂාංගයක් සහ පැහැදිලි ලේබල් කිරීමකින් තොරව සැඟවුණු “නිෂ්පාදනයට ඉදිරිපත් කරන්න” පියවරක් භාවිතා කරයි. ඒවා මැනිය හැකි ආකාරය බැලීමට නැගී එන AI-ධාවන ස්වයංක්‍රීයකරණ ප්‍රවේශයන් කිහිපයක් භාවිතා කරමින් මම මෙම දර්ශනය පරීක්ෂා කළෙමි.

ක්ලෝඩ් පරිගණක භාවිතය

එය කුමක් ද?

ක්ලෝඩ් පරිගණක භාවිතය යනු ක්ලෝඩ් 3.5 සොනෙට් v2 සමඟ හඳුන්වා දුන් ඇන්ත්‍රොපික් වෙතින් නව විශේෂාංගයකි. එය ක්ලෝඩ්ට "දකින්න" සහ "පාලනය" සඳහා සම්පූර්ණ බහාලුම් කරන ලද ඩෙස්ක්ටොප් පරිසරයක් ලබා දීමෙන් සම්මත LLM ශ්‍රිත-ඇමතුම් ආදර්ශය තවත් පියවරක් ඉදිරියට ගෙන යයි. එයට තිර රූ ග්‍රහණය කර ගැනීමට, දෘශ්‍ය/අවකාශීය තර්කනය හරහා ඒවා අර්ථකථනය කිරීමට සහ මූසික ක්ලික් කිරීම්, අනුචලන සහ යතුරු එබීම් වැනි OS මට්ටමේ ක්‍රියා සිදු කිරීමට හැකිය.


පරිශීලකයාගේ දෘෂ්ටිකෝණයෙන්, ඔබ ක්ලෝඩ්ට ඉහළ මට්ටමේ කාර්යයක් ලබා දෙයි (“සේල්ස්ෆෝර්ස් වෙත ලොග් වී මෙම නැවත විකුණුම් ඇණවුම සාදන්න”), සහ ක්ලෝඩ් එය හරියටම කිරීමට උත්සාහ කරයි. එය අනුපිළිවෙලක් හරහා ලූප් වේ:

  1. තිර රුවක් අල්ලා එය අර්ථ නිරූපණය කිරීම.
  2. UI ක්‍රියා නිකුත් කිරීම (මූසික ක්ලික් කිරීම්, යතුරු එබීම්, bash විධාන).
  3. කාර්යය සම්පූර්ණ වන තුරු (නැතහොත් එය අත්හරින) නැවත නැවත කිරීම.

එය පරීක්ෂණයට ලක් කිරීම

පද්ධති විමසුමට කිසිදු වෙනසක් නොමැතිව Anthropic's reference ක්රියාත්මක කිරීමේ සරලම ප්රවේශය සමඟ ආරම්භ කරමු. ආරම්භක විමසුම, ක්ලෝඩ්ගේ යෝජිත සැලැස්ම සහ එය අන්තර්ක්‍රියා ආරම්භ කරන ඩෙස්ක්ටොප් එක පෙන්වන අන්තර්ක්‍රියාවේ ආරම්භය මෙන්න.


ක්ලෝඩ් පරිගණක භාවිතය සමඟ ප්‍රවාහයේ ආරම්භය ක්ලෝඩ් වෙතින් විමසුම සහ සැලැස්ම පෙන්වයි


ක්ලෝඩ්ගේ බහාලුම් කරන ලද ඩෙස්ක්ටොප් එක නිරීක්ෂණය කිරීම මුලදී සිත් ඇදගන්නා සුළු විය. එය බ්‍රවුසරය විවෘත කර, සේල්ස්ෆෝර්ස් URL වෙත ගොස්, සපයා ඇති අක්තපත්‍ර සමඟින් පුරනය වී, "ගිණුම්" වෙත සංචාලනය විය. එය පාපැදි නිෂ්පාදන සමාගම සඳහා දෝෂ රහිතව නව ගිණුමක් සාදා, පෝරමයට නිවැරදි විස්තර ඇතුළත් කර, පසුව නව නැවත විකුණුම් ඇණවුමක් නිර්මාණය කිරීමට උත්සාහ කළේය. බයිසිකලය එකතු කිරීම සඳහා අභිරුචි ඇදගෙන යාමේ අතුරු මුහුණත හමු වන තෙක් දේවල් සුමටව සිදුවෙමින් පැවතුනි. පික්සල් මත පදනම් වූ ඇදගෙන යාමක් සිදු කිරීමට උත්සාහ කරමින් පද්ධතිය සිරවී ඇත.


ක්ලෝඩ් බයිසිකලය ඇදගෙන යාමට අසමත් වේ. උත්සාහයන් කිහිපයකින් පසු එය විකල්ප මාර්ග සෙවීමට පටන් ගත්තේය.


අසාර්ථක කිහිපයක් පසු, එය විකල්ප ක්රමයක් සොයා ගැනීමට උත්සාහ කළා (සැඟවුණු "අයිතම එකතු කරන්න" බොත්තම වැනි). "සංස්කරණය" බොත්තම සමඟ එය පළමු උත්සාහය සාර්ථක වූයේ නැත.

“සංස්කරණ සංවාදයේ නිෂ්පාදන එකතු කිරීමට පැහැදිලි ක්‍රමයක් නොමැති බව මම දකිමි. වෙනත් විකල්ප තිබේදැයි බැලීමට Reseller Orders dropdown මත ක්ලික් කිරීමෙන් මට වෙනස් ප්‍රවේශයක් උත්සාහ කිරීමට ඉඩ දෙන්න”.


"අදාළ" ටැබය හරහා නව අයිතම එකතු කිරීමේ ක්‍රමයක් සොයා ගැනීමෙන් එය අවසානයේ එහි මාර්ගය සොයා ගත්තේය - යෙදුමේ ගතික ප්‍රේරක මඟින් ඇණවුම් එකතුව ස්වයංක්‍රීයව යාවත්කාලීන නොකරන විට පමණක් අසාර්ථක විය. SFDC යෙදුමේ සංවර්ධකයින් මෙම කේත මාර්ගය සංවර්ධනය සම්පූර්ණ කළේ නැත, මිනිස් පරිශීලකයා ඇදගෙන යාමේ ක්‍රමය අනුගමනය කරනු ඇතැයි අපේක්ෂා කරයි. කෙටියෙන් කිවහොත්, ප්‍රවාහය නිර්මාණය කර ඇත්තේ මිනිසුන් සඳහා මිස AI නියෝජිතයෙකු සඳහා නොවේ.


පළමු වාර කිහිපය අසාර්ථක වීමෙන් පසුව ක්ලෝඩ් සොයාගත් අයිතම එකතු කිරීමට විකල්ප මාර්ගය. පෙනෙන ආකාරයට නිවැරදි වුවත්, මෙම ප්‍රවාහය ඇණවුමේ එකතුව නැවත ගණනය කිරීම අවුලුවන්නේ නැත.


Claude පසුව අභිරුචි ටැබ් එකක් යටතේ වළලනු ලැබූ "නිෂ්පාදනයට ඉදිරිපත් කරන්න" බොත්තම සොයා ගැනීමට උත්සාහ කළේය. එම පියවර පිළිබඳ පූර්ව දැනුමක් නොමැතිකම නිසා එය තවත් මිනිත්තු කිහිපයක්ම ගැහෙන්නට විය. අවසානයේදී, මට මැදිහත් වීමට සිදු විය, ඇණවුමට බයිසිකලය අතින් එකතු කර, අදාළ බොත්තම වෙත ක්ලෝඩ් යොමු කරන්න. දළ වශයෙන් මිනිත්තු 10 කට පසුව සහ $0.80 පමණ භාවිත පිරිවැයෙන් පසුව, ක්‍රියාවලිය තවමත් සම්පූර්ණයෙන් ස්වයංක්‍රීය වී නොමැත. Anthropic මෙම විශේෂාංගය පර්යේෂණාත්මක ලෙස හඳුන්වන්නේ මන්දැයි බැලීම පහසු විය: පරිගණක භාවිතය සැබවින්ම නිෂ්පාදනයට සූදානම් වීමට පෙර බොහෝ සැබෑ ලෝක ආරක්ෂක වැටවල් සහ වැඩිදියුණු කිරීම් අවශ්‍ය වේ.

එය වඩා හොඳ විය හැකිද?

එහි රළු දාර තිබියදීත්, සංකල්පය උද්යෝගිමත් ය. GUI අන්තර්ක්‍රියා සඳහා දැක්ම-පාදක AI වේගයෙන් දියුණු වෙමින් පවතින අතර අනුමාන සඳහා පිරිවැය වක්‍රය ඉක්මනින් පහත වැටේ. මෑතකාලීන a16z අධ්‍යයනයකින් පෙනී යන්නේ එකම කාර්ය සාධනය සඳහා LLM පිරිවැය වසරකට 10x පමණ අඩු වන බවයි. ප්‍රතිපත්තිමය වශයෙන්, ක්ලෝඩ්ගේ අනාගත අනුවාදයන් ඇදගෙන යාම වැනි දෘශ්‍ය/අවකාශීය කාර්යයන් වලදී වේගවත්, ලාභදායී සහ වඩාත් නිවැරදි විය හැකිය.


එහෙත් මූලික ගැටළුව වන්නේ ව්‍යවසාය UIs, විශේෂයෙන් පැරණි හෝ දැඩි ලෙස අභිරුචිකරණය කරන ලද ඒවා, ස්වයංක්‍රීයකරණය මනසේ තබාගෙන ගොඩනගා ඇත්තේ කලාතුරකිනි. පික්සල් මට්ටමේ අන්තර්ක්‍රියා බිඳෙන සුළුය. පිරිසැලසුමෙහි සුළු වෙනස්කම් හෝ ගතික උත්පතන සම්පූර්ණ ප්‍රවාහයම බිඳ දැමිය හැක. දෘශ්‍යමය වශයෙන් පදනම් වූ GUI රාමු වටා පර්යේෂණ වර්ධනය වෙමින් පවතී, නමුත් විවිධ කාර්ය ප්‍රවාහ සිය ගණනක් සඳහා මෙම නිෂ්පාදන ශ්‍රේණිගත කිරීම ප්‍රධාන කාර්යයකි.

හිස නැති බ්‍රව්සර්: GUI සම්පූර්ණයෙන්ම මඟ හැරීම

එක් විකල්ප ප්‍රවේශයක් නම් "දෘෂ්‍ය මායිම් පෙට්ටි" සම්පූර්ණයෙන්ම නොසලකා හැරීමයි. ඔබගේ ඉලක්ක යෙදුම වෙබ් බ්‍රවුසරයක් තුළ ක්‍රියාත්මක වන්නේ නම්, ඔබට DOM මට්ටමින් ස්වයංක්‍රීයකරණය කළ හැක, තිරපිටපත් සහ පික්සල් මත පදනම් වූ අන්තර්ක්‍රියා මඟ හැරිය හැක. Playwright සහ Selenium වැනි සාම්ප්‍රදායික හිස් බ්‍රව්සර් බොහෝ විට පරීක්ෂණ රාමු සමඟ සම්බන්ධ වී ඇති අතර, නව පරම්පරාවේ AI භාවිතය-කේස්-නාභිගත හිස රහිත බ්‍රව්සර් මතුවෙමින් තිබේ. මෙම නව වේදිකා වඩාත් ගතික, LLM-බලවත් අන්තර්ක්‍රියා සක්‍රීය කිරීම සඳහා Playwright සහ Selenium මත ගොඩනැගේ.

BrowserBase

BrowserBase එවැනි එක් උදාහරණයකි. එය සංවර්ධකයින්ට බහාලුම් කළමනාකරණය කිරීමට අවශ්‍ය නොවී බ්‍රව්සර් සැසි සත්කාරක සහ පරිමාණය කරන යටිතල පහසුකම් වේදිකාවක් ලෙස ක්‍රියා කරයි. අන්තර්ක්‍රියා රටාව භ්‍රමණය වන්නේ පිටුවක HTML අන්තර්ගතය ඒවායේ xPaths වෙත සිතියම්ගත කර ඇති සංරචක (උදා, ආකෘති, බොත්තම්) බවට විග්‍රහ කිරීම සහ මෙම ව්‍යුහය ඔබ කැමති LLM වෙත ලබා දීමයි. සාම්ප්‍රදායික GUI ක්ලික් කිරීම් වලට වඩා කේතය හරහා DOM සමඟ අන්තර්ක්‍රියා කිරීමට ඉඩ සලසමින් ක්‍රියාත්මක කිරීමට LLM ඊළඟ Playwright කේතය ජනනය කරයි. එය සම්පූර්ණයෙන්ම හිස් නැති නිසා, එය අඩු හෝ තිර රූ භාවිතා කරයි, සන්දර්භය දිග කෙටි සහ ප්‍රමාදය සම්පූර්ණ “ඩෙස්ක්ටොප් පරිසරය” ප්‍රවේශයකට වඩා අඩු කරයි.


වඩාත් මෑතකදී, BrowserBase සංවර්ධකයින්ට දේවල් පහසු කිරීම සඳහා එහි StageHand විවෘත මූලාශ්‍ර පුස්තකාලය නැව්ගත කරන ලදී. මුල් ආකෘතියේ, අන්තර්ක්‍රියා තවමත් ඉතා අතින් සිදු වූ අතර, සංවර්ධකයින්ට ප්ලේරයිට් කේතය කෙලින්ම ලිවීම සහ HTML අතින් විග්‍රහ කිරීම ඇතුළුව හිස් බ්‍රවුසරයේ පහත් මට්ටමේ විස්තර සමඟ වැඩ කිරීමට අවශ්‍ය විය. StageHand සමඟින්, BrowserBase විසින් සංවර්ධකයින්ට අභිප්‍රාය මත පදනම් වූ ස්වභාවික භාෂා විධාන භාවිතා කිරීමට ඉඩ සලසමින්, "navigate" හෝ "extract" ලබා දෙයි. මෙම ප්‍රවේශය සමහර සැකසුම් වලදී අමු HTML සංරචක බවට පරිවර්තනය කරයි, LLM හට කාර්යයන් හැසිරවීම පහසු කරයි. කෙසේ වෙතත්, StageHand විසින්ම ගොඩනඟන ලද වාද්‍ය වෘන්දයක් ලබා නොදෙන බැවින්, පරිශීලකයින්ට කාර්ය ප්‍රවාහ සම්බන්ධ කිරීමට සහ කළමනාකරණය කිරීමට ඔවුන්ගේම වාද්‍ය වෘන්ද ස්ථර නිර්මාණය කිරීමට අවශ්‍ය වේ.


BrowserBase පරීක්‍ෂා කිරීම සඳහා, මම ඔවුන්ගේ සංවර්ධක ක්‍රීඩා පිටිය භාවිතා කළෙමි, එය Playwright කේතය ලිවීම සඳහා කොන්සෝලයක් සහ එම ස්ක්‍රිප්ට් ස්වයංක්‍රීයව නිෂ්පාදනය කිරීමට LLM ප්‍රේරක ලේඛකයෙකු සපයයි. අදහස බහු-පියවර සංචාලනය සිදු කිරීමයි - ලොග් වන්න, ගිණුමක් සාදන්න, නැවත විකුණුම් ඇණවුමක් සාදන්න. නමුත් වේදිකාව ඔබ විසින්ම පියවර සංවිධානය කිරීමට බලාපොරොත්තු වේ. ක්ලෝඩ් වෙත ලබා දුන් ප්‍රොම්ප්ට් එකෙන්ම පටන්ගෙන, බ්‍රව්සර් බේස් බහු-පියවර ආකාරයෙන් තර්ක කළ නොහැකි නිසා පැකිලී ගියේය. ඒ නිසා මම එක් එක් පියවර සඳහා ස්වභාවික භාෂා ප්‍රේරකයක් සැපයීමට සහ උත්පාදනය කරන ලද නාට්‍ය රචක කේතය අපේක්ෂිත දේ කරන්නේ දැයි නිරීක්ෂණය කිරීමට මම කටයුතු කළෙමි. පහත තිර රුවෙහි, ඔබට විමසුම් මාලාව සහ ඒවායේ ජනනය කරන ලද Playwright කේතය දැකිය හැක.


SFDC නැවත විකුණුම් ඇණවුම් නිර්මාණය කිරීමේ කාර්ය ප්‍රවාහය ස්වයංක්‍රීය කිරීමට අතින් උත්සාහයක් අතරතුර BrowserBase ක්‍රීඩා පිටිය


ප්‍රායෝගිකව, මම ක්‍රීඩා පිටියේ බ්‍රවුසර පරිසරය සහ පිරවිය යුතු HTML පෝරම අතර වරින් වර නොගැලපීම් වලට ලක් විය. බොත්තම් අමුතු ලෙස විදහා දක්වයි, පොරොත්තු කාලය දීර්ඝ විය, සහ පෝරම ක්ෂේත්‍ර බලාපොරොත්තු වූ පරිදි හරියටම පූරණය නොවීය. මෙම දෝෂ තිබියදීත්, LLM-ජනනය කරන ලද Playwright කේතය පුරනය වීමට, ගිණුමක් සෑදීමට සහ නැවත විකුණුම් ඇණවුම් පෝරමය අර්ධ වශයෙන් පිරවීමට සමත් විය. කෙසේ වෙතත්, අයිතමය එක් කිරීමට ඇද දැමීම නැවතත් බාධාවක් විය. මම එය අත්හැරීමට පෙර විනාඩි හතක් පමණ ගත කළෙමි. එවැනි ආකාරයේ ස්වයංක්රීයකරණය සඳහා වේදිකාව තවමත් සුදුසු නොවන බව පැහැදිලි විය. වෙබ් සීරීම් භාවිත අවස්ථා සඳහා එය වඩාත් හොඳින් ක්‍රියා කරයි.

ස්කයිවර්න්

Skyvern යනු පෙරනිමියෙන් වාද්‍ය වෘන්දය එක් කරන වඩාත් සියල්ලෙන් එක හිස් ප්‍රවේශයකි. BrowserBase මෙන් නොව, පරිශීලකයින්ට පියවර අතින් නිර්වචනය කිරීමට සහ කළමනාකරණය කිරීමට අවශ්‍ය වේ, Skyvern කොටුවෙන් පිටත වාද්‍ය වෘන්දය හැසිරවීමට උත්සාහ කරයි. හුඩ් යටතේ, එය BrowserBase හා සමානව ක්‍රියා කරයි - ඔවුන්ගේ විවෘත කේත කේතයේ පෙනෙන පරිදි - නමුත් පියවර ගැන සැලසුම් කිරීමට සහ තර්ක කිරීමට හැකි වෙබ් නියෝජිතයෙකු ද එක් කරයි. තීරණ ගැනීමේදී සහය වීමට උකහා ගත් සංරචක සහ ඒවායේ xPaths සමඟින් LLM වෙත තිර රූ යවන විකල්ප දර්ශන මාදිලියක් මෙයට ඇතුළත් වේ.


BrowserBase හි අතින් පියවර නිර්මාණය කිරීමේ සීමාවන් ආමන්ත්‍රණය කිරීම සඳහා, මම Skyvern එහි කළමනා කළ සේවාව භාවිතා කර පරීක්ෂා කිරීමට තීරණය කළෙමි, විශේෂයෙන් කාර්ය ප්‍රවාහ මාදිලිය කෙරෙහි අවධානය යොමු කරමි. මෙම මාදිලිය බහු-පියවර ක්‍රියාවලි සඳහා නිර්මාණය කර ඇති අතර, එය අපගේ විකුණුම් බලකායේ කාර්ය ප්‍රවාහය සමඟ කෙතරම් හොඳින් ක්‍රියා කරයිද යන්න ඇගයීමට මට අවශ්‍ය විය. අවාසනාවන්ත ලෙස, ධාවනය සඳහා තාර්කික පියවර 15කට වඩා වැඩි ප්‍රමාණයක් සහ $1 බැර කිරීම් ද්වි-සාධක සත්‍යාපනය (2FA) ක්‍රියාවලිය තුළ සිරවී ඇත. Skyvern හි සත්කාරක IP සලකුණු කරන ලද අතර, 2FA ක්‍රියාවට නංවන ලද අතර, තත්වය මග හැරීම සඳහා අතින් කේතයක් සැපයීමට හෝ කුකියක් බෙදා ගැනීමට ක්‍රමයක් නොතිබුණි. මෙය ව්‍යවසාය සැකසීම් තුළ පවතින සත්‍යාපනයේ අභියෝගය ඉස්මතු කරන අතර AI නියෝජිතයින් සඳහා වන සත්‍යාපන විසඳුම් කෙරෙහි පමණක් අවධානය යොමු කිරීමට Anon වැනි ආරම්භකයින් මතුවන්නේ මන්දැයි අවධාරනය කරයි.


Skyvern ගේ කණ්ඩායම සරල, කුඩා කාර්යයන් සඳහා වේදිකාව සුදුසු ලෙස ස්ථානගත කරයි, සම්බන්ධතා පෝරම ස්වයංක්‍රීයකරණය මූලික සහය දක්වන භාවිත අවස්ථාව වේ. වෙනත් විභව භාවිත අවස්ථා (උදා: රැකියා, ඉන්වොයිසි) තවමත් "පුහුණුවේ" ලෙස ලැයිස්තුගත කර ඇත, එයින් පෙන්නුම් කරන්නේ වේදිකාව ආරම්භ වන්නේ ව්‍යවසාය කාර්ය ප්‍රවාහවල වඩාත් සංකීර්ණ අවශ්‍යතාවලට වඩා සරල භාවිත කේස්ඩ් නාභිගත ස්වයංක්‍රීයකරණයෙනි. පොරොන්දු වූවත්, Skyvern එහි වර්ධනයේ මෙම අදියරේදී අඩු සංකීර්ණ අවස්ථා සඳහා වඩාත් සුදුසු බව පැහැදිලිය.

වෙළඳාම්

Headless browsers pixel-level guesswork මඟහරින අතර, එය බොහෝ විට අඩු දෝෂ සහ වේගවත් ක්‍රියාවට මග පාදයි. නමුත් ඔබ ඇද-ඇඳ-හැරීම හෝ සංකීර්ණ තනි පිටු යෙදුම් වැනි උසස් විශේෂාංගවලට පහර දුන් විගස, ඔබට අර්ධ තිරපිටපත් විශ්ලේෂණයට හෝ විශේෂිත කේතය වෙත ආපසු යාමට අවශ්‍ය විය හැකිය. බ්‍රවුසර 2FA සහ IP අසාදු ලේඛනයට ද ධාවනය විය හැක. බහු කුලී නිවැසියන්ගේ ව්‍යවසාය යෙදුම් සඳහා, සත්‍යාපනය පමණක් උපක්‍රමශීලී විය හැකි අතර, ඔබට තවමත් අභිරුචි වාද්‍ය වෘන්ද ස්ථර අවශ්‍ය විය හැක.


තවත් සීමාවක් නම්, මෙම වේදිකා කාර්ය ප්‍රවාහය ක්‍රියාත්මක කරන සෑම අවස්ථාවකම LLM හරහා ගතිකව කේතය ජනනය කිරීම මත රඳා පවතී. LLM නෛසර්ගිකව නිර්ණය නොවන බැවින්, ප්‍රතිදානය කරන ලද කේතය ධාවන හරහා වෙනස් විය හැක, එය විගණනය කිරීම හෝ අනුකූලතාව තහවුරු කිරීම අභියෝග කරයි. මෙම අනපේක්ෂිත බව ගැටළු වලට හේතු විය හැක, විශේෂයෙන්ම සංවේදී කාර්ය ප්රවාහය තුළ. ජනනය කරන ලද කේතය හැඹිලිගත කිරීම සමහර වේදිකා සඳහා මාර්ග සිතියමේ ඇති බව පෙනේ, එය LLMs සඳහා සැලකිය යුතු අභියෝග මතු කරයි. අනුමාන කිරීමේදී ක්ෂණිකව හෝ කණ්ඩායම් සැකසීමේ සුළු වෙනස්කම් පවා සම්පූර්ණයෙන්ම වෙනස් ප්‍රතිඵල ඇති කළ හැකි අතර එය හැඹිලි ක්‍රියාවලිය සංකීර්ණ කරයි.


සමස්තයක් වශයෙන්, හිස් රහිත බ්‍රවුස් කිරීම සම්පූර්ණ GUI හැසිරවීමට වඩා ලාභදායී සහ ස්ථායී විය හැකි නමුත් එය ඉන්ද්‍රජාලික නිවැරදි කිරීමකින් බොහෝ දුරස් වේ. BrowserBase සහ Skyvern වැනි බොහෝ විසඳුම්, "සියල්ල ස්වයංක්‍රීය කිරීමට එක් වේදිකාවක්" වීමට වඩා පටු භාවිත අවස්ථා (උදා, ආකෘති, දත්ත නිස්සාරණය) කෙරෙහි අවධානය යොමු කරයි.

ප්‍රතිලෝම ඉංජිනේරු අභ්‍යන්තර API

තුන්වන ප්‍රවේශය නම් ඔබ අවට ක්ලික් කරන විට සිදුවන ජාල ඇමතුම් වලට බාධා කිරීමෙන් වෙබ් පිටුව සම්පූර්ණයෙන්ම මඟ හැරීමයි. ඔබට ඔබේ බ්‍රවුසරය යවන ඉල්ලීම් ග්‍රහණය කර ගත හැකි නම්, ඔබට එම ඇමතුම් කේතයෙන් ප්‍රතිනිර්මාණය කළ හැක. ප්‍රතිපත්තිමය වශයෙන්, මෙය අවුල් සහගත UI-පාදක පියවර මඟහරින අතර ඔබ ඔබේ යෙදුම භාවිතා කරන පසුබිම් තර්කයටම පහර දෙන බව සහතික කරයි. ප්‍රතිලෝම-ඉංජිනේරු API දිගු කලක් තිස්සේ පවතින බැවින් මෙම ප්‍රවණතාවය සම්පූර්ණයෙන්ම අලුත් නොවේ. කෙසේ වෙතත්, නව එකතු කිරීම යනු ජාල ඉල්ලීම් ගැන තර්ක කිරීම සඳහා AI නියෝජිතයෙකු ඇතුළත් කර ඇති අතර, ක්‍රියාවලිය වඩාත් බුද්ධිමත් සහ අනුවර්තනය විය හැකිය.


මාස කිහිපයකට පෙර, Integuru නම් නිෂ්පාදනයක් Hackernews හි දියත් කරන ලද අතර එහි විවෘත මූලාශ්‍ර ප්‍රවේශය සහ නව ක්‍රමවේදයන් සඳහා අවධානය දිනා ගෙන ඇත. එහි විභවය ගැන කුතුහලයට පත් වූ මම එය පරීක්ෂා කිරීමට තීරණය කළෙමි, එහි රසවත් ප්‍රස්තාර-පාදක ප්‍රවේශය සහ ජාල ඉල්ලීම් ගැන තර්ක කිරීමට AI නියෝජිතයින් ඒකාබද්ධ කිරීම. ස්වයංක්‍රීයකරණයේ කාලය සහ පිරිවැය දැඩි ලෙස කපා හැරීමේ පොරොන්දුව එය ගවේෂණය කිරීමට බලගතු විකල්පයක් බවට පත් කළේය.


Integuru හි ගබඩාව සාපේක්ෂව අලුත් නමුත් පොරොන්දුව පෙන්වයි. එහි හරය, එය කාර්යයක් අතරතුර Chromium හි සියලුම ජාල තදබදය සහ කුකීස් වාර්තා කරයි. එය පසුව ඉල්ලීම්වල ප්‍රස්ථාර නිරූපණයක් නිර්මාණය කරයි, කුමන පිටු අවසන් ලක්ෂ්‍ය ලෙස හඳුන්වන්නේ දැයි සිතියම්ගත කරයි. මෙම ප්‍රස්ථාරය භාවිතා කරමින්, එය සංක්‍රමණයක් සිදු කරයි, එකම ඉල්ලීම් නැවත ධාවනය කරන සෑම නෝඩයක් සඳහාම කේතය උත්පාදනය කිරීම සඳහා එය LLM වෙතට යවයි, අවශ්‍ය පරිදි ඔබේ ගතික පරාමිතීන් (“බයික් නිෂ්පාදන සමාගම” වැනි) එන්නත් කර පරායත්තතා මත පදනම්ව ඒවා එකට එකතු කරයි. මෙම ප්‍රවේශය න්‍යායාත්මකව ස්වයංක්‍රීයකරණ ක්‍රියාවලිය සැලකිය යුතු ලෙස විධිමත් කළ හැක.


SFDC කාර්ය ප්‍රවාහයේ Integuru හි පටිගත කිරීමෙන් ප්‍රතිදානය. වම් පසින් කුකීස් සහ ජාල ඉල්ලීම්, දකුණු පසින් අධ්‍යක්ෂ ප්‍රස්ථාරය.


කෙසේ වෙතත්, ප්‍රායෝගිකව, එය අපගේ භාවිත අවස්ථාව සඳහා හොඳින් ක්‍රියා කළේ නැත, බොහෝ දුරට සන්දර්භය කවුළු සීමාවන් හේතුවෙන්. ප්‍රවාහය LLM හට ඵලදායි ලෙස හැසිරවීමට නොහැකි තරම් දිගු වන්නට ඇත. පිවිසුම් කුකීස් සෘජුවම කාවැද්දීමෙන් සහ මුල් පිටුවෙන් ආරම්භ කිරීමෙන් ක්‍රියාවලිය කෙටි පරිපථ කිරීමට ගත් උත්සාහයන් පවා සාර්ථක වූයේ නැත. මගේ පහත් මට්ටමේ OpenAI API යතුර මෙම ගැටළු වලට දායක වී ඇතැයි මම සැක කරන අතර, Integuru තවමත් එහි මුල් දිනවල සිටින බව පැහැදිලිය. විභවය පවතී, නමුත් නිෂ්පාදනයට තවදුරටත් පිරිපහදු කිරීම අවශ්ය වේ. එහි ආදර්ශන (රොබින්හුඩ් වෙතින් බදු ලේඛන බාගත කිරීම වැනි) සරල ප්‍රවාහයන් සහිත නවීන වෙබ් රාමු මත හොඳින්ම ක්‍රියා කරයි. Salesforce, එහි සංකීර්ණ ඉදිරිපස අන්තය සහ labyrinthine custom objects සමඟ දෝෂ හඳුන්වා දෙන ලදී.


එනම්, මෙම ක්රමය තවමත් විශ්වීය විසඳුමක් නොවේ. සියලුම පියවර පටිගත කිරීමේ අවශ්‍යතාවය එහි නම්‍යශීලී බව සීමා කරන අතර, එය දශකයකට පෙර ජනප්‍රිය වූ රීති මත පදනම් වූ RPA මෙවලම් සිහිගන්වමින් කල්තියා නිශ්චිත ප්‍රවාහයන් සඳහා කේත ජනනය කිරීමේ වඩාත් ස්ථිතික ප්‍රවේශයක් වෙත නැඹුරු වේ. මෙය මූලික සීමාවක් ඉස්මතු කරයි: ජාල ඉල්ලීම් සඳහා AI තර්ක එකතු කිරීම උද්යෝගිමත් වන අතර API නොමැති පද්ධති සමඟ ඒකාබද්ධ වීමට දොරටු විවර කළ හැකි අතර, එය ගතික, විවිධ කාර්ය ප්‍රවාහයන්ට වඩා වැඩි පාලනයක් හෝ නැවත නැවත කරන කාර්යයන් සඳහා වඩාත් සුදුසු වේ. ව්යවසාය පරිසරයන්.

නියෝජිත බලකාය: විකුණුම් බලකායේ දේශීය විසඳුම

සේල්ස්ෆෝර්ස් පරිසර පද්ධතිය තුළ “නියෝජිතයන්” ගොඩනැගීම සඳහා මාර්ක් බෙනියෝෆ්ගේ විශාල ඔට්ටුව වන ඒජන්ට්ෆෝර්ස් ගැන සඳහන් නොකර, සේල්ස්ෆෝර්ස් හි AI මත ධාවනය වන ස්වයංක්‍රීයකරණය පිළිබඳ කිසිදු සංවාදයක් සම්පූර්ණ නොවනු ඇත. අප ඉහත පරීක්‍ෂා කළ අනෙකුත් විසඳුම් මෙන් නොව, සංවර්ධක කේන්ද්‍ර කරගත් සහ විවිධ පද්ධති හරහා වැඩ ප්‍රවාහ ස්වයංක්‍රීය කිරීම අරමුණු කරගනිමින්, AgentForce අඩු කේත, විශේෂයෙන් සේල්ස්ෆෝර්ස් සඳහා කාවැද්දූ විසඳුමක් ලෙස ස්ථානගත කර ඇත. එය බොහෝ සංරචක එකට ඇසුරුම් කරන අතර සේල්ස්ෆෝර්ස් වේදිකාව තුළ ඇති සමස්ත ප්‍රවාහය කෙරෙහි අවධානය යොමු කරයි.


අදහස වන්නේ විකුණුම් බලකායේ සම්පූර්ණයෙන්ම පදිංචිව සිටින නියෝජිතයන් නිර්මාණය කිරීම සහ ඔබේ අභිරුචිකරණයන් මත ගොඩනැගීමයි. පරිශීලකයින් නියෝජිතයෙකුගේ සාමාන්‍ය විස්තරය නිර්වචනය කරයි, මාතෘකා පවරයි, සහ සම්බන්ධිත ක්‍රියා සම්බන්ධ කර ඇති අතර ඒවා කේතයෙන් හෝ Salesforce UI හරහා අර්ථ දක්වා ඇත. අවසර, පරිශීලක භූමිකාවන් සහ උපදෙස් පසුව නියෝජිතයා ක්‍රියා කිරීමට සක්‍රීය කිරීමට සකසනු ලැබේ. මෙම සංකල්පය න්‍යායාත්මකව ව්‍යාපාරවලට ඔවුන්ගේ පවතින විකුණුම් බලකායේ දත්ත සහ කාර්ය ප්‍රවාහයන් පුළුල් කේතීකරණයකින් තොරව ස්වයංක්‍රීයකරණය ධාවනය කිරීමට ඉඩ සලසයි.


අපගේ eBikes නැවත විකුණුම් ඇණවුම් උදාහරණය සමඟින් AgentForce සෘජුවම පරීක්ෂා කිරීමට මට අවශ්‍ය විය. අවාසනාවන්ත ලෙස, නොමිලේ සංවර්ධක ගිණුමක නොමැති අයින්ස්ටයින් (AI විශේෂාංග) වෙත ප්‍රවේශය අවශ්‍ය වේ. ඒ වෙනුවට, මම ප්‍රබන්ධ “කොරල් බීච් රිසෝට්” යෙදුම සමඟ ඔවුන්ගේ මිනිත්තු 30 ක්‍රීඩා පිටිය ගවේෂණය කළෙමි. පරීක්ෂණ කාර්යය වූයේ වෙන් කිරීමක් නිර්මාණය කිරීම ස්වයංක්‍රීය කිරීම සඳහා නියෝජිතයෙකු වින්‍යාස කිරීම, අපගේ eBikes දර්ශනයේ නැවත විකුණුම් ඇණවුමකට තරමක් සමාන ක්‍රියාවලියකි.


සැකසුම බෙහෙවින් සම්බන්ධ වූ අතර, පියවර කිහිපයක් අවශ්‍ය වේ: අවසර නිර්වචනය කිරීම, මාතෘකා සක්‍රීය කිරීම, පෙර ගොඩනඟන ලද ක්‍රියාවන්ට සම්බන්ධ කිරීම, දත්ත ක්ෂේත්‍ර සිතියම්ගත කිරීම සහ උපදෙස් පැහැදිලි කිරීම. අඩු කේත විසඳුමක් ලෙස අලෙවි කරන අතරතුර, සේල්ස්ෆෝර්ස් හි සංකීර්ණතා පිළිබඳ සැලකිය යුතු දැනුමක් අවශ්‍ය බව පැහැදිලි විය. සමාගමක විකුණුම් බලකා නිදසුනෙහි හොඳින් ලේඛනගත අභිරුචි ක්ෂේත්‍ර සහ පූර්ව වින්‍යාසගත ක්‍රියා ප්‍රවාහ නොමැති නම්, ආරම්භක එසවීම සැලකිය යුතු විය හැකිය. යථාර්ථවාදීව, බොහෝ ව්‍යාපාරවලට මෙම නියෝජිතයන් සම්පූර්ණයෙන් ක්‍රියාත්මක කිරීමට සහ ප්‍රශස්ත කිරීමට පද්ධති ඒකාබද්ධ කරන්නන් හෝ උපදේශකයින් ගෙන ඒමට අවශ්‍ය වනු ඇත.


AgentForce පරීක්ෂා කිරීම සඳහා මා විසින් SFDC තුළ නිර්මාණය කළ වෙන් කිරීමේ නියෝජිතයාගේ දළ විශ්ලේෂණය පිටුව


AgentForce හි රීති මත පදනම් වූ ස්වභාවය ද කැපී පෙනුණි. ස්වයංක්‍රීයකරණය නිවැරදිව ක්‍රියා කිරීම සඳහා පරිශීලකයින් පුරවා ඇති හෝ සම්මත කර ඇති ක්ෂේත්‍ර ප්‍රවේශමෙන් සිතියම්ගත කළ යුතු අතර, එය සමහර AI-ධාවන වේදිකා වලට වඩා ප්‍රායෝගික කරයි. මෙම ප්‍රවේශය නිරවද්‍යතාවය සහතික කරන අතරම, එය ශක්තිමත් විකුණුම් බලකායේ විශේෂඥතාව සහ පවතින යටිතල පහසුකම් මත යැපීම ශක්තිමත් කරයි.


AgentForce Salesforce හි පරිසර පද්ධතියට පමණක් සීමා වන අතර, මෙය වාසි සහ අවාසි යන දෙකම ඇත. එක් අතකින්, එය තනි වේදිකාවක් තුළ සත්‍යාපනය, පරිශීලක අවසරයන්, මෙවලම් අර්ථ දැක්වීම් සහ වාද්‍ය වෘන්ද තර්කනය ඒකාබද්ධ කරන ඇසුරුම් කළ විසඳුමකි. අනෙක් අතට, බොහෝ ව්‍යවසාය කාර්ය ප්‍රවාහයන් බහු පද්ධති පුරා විහිදෙන අතර, AgentForce හි නිහඬ ස්වභාවය පුළුල් ස්වයංක්‍රීයකරණ අවශ්‍යතා සඳහා එහි යෙදීම සීමා කරයි. Marc Benioff ප්‍රකාශ කර ඇත්තේ AgentForce භාවිතා කිරීමට ගනුදෙනුකරුවන් සිය ගණනක් දැනටමත් ගිවිසුම් අත්සන් කර ඇති බැවින් එහි පරිණාමය නිරීක්ෂණය කිරීම වටී.

ඉතින්... අපි තවම ඉන්නවාද?

මෙම අත්හදා බැලීම් වලින්, වත්මන් AI නියෝජිත විසඳුම් බහු-පියවර කාර්යයන් පිළිබඳ තර්ක කිරීමේ සහ සැලැස්මක් සකස් කිරීමේ යහපත් කාර්යයක් කළ හැකි බව පැහැදිලිය. සැබෑ අභියෝගය වන්නේ මෙම පද්ධති සැබවින්ම හැසිරෙන ආකාරය පිළිබඳ ගෝත්‍රික දැනුමක් සහිත අවුල් සහගත, සැබෑ ලෝක පරිසරයක ක්‍රියාත්මක කිරීමයි. චිත්‍රක UI නිර්මාණය කර ඇත්තේ මානව අන්තර්ක්‍රියා සඳහා වන අතර, එක් එක් ව්‍යවසායයේ අභිරුචි තර්කය සංකීර්ණත්වයේ කුඩා කළු කුහරයක් වැනිය. ඔබ හිස රහිත ප්‍රවේශයක් සඳහා GUI මඟ හැරියද හෝ පසුපෙළ APIs ප්‍රතිලෝම-ඉංජිනේරු කිරීම කළද, ඔබ තවමත් LLM වල හොඳම දේ ඉවතට විසි කරන අන්ත අවස්ථා, සත්‍යාපන බාධක, අනුපාත සීමාවන් හෝ ගතික කාර්ය ප්‍රවාහයන්ට මුහුණ දෙයි.


ඉතිරි අභියෝග ප්‍රධාන වශයෙන් ඉංජිනේරුමය ගැටළු වේ: ශක්තිමත් මෙවලම් තැනීම, ව්‍යවසාය පද්ධති සමඟ ගැඹුරින් ඒකාබද්ධ වීම, ආරක්ෂක වැටවල් ස්ථාපනය කිරීම සහ විශ්වාසනීය අධීක්ෂණ සහ වාද්‍ය රාමු නිර්මාණය කිරීම. මේවා කැපවීමෙන් හා විශේෂීකරණයෙන් විසඳාගත හැකිය. වර්තමාන LLMs දැනටමත් වසරකට පෙර පැවති ප්‍රමාණයට වඩා බොහෝ දුරට තර්ක කිරීමේ හැකියාව පෙන්නුම් කරන අතර ඒවායේ පිරිවැය ශීඝ්‍රයෙන් පහත වැටෙමින් තිබේ. මෙම හැකියාවන් ඵලදායී ලෙස යෙදවීමට අවශ්‍ය යටිතල පහසුකම් සහ ක්‍රියාවලි ගොඩනැගීම කෙරෙහි දැන් අවධානය යොමු විය යුතුය.


එහෙත් මෙම දුෂ්කරතා සිදුවෙමින් පවතින ස්ථාවර ප්‍රගතිය යටපත් නොවිය යුතුය. පාලිත වසමක ඉහළ නිරවද්‍යතාවයක් ලබා දිය හැකි විශේෂිත, සිරස්ව නාභිගත AI ස්වයංක්‍රීයකරණයන් (උදා: SDR හෝ පාරිභෝගික සහාය නියෝජිතයන්) අපි දැනටමත් දකිමු. මෙම එක් එක් තනි-භාවිත ස්වයංක්‍රීයකරණයන් පරිණත වන විට, ඒවා පුළුල් කාර්ය ප්‍රවාහවලට එකට බැඳී ඇති බව අපට දැකිය හැක. එය අවසානයේ අපි විශාල ව්‍යවසායන් තුළ අන්තයේ සිට අවසානය දක්වා ස්වයංක්‍රීයකරණය බිඳ දමන්නේ කෙසේද යන්න විය හැකිය: එක් පොදු කාර්ය නියෝජිතයෙකු සියල්ල කිරීමට අපේක්ෂා කරනවාට වඩා විශේෂිත නියෝජිතයන් කිහිපයක් ඒකාබද්ධ කිරීමෙන්. දැනට, මුල සිටම නියෝජිතයෙකු ගොඩනැගීමේ ROI ඉහළම පරිමාවේ කාර්යයන් හැර අන් සියල්ල සඳහා පැන්සල් නොවීමට ඉඩ ඇත.

විශේෂීකරණය සහ ඉදිරි මාවත

මෙම පරීක්ෂණ වලින් එක් පාඩමක් වන්නේ විශේෂීකරණයේ වැදගත්කමයි. තනි වසමක (උදාහරණයක් ලෙස, NetSuite හි ඉන්වොයිසි නිර්මාණය කිරීම) ආසන්න වශයෙන් පරිපූර්ණ විශ්වසනීයත්වයක් ලබා ගැනීම සැලකිය යුතු සියුම් සුසර කිරීමක් සිදු කරයි. එක් විශේෂිත කාර්ය ප්‍රවාහයක් කෙරෙහි අවධානය යොමු කරන ආරම්භක හෝ අභ්‍යන්තර කණ්ඩායම් පුළුල්, සාමාන්‍ය විසඳුමකට වඩා හොඳ අත්දැකීමක් ලබා දිය හැකිය. මූල්‍ය, සැපයුම්, මානව සම්පත්, හෝ සැපයුම් දාමයේ ඉලක්කගත කාර්යයන් විසඳන “සිරස් නියෝජිතයන්” රැල්ලක් අපි දැනටමත් දකිමු. සෑම නියෝජිතයෙකුම ගැඹුරින් ඒකාබද්ධ වනු ඇත, සමහර විට UI ස්වයංක්‍රීයකරණය අවශ්‍ය විටෙක සෘජු API ඇමතුම් සමඟ ඒකාබද්ධ කරයි, සහ වසම-විශේෂිත පසුබැසීම තර්කනය සහ ආරක්ෂක වැටවල්.


විශාල ප්‍රශ්නය ඉතිරිව ඇත: 2025 සැබවින්ම මෙම නියෝජිතයන් ප්‍රධාන ධාරාවට යන වසර වේද, නැතහොත් අපි දිගු ධාවන පථයක් දෙස බලා සිටිනවාද? තාක්ෂණය වේගයෙන් ගමන් කරන අතර, ශුභවාදී බව බහුල වේ. නමුත් කේත උත්පාදනය වඩා හොඳ වූ විට මෘදුකාංග ඉංජිනේරුවන් අතුරුදහන් නොවූවා සේම, සියලුම ක්‍රියාවලීන් සඳහා “හෑන්ඩ්-ෆ්‍රී” ව්‍යවසාය ස්වයංක්‍රීයකරණය අපට නොපෙනේ. ඒ වෙනුවට, අපි විශේෂිත සාක්කුවල පුනරාවර්තන වැඩිදියුණු කිරීම් දකිමු, අවසානයේ ඒවා අර්ධ ස්වයංක්‍රීයකරණයේ මොසෙයික් ලෙස එකට මැසීම.

නිගමනය

ස්වයංක්‍රීය AI නියෝජිතයන් පිළිබඳ සංකල්පය ප්‍රතික්ෂේප කළ නොහැකි තරම් බලගතු ය, විශේෂයෙන් පුනරාවර්තන කාර්යයන් බහුල ව්‍යවසාය සැකසුම් තුළ. විභව ප්‍රතිලාභ - කාලය ඉතිරි කිරීම, දෝෂ අවම කිරීම සහ සේවකයින්ට වඩාත් නිර්මාණාත්මක සහ උපාය මාර්ගික වැඩ කෙරෙහි අවධානය යොමු කිරීමට හැකිවීම - අතිවිශාල වේ. කෙසේ වෙතත්, AI නියෝජිතයින්ගේ මූලික හැකියාවන් ශක්තිමත් වන අතර, පුළුල් ලෙස දරුකමට හදා ගැනීමේ මාවත පදනම් වී ඇත්තේ යටින් පවතින පර්යේෂණ ඉදිරියට ගෙන යාමට අමතරව ඉංජිනේරු අභියෝග ජය ගැනීම මත ය.


නිවැරදි යටිතල පහසුකම් ගොඩනැගීම ප්‍රධාන වේ: ශක්තිමත් මෙවලම්, විශ්වසනීය ඒකාබද්ධ කිරීම් සහ හොඳින් අර්ථ දක්වා ඇති ආරක්ෂක වැටවල් සහ වාද්‍ය වෘන්ද ස්ථර සහිත වසම්-විශේෂිත විසඳුම්. තථ්‍ය-ලෝක ව්‍යවසාය පද්ධතිවල සංකීර්ණත්වය සඳහා විශේෂිත විසඳුම් අවශ්‍ය වන අතර සිරස් නියෝජිතයින්ට විශිෂ්ටත්වය දැක්විය හැක්කේ මෙහිදීය. පටු, හොඳින් නිර්වචනය කරන ලද කාර්ය ප්‍රවාහයන් කෙරෙහි අවධානය යොමු කිරීම කණ්ඩායම්වලට ඔවුන්ගේ විසඳුම් ඉහළ නිරවද්‍යතාවයකින් සහ විශ්වසනීයත්වයකින් පිරිපහදු කිරීමට ඉඩ සලසයි. කාලයාගේ ඇවෑමෙන්, මෙම විශේෂිත නියෝජිතයින්ට අන්තර් සම්බන්ධිත විය හැකි අතර, පුළුල් ස්වයංක්‍රීය ජාලයක් නිර්මාණය විය.


2025 ආකර්ෂණීය දියුණුවක් සහ වැඩිවන නියමු වැඩසටහන් සංඛ්‍යාවක් ගෙන එනු ඇත. ස්වයංක්‍රීය නියමු මත ක්‍රියාත්මක වන ලෝකයකට වඩා, ඉලක්කගත, ඉතා ඵලදායී ස්වයංක්‍රීයකරණයන් විශේෂිත ගැටළු වලට මුහුණ දීම අපට දැකීමට ඉඩ ඇත. පූර්ණ ව්‍යවසාය ස්වයංක්‍රීයකරණය කරා යන ගමන විශේෂීකරණයෙන් සහ සහයෝගීතාවයෙන් මෙහෙයවනු ලබන පුනරාවර්තී වනු ඇත. ගම්‍යතාවය ගොඩනැගෙමින් පවතින අතර මෙම ඉංජිනේරු අභියෝග විසඳීම ව්‍යවසාය නවෝත්පාදනයේ මීළඟ රැල්ලට මග පාදයි.



(විශේෂාංග පින්තුර DALL-E වෙත)