ለብዙ አሥርተ ዓመታት፣ ንግዶች የኋላ-ቢሮ ሥራዎችን፣ የውሂብ ግቤትን፣ የሂሳብ አከፋፈል ሂደቶችን እና ሌሎች ተደጋጋሚ የሥራ ፍሰቶችን በራስ ሰር ለመሥራት ፈልገዋል። ነገር ግን ሶፍትዌሩ እንደተሻሻለ፣ እውነተኛ ከጫፍ እስከ ጫፍ አውቶሜሽን ለአብዛኛዎቹ ኢንተርፕራይዞች አስቸጋሪ ሆኖ ይቆያል። አሁን፣ የትላልቅ የቋንቋ ሞዴሎች (LLMs) በፍጥነት እያደገ በመምጣቱ እና ማሰብ የሚችሉ እና እራሳቸውን ችለው የሚሰሩ “AI ወኪሎች” ብቅ እያሉ፣ 2025 በመጨረሻ በድርጅት አውቶሜሽን ውስጥ ጉልህ የሆነ ወደፊት የምናይበት ዓመት ሊሆን ይችላል የሚል እምነት እያደገ ነው።
ሳም አልትማን "በ2025 የመጀመሪያዎቹ የ AI ወኪሎች ወደ ስራ ሲገቡ እና የኩባንያዎችን ምርት በቁሳዊ መልኩ ሲቀይሩ እናያለን" ሲል ማርክ ቤኒኦፍ ብዙ ድርጅታዊ ሂደቶች በውክልና የሚተላለፉበትን የወደፊት ጊዜ በመጠባበቅ Salesforceን ወደ "AgentForce" እያዞረ መሆኑን በይፋ ተናግሯል . ወደ ልዩ ወኪሎች. እነዚህ ትንበያዎች ማዕከላዊ ጥያቄን ያስከትላሉ፡- AI ወኪሎች የገሃዱ ዓለም የኢንተርፕራይዝ ስርዓቶችን ውስብስብ መሰናክሎች ማሸነፍ ይችላሉ? በዚህ ጽሑፍ ውስጥ፣ የኢንተርፕራይዝ አውቶማቲክን ልዩ ችግሮች እንመረምራለን እና አንዳንድ የዛሬን ተስፋ ሰጭ (ነገር ግን እየበሰሉ ያሉ) መፍትሄዎችን እንመረምራለን። እንዲሁም በ Salesforce (SFDC) ውስጥ ቀጥተኛ በሚመስል የስራ ሂደት -ለአዲስ መለያ የእንደገና ሻጭ ማዘዣን መፍጠር - ከትዕይንቱ በስተጀርባ ያለውን ውስብስብነት የሚያሳየው የተግባር ሙከራዎችን እናካፍላለን።
በወረቀት ላይ የኢንተርፕራይዝ ስራዎችን በራስ-ሰር ማድረግ ቀላል ይመስላል፡ ለመግባት ስክሪፕት ያውጡ፣ ቅጾችን ይሙሉ እና “አስገባ” ን ጠቅ ያድርጉ። በተግባር, ውስብስብነቱ በጣም አስደናቂ ነው. ኢንተርፕራይዞች እንደ Salesforce፣ SAP፣ Oracle እና ብዙ የቤት ውስጥ መፍትሄዎች ባሉ እጅግ በጣም ብዙ የመዝገብ ስርዓቶች ላይ ይተማመናሉ። እያንዳንዱ ስርዓት የራሱ የፈቃዶች ድር፣ የማረጋገጫ ፍሰቶች እና ብጁ የንግድ ሎጂክ አለው። ከዚህም በላይ እነዚህ ስርዓቶች ብዙውን ጊዜ በጣም የተበጁ ናቸው. ከንግድ ወደ ንግድ የሚለያዩ ልዩ ዩአይኤስን፣ ተጨማሪ የመረጃ መስኮችን እና የታወቁ የስራ ፍሰቶችን ማየት የተለመደ ነው።
ሙሌሶፍት እና ዴሎይት በጋራ ባደረጉት ጥናት ትላልቅ ኢንተርፕራይዞች የእለት ተእለት ስራዎችን ለመደገፍ በአማካይ 976 የተለያዩ ስርዓቶችን ሊጠቀሙ ይችላሉ ( ምንጭ )። ይህ ቁርጥራጭ ማለት አውቶሜሽን መሳሪያ ከበርካታ ስርዓቶች ጋር መነጋገር አለበት, እያንዳንዱም የራሱ የሆነ ልዩነት አለው; አንዳንዶቹ ጠንካራ ኤ.ፒ.አይ.ዎች ያሏቸው፣ ሌሎች ደግሞ ምንም የላቸውም። ብዙውን ጊዜ፣ በጣም ቀላል የሆኑት ተግባራት በአሮጌ፣ በቆዩ መተግበሪያዎች እና አዲስ ደመና ላይ የተመሰረቱ አገልግሎቶች ላይ ውሂብን ማገናኘት ያካትታሉ። እንደ Salesforce ያሉ መደበኛ መድረኮች እንኳን ብጁ የስራ ፍሰቶች እና የሶስተኛ ወገን ውህደቶች ከተፈጠሩ በኋላ የላቦራቶሪ ሊሆኑ ይችላሉ።
ከዚህ ዳራ አንጻር፣ በኤልኤልኤም የተጎላበቱ ወኪሎች የበለጠ ተለዋዋጭ አቀራረብን ቃል ገብተዋል፡ መረጃን መተንተን፣ ስለቀጣዩ እርምጃዎች ማመዛዘን እና ውስብስብ GUIsን ማሰስ ይችላሉ - ቢያንስ በንድፈ ሀሳብ። ነገር ግን በሚከተለው ምሳሌ ላይ እንደሚመለከቱት፣ የ AI ወኪል መሰረታዊ የSalesforce የስራ ፍሰትን ያለ ሰብአዊ እርዳታ እንዲያደርግ የማግኘት እውነታ ብዙዎች ከሚገነዘቡት የበለጠ የተወሳሰበ ነው።
Salesforceን በሚጠቀም የብስክሌት ማምረቻ ኩባንያ ውስጥ የሽያጭ ተባባሪ እንደሆንክ አድርገህ አስብ። አሁን 1 ትልቅ ዳይናሞ ኤክስ1 ብስክሌት በ$5,000 ለአዲስ ሻጭ “ሰሜን መሄጃ ብስክሌት” ሸጠሃል። የእርስዎ ተግባር የሚከተሉትን ማድረግ ነው:
1 - ለ Salesforce አረጋግጥ (ከቀረቡት ምስክርነቶች ጋር)።
2 - ለሻጩ አዲስ መለያ ይፍጠሩ።
3 - የእንደገና ሻጭ ትዕዛዝ ይፍጠሩ እና የመስመር ንጥል (ብስክሌቱን) ይጨምሩ.
4 - ያንን ትዕዛዝ ለማጽደቅ ወደ ማምረት ያቅርቡ።
ለስኬታማ አፈፃፀም፣ የመጨረሻው ውጤት የሚከተለውን እንዲመስል እየጠበቅን ነው።
በቂ ቀላል ይመስላል, ነገር ግን ዲያቢሎስ በዝርዝሮች ውስጥ ነው. የኩባንያው የሽያጭ ሃይል ምሳሌ ተበጅቷል፡ ብጁ “የሻጭ ማዘዣ” እቃ እና ፍሰት፣ ምርቶችን ለመጨመር ልዩ የመጎተት እና የማውረድ ባህሪ እና የተደበቀ “ለማምረቻ አስገባ” እርምጃ ያለምንም ግልጽ መለያ ይጠቀማል። ይህንን ሁኔታ እንዴት እንደሚለኩ ለማየት ብዙ ብቅ ባሉ በ AI የሚነዱ አውቶሜሽን አቀራረቦችን በመጠቀም ሞከርኩት።
Claude Computer Use ከ Claude 3.5 Sonnet v2 ጋር የተዋወቀው ከአንትሮፖኒክ አዲስ ባህሪ ነው። ለክላውድ አጠቃላይ የዴስክቶፕ አካባቢን “እንዲያይ” እና “እንዲቆጣጠር” በመስጠት ደረጃውን የጠበቀ የኤል ኤም ኤል ተግባር ጥሪ ፓራዳይም አንድ እርምጃ ይወስዳል። ቅጽበታዊ ገጽ እይታዎችን ማንሳት፣ በእይታ/በቦታ ምክንያት መተርጎም እና እንደ የመዳፊት ጠቅታዎች፣ ጥቅልሎች እና የቁልፍ ጭነቶች ያሉ የስርዓተ ክወና ደረጃ እርምጃዎችን ማከናወን ይችላል።
ከተጠቃሚ እይታ፣ ክላውድ ከፍተኛ ደረጃ ያለው ተግባር ይሰጡታል ("ወደ Salesforce ይግቡ እና ይህንን የሻጭ ትዕዛዝ ይፍጠሩ") ፣ እና ክላውድ በትክክል ይህንን ለማድረግ ይሞክራል። በሚከተለው ቅደም ተከተል ይመላለሳል፡-
በስርአቱ ላይ ምንም አይነት ለውጥ ሳይደረግ የአንትሮፖፊክ ማጣቀሻ ትግበራን ለማስኬድ ቀላሉ መንገድ እንጀምር። የግንኙነቱ መጀመሪያ የመነሻ ጥያቄውን፣ የክላውድ ሐሳብን እና ግንኙነቱን የሚጀምርበትን ዴስክቶፕ የሚያሳይ ነው።
የክላውድ በኮንቴይነር የተያዘውን ዴስክቶፕ መመልከቱ መጀመሪያ ላይ አስደናቂ ነበር። አሳሹን ከፍቷል፣ የSalesforce URLን ጎብኝቷል፣ በቀረቡት ምስክርነቶች ገብቷል እና ወደ “መለያዎች” ሄደዋል። ለቢስክሌት ማምረቻ ኩባንያ አዲስ መለያ ፈጥሯል, በቅጹ ውስጥ ትክክለኛ ዝርዝሮችን በማስገባት, ከዚያም አዲስ ሻጭ ትዕዛዝ ለመፍጠር ሞክሯል. ብስክሌቱን ለመጨመር ብጁ የመጎተት-እና-አስቀያሚ በይነገጽ እስኪያገኝ ድረስ ነገሮች ያለችግር ይሄዱ ነበር። ስርዓቱ በፒክሰል ላይ የተመሰረተ መጎተት-እና-መጣልን ለመስራት በመሞከር ላይ ተጣብቋል።
ከጥቂት ውድቀቶች በኋላ, አማራጭ ዘዴ ለማግኘት ሞክሯል (እንደ የተደበቀ "ንጥል አክል" አዝራር). በ"አርትዕ" ቁልፍ የተደረገው የመጀመሪያ ሙከራ አልተሳካም።
“በአርትዖት ንግግር ውስጥ ምርቶችን ለመጨመር ምንም ግልጽ መንገድ እንደሌለ አስተውያለሁ። ሌሎች አማራጮች ካሉ ለማየት የችርቻሮ ሽያጭ ማዘዣ ተቆልቋይ ላይ ጠቅ በማድረግ የተለየ አካሄድ ልሞክር።
በ"ተዛማጅ" ትር በኩል አዳዲስ ንጥሎችን የሚጨምርበትን መንገድ በማግኘት በመጨረሻ መንገዱን አገኘ - የመተግበሪያው ተለዋዋጭ ቀስቅሴዎች ትዕዛዙን በራስ-ሰር ካላዘመኑት ብቻ ነው። የ SFDC መተግበሪያ ገንቢዎች የሰው ተጠቃሚው የመጎተት እና የመጣል ዘዴን ብቻ እንዲከተል በመጠበቅ የዚህን ኮድ መንገድ ልማት አላጠናቀቁም። በአጭሩ፣ ፍሰቱ የተነደፈው ለሰዎች እንጂ ለ AI ወኪል አይደለም።
ክላውድ በብጁ ትር ስር የተቀበረውን “ለማኑፋክቸሪንግ አስገባ” የሚለውን ቁልፍ ለማግኘት ሞከረ። ስለዚያ እርምጃ ቀድሞ እውቀት ስለሌለው፣ ለብዙ ተጨማሪ ደቂቃዎች ተንሳፈፈ። በመጨረሻ፣ ጣልቃ መግባት አለብኝ፣ ብስክሌቱን በትእዛዙ ላይ በእጅ ጨምሬ፣ እና ክላውድን ወደሚመለከተው ቁልፍ መጠቆም ነበረብኝ። በግምት ከ10 ደቂቃ እና ከ$0.80 የአጠቃቀም ወጪዎች በኋላ፣ ሂደቱ አሁንም ሙሉ በሙሉ በራስ-ሰር አልተደረገም። አንትሮፖክ ይህን ባህሪ ለምን እንደ ለሙከራ እንደሚጠራው ለመረዳት ቀላል ነበር፡ የኮምፒዩተር አጠቃቀም በእውነት ለምርት ዝግጁ ከመሆኑ በፊት ብዙ የገሃዱ ዓለም ጥበቃ መንገዶች እና ማሻሻያዎች ያስፈልጋሉ።
ምንም እንኳን ጨካኝ ጫፎች ቢኖሩም, ጽንሰ-ሐሳቡ አስደሳች ነው. በእይታ ላይ የተመሰረተ AI ለ GUI መስተጋብር በፍጥነት እየተሻሻለ ነው፣ እና የዋጋ ኩርባ በፍጥነት እየቀነሰ ነው። የቅርብ ጊዜ የ a16z ጥናት እንደሚያመለክተው ለተመሳሳይ አፈጻጸም የኤልኤልኤም ወጪዎች በዓመት በ10x ያህል እየቀነሱ ነው። በመርህ ደረጃ፣ የወደፊት የClaude ስሪቶች ፈጣን፣ ርካሽ እና ይበልጥ ትክክለኛ በሆኑ የእይታ/የቦታ ተግባራት እንደ መጎተት እና መጣል ያሉ ሊሆኑ ይችላሉ።
ሆኖም የኢንተርፕራይዝ ዩአይኤስ፣ በተለይም የቆዩ ወይም በጣም የተበጁት፣ በራስ-ሰር በአእምሮ ውስጥ የማይገነቡ መሆናቸው አሁንም መሠረታዊው ችግር አለ። የፒክሰል ደረጃ መስተጋብር ደካማ ነው። በአቀማመጥ ላይ ያሉ ጥቃቅን ለውጦች ወይም ተለዋዋጭ ብቅ-ባዮች ሙሉውን ፍሰት ሊሰብሩ ይችላሉ. በምስላዊ የተመሰረቱ የጂአይአይ ማዕቀፎች ዙሪያ ምርምር እያደገ ነው፣ ነገር ግን እነዚህን የምርት ደረጃ በመቶዎች ለሚቆጠሩ የተለያዩ የስራ ፍሰቶች ማድረግ ትልቅ ስራ ነው።
አንድ አማራጭ አቀራረብ "የእይታ ማሰሪያ ሳጥኖችን" ሙሉ በሙሉ ችላ ማለት ነው. የእርስዎ ኢላማ መተግበሪያ በድር አሳሽ ውስጥ የሚሰራ ከሆነ፣ በDOM ደረጃ፣ ቅጽበታዊ ገጽ እይታዎችን እና በፒክሰል ላይ የተመሰረተ መስተጋብርን በመዝለል በራስ ሰር መስራት ይችላሉ። እንደ ፕሌይራይት እና ሴሊኒየም ያሉ ባህላዊ ጭንቅላት የሌላቸው አሳሾች ከሙከራ ማዕቀፎች ጋር የተቆራኙ ሲሆኑ፣ አዲስ ትውልድ AI አጠቃቀም ላይ ያተኮረ ጭንቅላት አልባ አሳሾች እየታዩ ነው። ይበልጥ ተለዋዋጭ፣ በኤል ኤም ኤል የተጎላበተ መስተጋብር ለመፍጠር እነዚህ አዳዲስ መድረኮች በፕሌይ ራይት እና ሴሊኒየም ላይ ይገነባሉ።
BrowserBase አንዱ የዚህ ምሳሌ ነው። ገንቢዎች መያዣዎችን እንዲያስተዳድሩ ሳያስፈልጋቸው የአሳሽ ክፍለ ጊዜዎችን የሚያስተናግድ እና የሚለካ እንደ መሠረተ ልማት መድረክ ይሰራል። የመስተጋብር ንድፉ የሚያጠነጥነው የገጹን HTML ይዘት ወደ ክፍሎች (ለምሳሌ ቅጾች፣ አዝራሮች) በ xPaths ላይ በካርታ በመተንተን እና ይህንን መዋቅር ወደ እርስዎ የመረጡት LLM በማስተላለፍ ላይ ነው። ከዚያ LLM ቀጣዩን የፕሌይራይት ኮድ ስብስብ ያመነጫል፣ ይህም ከDOM ጋር መስተጋብርን ከባህላዊ GUI ጠቅታዎች ይልቅ በኮድ በኩል ይፈቅዳል። ሙሉ በሙሉ ጭንቅላት የሌለው ስለሆነ፣ የአውድ ርዝመቱን አጭር እና መዘግየት ከሙሉ “ዴስክቶፕ አካባቢ” አቀራረብ ያነሰ በማድረግ ያነሱ ወይም ምንም ቅጽበታዊ ገጽ እይታዎችን ይጠቀማል።
በቅርቡ፣ BrowserBase ነገሮችን ለገንቢዎች ቀላል ለማድረግ StageHand ክፍት ምንጭ ላይብረሪውን ልኳል። በመጀመሪያው ሞዴል፣ መስተጋብሮች አሁንም በእጅ የሚሰሩ ነበሩ፣ ይህም ገንቢዎች ጭንቅላት ከሌለው የአሳሽ ዝቅተኛ ደረጃ ዝርዝሮች ጋር እንዲሰሩ፣ የተጫዋች ራይት ኮድ በቀጥታ መፃፍ እና ኤችቲኤምኤልን በእጅ መተንተንን ጨምሮ። በStageHand፣ BrowserBase ገንቢዎች እንደ “ዳሰሳ” ወይም “ማውጣት” ያሉ ሆን ብለው ላይ የተመሰረቱ የተፈጥሮ ቋንቋ ትዕዛዞችን እንዲጠቀሙ በመፍቀድ ከፍተኛ የአብስትራክሽን ደረጃን ይሰጣል። ይህ አካሄድ ጥሬ ኤችቲኤምኤልን ወደ አካላት ለመቀየር በአንዳንድ ሂደት ውስጥ ይጋገራል፣ ይህም LLM ተግባሮችን በቀላሉ እንዲቆጣጠር ያደርገዋል። ነገር ግን፣ ተጠቃሚዎች አሁንም የስራ ሂደቶችን ለማገናኘት እና ለማስተዳደር የራሳቸውን የኦርኬስትራ ንብርብሮች መፍጠር አለባቸው፣ ምክንያቱም StageHand እራሱ አብሮ የተሰራ ኦርኬስትራ አያቀርብም።
BrowserBaseን ለመሞከር፣ እነዚያን ስክሪፕቶች በራስ ሰር ለማዘጋጀት የፕሌይራይት ኮድን ለመፃፍ ኮንሶል እና የኤል ኤም ኤል ፈጣን ፀሐፊን የእነርሱን የገንቢ መጫወቻ ስፍራ ተጠቀምኩ። ሀሳቡ ባለብዙ ደረጃ አሰሳ ማድረግ ነው - ይግቡ ፣ መለያ ይፍጠሩ ፣ የሻጭ ማዘዣ ይፍጠሩ። ነገር ግን መድረኩ እርስዎ እራስዎ ደረጃዎቹን እንዲያደራጁ ይጠብቅዎታል። ለ Claude ከተሰጠው ተመሳሳይ መጠየቂያ ጀምሮ፣ BrowserBase በባለብዙ ደረጃ ፋሽን ምክንያት ማመዛዘን ባለመቻሉ ተሰናክሏል። ስለዚህ ለእያንዳንዱ እርምጃ የተፈጥሮ ቋንቋ ጥያቄ ማቅረብ ቀጠልኩ እና የመነጨው የፕሌይ ራይት ኮድ የታሰበውን እየሰራ መሆኑን ተመለከትኩ። ከታች ባለው ቅጽበታዊ ገጽ እይታ፣ ተከታታይ ጥያቄዎችን እና የመነጨውን የአጫዋች ራይት ኮድ ማየት ይችላሉ።
በተግባር፣ በመጫወቻ ሜዳው አሳሽ አካባቢ እና መሞላት በሚያስፈልጋቸው የኤችቲኤምኤል ፎርሞች መካከል አልፎ አልፎ አለመግባባት ውስጥ ገባሁ። አዝራሮች በአስደናቂ ሁኔታ ቀርበዋል፣ የጥበቃ ጊዜዎች ተራዝመዋል፣ እና የቅጽ መስኮች እንደተጠበቀው በትክክል አልተጫኑም። ምንም እንኳን እነዚህ ጉድለቶች ቢኖሩም፣ በኤልኤልኤም የመነጨው የፕሌይራይት ኮድ በመለያ መግባት፣ መለያ መፍጠር እና የድጋሚ ሻጭ ማዘዣ ቅጹን በከፊል መሙላት ችሏል። ነገር ግን ንጥሉን ለመጨመር መጎተት እና መጣል እንደገና እንቅፋት ነበር። ተስፋ ከመቁረጥ በፊት ሰባት ደቂቃ ያህል አሳልፌያለሁ። የመሳሪያ ስርዓቱ ለእንደዚህ አይነት አውቶማቲክስ እስካሁን ተስማሚ እንዳልሆነ ግልጽ ነበር. ለድር መፋቅ አጠቃቀም ጉዳዮች በተሻለ ሁኔታ ይሰራል።
ስካይቨርን በነባሪ ኦርኬስትራ የሚጨምር ጭንቅላት የሌለው አካሄድ ነው። እንደ BrowserBase፣ ተጠቃሚዎች እርምጃዎችን በእጅ እንዲገልጹ እና እንዲያስተዳድሩ ከሚጠይቀው በተለየ፣ Skyvern ኦርኬስትራውን ከሳጥኑ ውጭ ለመቆጣጠር ይሞክራል። በመከለያው ስር፣ ከ BrowserBase ጋር በተመሳሳይ መልኩ ይሰራል - በክፍት ምንጭ ኮዳቸው ላይ እንደሚታየው - ነገር ግን እርምጃዎችን ሊያቀናጅ እና ሊያመዛዝን የሚችል የድር ወኪልን ይጨምራል። ይህ በውሳኔ አሰጣጥ ላይ ለማገዝ ከተነሱት ክፍሎች እና ከ xPaths ጋር ወደ LLM ቅጽበታዊ ገጽ እይታዎች የሚልክ አማራጭ የእይታ ሁነታን ያካትታል።
በ BrowserBase ውስጥ በእጅ የእርምጃ ፈጠራ ውሱንነት ለመፍታት ስካይቨርን የሚተዳደር አገልግሎቱን በመጠቀም በተለይም በስራ ፍሰት ሁነታ ላይ በማተኮር ለመሞከር ወሰንኩ። ይህ ሁነታ ለባለብዙ ደረጃ ሂደቶች የተነደፈ ነው፣ እና ከSalesforce የስራ ፍሰታችን ጋር ምን ያህል በጥሩ ሁኔታ እንደሚሰራ ለመገምገም ፈልጌ ነበር። እንደ አለመታደል ሆኖ፣ ሩጫው ከ15 በላይ የማመዛዘን እርምጃዎችን እና ከ$1 በላይ ክሬዲቶች በሁለት-ደረጃ ማረጋገጫ (2FA) ሂደት ላይ ተጣብቋል። የSkyvern የተስተናገደው አይፒ ተጠቁሟል፣ 2FA አነሳስቷል፣ እና ሁኔታውን ለማለፍ ኮድ በእጅ ለማቅረብ ወይም ኩኪ ለማጋራት ምንም መንገድ አልነበረም። ይህ በድርጅት መቼቶች ውስጥ ያለውን ቀጣይነት ያለው የማረጋገጫ ተግዳሮት አጉልቶ ያሳያል እና ለምን እንደ Anon ያሉ ጅምር ጀማሪዎች ለ AI ወኪሎች የማረጋገጫ መፍትሄዎች ላይ ብቻ እንዲያተኩሩ እየፈጠሩ ያሉበትን ምክንያት ያጎላል።
የSkyvern ቡድን መድረኩን ለቀላል እና ለትንንሽ ስራዎች ተስማሚ አድርጎ ያስቀምጠዋል፣ የእውቂያ ቅጽ አውቶማቲክ ቀዳሚ የሚደገፍ የአጠቃቀም ጉዳይ ነው። ሌሎች ሊጠቀሙባቸው የሚችሉ ጉዳዮች (ለምሳሌ ስራዎች፣ ደረሰኞች) አሁንም “በስልጠና ላይ” ተብለው ተዘርዝረዋል፣ ይህም መድረኩ ከኢንተርፕራይዝ የስራ ፍሰቶች ውስብስብ ፍላጎቶች ይልቅ በቀላል አጠቃቀም ጉዳይ ላይ ያተኮረ አውቶሜሽን መጀመሩን ያሳያል። ተስፋ ሰጭ ቢሆንም፣ ስካይቨርን በዚህ የዕድገት ደረጃ ላይ ለትንሽ ውስብስብ ሁኔታዎች የተሻለ እንደሚሆን ግልጽ ነው።
ጭንቅላት የሌላቸው አሳሾች የፒክሰል ደረጃ ግምቶችን ይዘለላሉ፣ ይህም ብዙ ጊዜ ወደ ጥቂት ስህተቶች እና ፈጣን አፈፃፀም ያመራል። ነገር ግን እንደ ጎትት እና ጣል ወይም ውስብስብ ባለአንድ ገጽ መተግበሪያዎች ያሉ የላቁ ባህሪያትን እንደመቱ፣ ወደ ከፊል የቅጽበታዊ ገጽ እይታ ወይም ልዩ ኮድ መመለስ ሊኖርብዎ ይችላል። አሳሾች ወደ 2FA እና IP ጥቁር መዝገብ ሊገቡ ይችላሉ። ለብዙ ተከራይ ኢንተርፕራይዝ አፕሊኬሽኖች፣ ማረጋገጥ ብቻውን አስቸጋሪ ሊሆን ይችላል፣ እና አሁንም ብጁ የኦርኬስትራ ንብርብሮች ሊፈልጉ ይችላሉ።
ሌላው ገደብ እነዚህ መድረኮች የስራ ፍሰቱ በተፈጸመ ቁጥር በኤልኤልኤምኤስ በኩል በተለዋዋጭ ኮድ በማፍለቅ ላይ የተመሰረተ መሆኑ ነው። LLMs በተፈጥሯቸው የማይወስኑ በመሆናቸው፣ የሚወጣው ኮድ በተለያዩ ሩጫዎች ሊለያይ ይችላል፣ ይህም ኦዲት ለማድረግ ወይም ወጥነትን ለማረጋገጥ ፈታኝ ያደርገዋል። ይህ ያልተጠበቀ ሁኔታ ወደ ጉዳዮች ሊያመራ ይችላል, በተለይም ጥንቃቄ በተሞላበት የስራ ሂደት ውስጥ. የመነጨ ኮድን መሸጎጥ ለአንዳንድ መድረኮች ፍኖተ ካርታ ላይ ያለ ቢመስልም፣ ለኤል.ኤም.ኤም ከፍተኛ ፈተናዎችን ይፈጥራል። በመረጃ ወቅት በፈጣን ወይም ባች ሂደት ላይ ያሉ ጥቃቅን ለውጦች እንኳን ሙሉ ለሙሉ የተለየ ውጤት ሊያስገኙ ይችላሉ፣ ይህም የመሸጎጫ ሂደቱን ያወሳስበዋል።
በአጠቃላይ፣ ጭንቅላት የሌለው አሰሳ ከሙሉ GUI ማጭበርበር የበለጠ ርካሽ እና የተረጋጋ ሊሆን ይችላል፣ነገር ግን ከአስማት የራቀ ነው። እንደ BrowserBase እና Skyvern ያሉ ብዙ መፍትሄዎች “ሁሉንም ነገር በራስ ሰር ለማሰራት አንድ መድረክ” ከመሆን ይልቅ ጠባብ በሆኑ የአጠቃቀም ጉዳዮች (ለምሳሌ ቅጾች፣ ዳታ ማውጣት) ላይ ያተኩራሉ።
ሶስተኛው አካሄድ ዙሪያውን ጠቅ ሲያደርጉ የሚደርሱትን የአውታረ መረብ ጥሪዎች በመጥለፍ ድረ-ገጹን ሙሉ በሙሉ ማለፍ ነው። አሳሽህ የሚልከውን ጥያቄ ማንሳት ከቻልክ ጥሪዎቹን በኮድ ውስጥ እንደገና መገንባት ትችላለህ። በመርህ ደረጃ፣ ይህ የተዘበራረቁ በUI ላይ የተመሰረቱ እርምጃዎችን ያስወግዳል እና መተግበሪያዎ የሚጠቀመውን የጀርባ አመክንዮ እየመታዎት መሆኑን ያረጋግጣል። ይህ አዝማሚያ ሙሉ በሙሉ አዲስ አይደለም፣ ምክንያቱም የተገላቢጦሽ ምህንድስና ኤፒአይዎች ለረጅም ጊዜ የኖሩ ናቸው። ነገር ግን፣ ልብ ወለድ መደመር የአውታረ መረብ ጥያቄዎችን ለማሰብ የ AI ወኪልን በማካተት ሂደቱን የበለጠ ብልህ እና መላመድ ያደርገዋል።
ከጥቂት ወራት በፊት ኢንቴጉሩ የተባለ ምርት በ Hackernews ላይ የጀመረ ሲሆን ለክፍት ምንጭ አቀራረቡ እና ልብ ወለድ ዘዴው ትኩረትን ሰብስቧል። በችሎታው ተማርኩኝ፣ ግራፍ ላይ በተመሰረተ አቀራረቡ እና በአይ ኤጀንቶች ስለ አውታረ መረብ ጥያቄዎችን ለማመዛዘን በምክንያት በመሳል ልፈትነው ወሰንኩ። የአውቶሜሽን ጊዜን እና ወጪን በከፍተኛ ሁኔታ የመቀነስ ተስፋ ለመፈተሽ አሳማኝ አማራጭ አድርጎታል።
የኢንቴጉሩ ማከማቻ በአንፃራዊነት አዲስ ቢሆንም ተስፋዎችን ያሳያል። በዋናው ላይ፣ በአንድ ተግባር ጊዜ በChromium ውስጥ ያሉትን ሁሉንም የአውታረ መረብ ትራፊክ እና ኩኪዎችን ይመዘግባል። ከዚያም የጥያቄዎቹን ግራፍ ውክልና ይፈጥራል፣ የትኞቹ ገጾች የትኛዎቹ የመጨረሻ ነጥቦችን እንደሚጠሩ በማሳየት ላይ። ይህን ግራፍ ተጠቅሞ ወደ LLM በማለፍ ለእያንዳንዱ መስቀለኛ መንገድ ተመሳሳይ ጥያቄዎችን የሚመልስ ኮድ እንዲያመነጭ ያደርጋል፣ እንደ አስፈላጊነቱ የእርስዎን ተለዋዋጭ መለኪያዎች (እንደ “የብስክሌት ማምረቻ ኩባንያ”) በመርፌ እና በጥገኛዎች ላይ በመመስረት አንድ ላይ ይከፍላቸዋል። ይህ አካሄድ በንድፈ ሀሳብ የራስ-ሰር ሂደትን በእጅጉ ሊያመቻች ይችላል።
በተግባር ግን፣ ለአጠቃቀም ጉዳያችን ጥሩ አልሰራም፣ በአብዛኛው በአውድ መስኮት ውስንነት ምክንያት። ፍሰቱ ኤልኤልኤም በብቃት እንዲይዝ በጣም ረጅም ሊሆን ይችላል። የመግቢያ ኩኪዎችን በቀጥታ በመክተት እና ከመነሻ ገጹ ጀምሮ ሂደቱን ለማሳጠር የተደረገው ሙከራ እንኳን አልተሳካም። የእኔ ዝቅተኛ-ደረጃ የOpenAI API ቁልፍ ለነዚህ ጉዳዮች አስተዋፅዖ እንዳበረከተ ብጠራጥርም፣ ኢንቴጉሩ ገና በመጀመርያዎቹ ቀናት ውስጥ እንደሆነ ግልጽ ነው። እምቅነቱ አለ, ነገር ግን ምርቱ ተጨማሪ ማሻሻያ ይጠይቃል. የእሱ ማሳያዎች (እንደ የግብር ሰነዶችን ከRobinhood ማውረድ) በዘመናዊ የድር ማዕቀፎች ላይ በቀላል ፍሰቶች ላይ በተሻለ ሁኔታ ሰርቷል። Salesforce፣ ከተወሳሰበ የፊት ጫፉ እና የላብራቶሪ ብጁ ነገሮች ጋር፣ ስህተቶችን አስተዋውቋል።
ያም ማለት ይህ ዘዴ ገና ሁለንተናዊ መፍትሔ አይደለም. ሁሉንም እርምጃዎች የመቅዳት አስፈላጊነት ተለዋዋጭነቱን ይገድባል፣ እና ከአስር አመታት በፊት ታዋቂ የሆነውን ደንብ ላይ የተመሰረቱትን የ RPA መሳሪያዎችን የሚያስታውስ ለተወሰኑ ፍሰቶች ኮድ የማመንጨት ይበልጥ ቋሚ አካሄድ ላይ ያደገዋል። ይህ መሰረታዊ ገደብን ያጎላል፡ የ AI ማመዛዘን በኔትወርክ ጥያቄዎች ላይ መጨመር አስደሳች እና ኤፒአይ ከሌላቸው ስርዓቶች ጋር ለመዋሃድ በሮችን ሊከፍት ቢችልም፣ አሁንም ለተለዋዋጭ እና ለተለያዩ የስራ ፍሰቶች ሳይሆን ለበለጠ ቁጥጥር ወይም ለተደጋገሙ ስራዎች ተስማሚ ነው። የድርጅት አከባቢዎች.
በ Salesforce ውስጥ ስለ AI የሚነዳ አውቶሜሽን ምንም አይነት ንግግር AgentForce ፣ ማርክ ቤኒፍፍ በ Salesforce ስነ-ምህዳር ውስጥ “ወኪሎችን” በመገንባት ላይ ያለው ትልቅ ውርርድ ሙሉ በሙሉ አይሆንም። ከላይ ከሞከርናቸው ሌሎች መፍትሄዎች በተለየ፣ በገንቢ ላይ ያተኮሩ እና በተለያዩ ስርዓቶች ላይ የስራ ፍሰቶችን በራስ ሰር ለመስራት ዓላማ ያለው፣ AgentForce እንደ ዝቅተኛ ኮድ፣ በተለይ ለSalesforce የተካተተ መፍትሄ ሆኖ ተቀምጧል። ብዙ ክፍሎችን በአንድ ላይ ያጠቃለለ እና በ Salesforce መድረክ ውስጥ ባለው አጠቃላይ ፍሰት ላይ ያተኩራል።
ሃሳቡ በ Salesforce ውስጥ ሙሉ በሙሉ የሚኖሩ ወኪሎችን መፍጠር እና በእርስዎ ማበጀት ላይ መገንባት ነው። ተጠቃሚዎች የወኪሉን አጠቃላይ መግለጫ ይገልጻሉ፣ ርዕሰ ጉዳዮችን ይመድባሉ እና በኮድ ወይም በSalesforce UI በኩል የተገለጹ ቀድሞ የተገነቡ ፍሰቶች የሆኑትን ተዛማጅ ድርጊቶችን ያገናኛሉ። ተወካዩ እንዲሰራ ለማስቻል ፈቃዶች፣ የተጠቃሚ ሚናዎች እና መመሪያዎች ይዘጋጃሉ። ይህ ጽንሰ-ሀሳብ በንድፈ ሀሳብ ንግዶች ያለ ሰፊ ኮድ ኮድ አውቶማቲክን ለመንዳት ያለውን የSalesforce ውሂብን እና የስራ ፍሰቶችን እንዲጠቀሙ ያስችላቸዋል።
AgentForceን በቀጥታ በእኛ eBikes ሻጭ ትዕዛዝ ምሳሌ መሞከር ፈልጌ ነበር። እንደ አለመታደል ሆኖ በነጻ የገንቢ መለያ ውስጥ የማይገኘውን የአንስታይን (AI ባህሪያት) መዳረሻ ያስፈልጋል። በምትኩ፣ የ30 ደቂቃ የመጫወቻ ቦታቸውን በልብ ወለድ “Coral Beach Resort” መተግበሪያ ቃኘሁ። የፈተናው ተግባር ወኪልን ማዋቀር ነበር ቦታ ማስያዝ በራስ ሰር እንዲሰራ፣ ይህም ሂደት በኛ eBikes ሁኔታ ውስጥ ከእንደገና ሻጭ ትዕዛዝ ጋር ተመሳሳይ ነው።
ማዋቀሩ ብዙ እርምጃዎችን የሚፈልግ ነበር፡ ፈቃዶችን መግለጽ፣ ርዕሶችን ማንቃት፣ ቀድሞ ከተገነቡ ድርጊቶች ጋር መገናኘት፣ የውሂብ መስኮችን መስራት እና መመሪያዎችን ግልጽ ማድረግ። እንደ ዝቅተኛ ኮድ መፍትሄ ለገበያ ሲቀርብ፣ ስለ Salesforce ውስብስብ ነገሮች ጉልህ እውቀት አስፈላጊ እንደሆነ ግልጽ ሆነ። የኩባንያው Salesforce ምሳሌ በደንብ የተመዘገቡ ብጁ መስኮች እና ቀድሞ የተዋቀሩ የድርጊት ፍሰቶች ከሌለው የመጀመርያው ማንሳት ጠቃሚ ሊሆን ይችላል። እንደ እውነቱ ከሆነ፣ አብዛኛዎቹ የንግድ ድርጅቶች እነዚህን ወኪሎች ሙሉ በሙሉ ለመተግበር እና ለማሻሻል የስርዓት ውህደቶችን ወይም አማካሪዎችን ማምጣት አለባቸው።
የAgentForce ደንብን መሰረት ያደረገ ተፈጥሮም ጎልቶ ታይቷል። አውቶሜሽኑ በትክክል እንዲሰራ ተጠቃሚዎች የትኞቹ መስኮች እንደተሞሉ ወይም እንደሚተላለፉ በጥንቃቄ ካርታ ማዘጋጀት አለባቸው፣ ይህም ከአንዳንድ AI-የሚነዱ መድረኮች የበለጠ በእጅ እንዲሰራ ያደርገዋል። ይህ አካሄድ ትክክለኛነትን የሚያረጋግጥ ቢሆንም፣ በጠንካራ የSalesforce ዕውቀት እና ባለው መሠረተ ልማት ላይ ያለውን ጥገኝነት ያጠናክራል።
AgentForce እራሱን በ Salesforce's ስነ-ምህዳር ላይ ብቻ ቢጥርም፣ ይህ ሁለቱም ጥቅሞች እና ጉዳቶች አሉት። በአንድ በኩል፣ ማረጋገጫን፣ የተጠቃሚ ፈቃዶችን፣ የመሳሪያ ትርጓሜዎችን እና የኦርኬስትራ ሎጂክን በአንድ መድረክ ውስጥ አንድ የሚያደርግ የታሸገ መፍትሄ ነው። በሌላ በኩል፣ ብዙ የኢንተርፕራይዝ የስራ ፍሰቶች ብዙ ስርዓቶችን ይሸፍናሉ፣ እና የAgentForce ጸጥ ያለ ባህሪው ለሰፋፊ አውቶማቲክ ፍላጎቶች ተፈጻሚነቱን ይገድባል። ማርክ ቤኒኦፍ በመቶዎች የሚቆጠሩ ደንበኞች AgentForceን ለመጠቀም ስምምነቶችን መፈራረማቸውን ገልጿል፣ ስለዚህ ዝግመተ ለውጥ መከታተል ተገቢ ነው።
ከእነዚህ ሙከራዎች፣ አሁን ያሉት የ AI ወኪል መፍትሄዎች ስለ ባለብዙ ደረጃ ተግባራት የማመዛዘን እና እቅድን የመፍጠር ጥሩ ስራ እንደሚሰሩ ግልጽ ነው። ትክክለኛው ፈተና እነዚህ ስርአቶች እንዴት በትክክል እንደሚሰሩ የጎሳ እውቀት ባለው በተዘበራረቀ፣ በገሃዱ አለም አካባቢ ግድያ ነው። ስዕላዊ UIዎች የተገነቡት ለሰዎች መስተጋብር ነው፣ እና የእያንዳንዱ ድርጅት ብጁ አመክንዮ እንደ ሚኒ ጥቁር ቀዳዳ ውስብስብነት ነው። ምንም እንኳን GUIን ጭንቅላት ለሌለው አካሄድ ቢዘሉትም ወይም የጀርባውን ኤፒአይዎች ቢገለብጡም፣ አሁንም ቢሆን የጠርዝ ጉዳዮችን፣ የማረጋገጫ መሰናክሎችን፣ የዋጋ ገደቦችን ወይም የኤልኤልኤምዎችን ምርጡን የሚጥሉ ተለዋዋጭ የስራ ፍሰቶች ያጋጥሙዎታል።
ቀሪዎቹ ፈተናዎች በዋናነት የምህንድስና ችግሮች ናቸው፡ ጠንካራ መሳሪያዎችን መገንባት፣ ከኢንተርፕራይዝ ስርአቶች ጋር በጥልቀት መተሳሰር፣ የጥበቃ መስመሮችን መዘርጋት እና አስተማማኝ የክትትልና የኦርኬስትራ ማዕቀፎችን መፍጠር። እነዚህ በልዩ ጥረት እና በልዩነት ሊፈቱ የሚችሉ ናቸው። የዛሬዎቹ ኤል.ኤል.ኤም.ዎች ከአንድ አመት በፊት እንኳን ከነበረው እጅግ የላቀ የማመዛዘን ችሎታዎችን ያሳያሉ፣ እና ወጪቸው በፍጥነት እየቀነሰ ነው። አሁን ትኩረቱ እነዚህን ችሎታዎች በብቃት ለማሰማራት የሚያስፈልጉትን መሠረተ ልማት እና ሂደቶች ወደ ግንባታ ማሸጋገር አለበት።
ሆኖም እነዚህ ችግሮች እየተከሰተ ያለውን የማያቋርጥ እድገት ጥላ ሊሆኑ አይገባም። በተቆጣጠረው ጎራ ውስጥ ከፍተኛ ትክክለኛነትን የሚያቀርቡ ልዩ፣ በአቀባዊ ያተኮሩ AI አውቶሜትሶች (ለምሳሌ SDR ወይም የደንበኛ ድጋፍ ወኪሎች) እያየን ነው። እያንዳንዳቸው ነጠላ ጥቅም ላይ የሚውሉ አውቶሜትሶች ሲበስሉ፣ በሰንሰለት ታስረው ወደ ሰፊ የስራ ፍሰቶች ልናያቸው እንችላለን። ያ በመጨረሻ በትልልቅ ኢንተርፕራይዞች ውስጥ ከጫፍ እስከ ጫፍ አውቶሜትሽን የምንሰነጠቅበት መንገድ ሊሆን ይችላል፡ አንድ አጠቃላይ ዓላማ ያለው ወኪል ሁሉንም ነገር እንዲያደርግ ከመጠበቅ ይልቅ ብዙ ልዩ ወኪሎችን በማጣመር። ለአሁን፣ ከጭረት የሚወጣ ኤጀንት የመገንባት ROI ለሁሉም ከፍተኛ መጠን ያላቸውን ተግባራት ላይሆን ይችላል።
ከእነዚህ ፈተናዎች አንድ ትምህርት የልዩነት አስፈላጊነት ነው. በነጠላ ጎራ (ለምሳሌ በNetSuite ውስጥ ደረሰኞችን መፍጠር) ወደ ፍፁም ቅርብ የሆነ አስተማማኝነት ማግኘት ጉልህ የሆነ ማስተካከያ ይጠይቃል። በአንድ ልዩ የስራ ሂደት ላይ የሚያተኩሩ ጀማሪዎች ወይም የውስጥ ቡድኖች ከሰፊ እና አጠቃላይ መፍትሄ የተሻለ ልምድ ሊያቀርቡ ይችላሉ። በፋይናንስ፣ ሎጅስቲክስ፣ HR ወይም የአቅርቦት ሰንሰለት ውስጥ የታለሙ ተግባራትን የሚፈቱ የ"ቋሚ ወኪሎች" ማዕበል እያየን ነው። እያንዳንዱ ወኪል በጥልቅ ይዋሃዳል፣ ምናልባትም አስፈላጊ ሆኖ ሲገኝ የUI አውቶማቲክን ከተቻለ ቀጥታ የኤፒአይ ጥሪዎች እና እንዲሁም ጎራ-ተኮር የውድቀት ሎጂክ እና የጥበቃ መንገዶችን በማጣመር።
ትልቁ ጥያቄ ይቀራል፡ 2025 በእውነት እነዚህ ወኪሎች ወደ ተለመደው የሚሄዱበት ዓመት ይሆናል ወይንስ ረዘም ያለ ማኮብኮቢያ እየተመለከትን ነው? ቴክኖሎጂው በፍጥነት እየሄደ ነው, እና ብሩህ ተስፋዎች በዝተዋል. ነገር ግን ኮድ ማመንጨት ሲሻሻል የሶፍትዌር መሐንዲሶች እንደማይጠፉ ሁሉ፣ ለሁሉም ሂደቶች “ከእጅ-ነጻ” የኢንተርፕራይዝ አውቶሜትድ ላናይ እንችላለን። በምትኩ፣ በልዩ ኪስ ውስጥ ተደጋጋሚ ማሻሻያዎችን እናያለን፣ በመጨረሻም እነሱን እንደ ከፊል አውቶማቲክ ሞዛይክ በመስፋት።
የራስ ገዝ AI ወኪሎች ጽንሰ-ሀሳብ የማይካድ አሳማኝ ነው ፣ በተለይም በድርጅት መቼቶች ውስጥ ተደጋጋሚ ተግባራት። ሊሆኑ የሚችሉ ጥቅሞች - ጊዜን መቆጠብ, ስህተቶችን መቀነስ እና ሰራተኞች የበለጠ ፈጠራ እና ስልታዊ ስራ ላይ እንዲያተኩሩ ማስቻል - በጣም ትልቅ ነው. ነገር ግን፣ የኤጀንሲዎች የመሠረት አቅሞች ጠንካራ ሲሆኑ፣ ሰፊ ጉዲፈቻ የመግባት መንገዱ መሰረታዊ ምርምርን ከማስፋፋት በተጨማሪ የምህንድስና ፈተናዎችን በማሸነፍ ላይ ያተኮረ ነው።
ትክክለኛ መሠረተ ልማት መገንባት ቁልፍ ነው፡ ጠንካራ መሣሪያ፣ አስተማማኝ ውህደቶች እና ጎራ-ተኮር መፍትሄዎች በደንብ ከተገለጹ የጥበቃ መስመሮች እና የኦርኬስትራ ንብርብሮች ጋር። የእውነተኛ ዓለም ኢንተርፕራይዝ ስርዓቶች ውስብስብነት ልዩ መፍትሄዎችን ይፈልጋል, እና ይህ ቀጥ ያሉ ወኪሎች ሊበልጡ የሚችሉበት ነው. በጠባብ እና በደንብ የተገለጹ የስራ ፍሰቶች ላይ ማተኮር ቡድኖች መፍትሔዎቻቸውን በከፍተኛ ደረጃ ትክክለኛነት እና አስተማማኝነት እንዲያሻሽሉ ያስችላቸዋል, የእያንዳንዱን ጎራ ልዩ ተግዳሮቶች መፍታት. ከጊዜ በኋላ እነዚህ ልዩ ወኪሎች እርስ በርስ ሊገናኙ ይችላሉ, ይህም ሰፊ የሆነ የራስ-ሰር አውታረመረብ ይፈጥራሉ.
2025 አስደናቂ እድገቶችን እና ቁጥራቸው እየጨመረ የመጣ የሙከራ ፕሮግራሞችን ሊያመጣ ይችላል። አለም በአውቶፒሎት ከመሄድ ይልቅ የተወሰኑ ችግሮችን ለመፍታት የታለሙ እና በጣም ውጤታማ የሆኑ አውቶሜትሶችን የማየት እድላችን ሰፊ ነው። ወደ ሙሉ ኢንተርፕራይዝ አውቶሜሽን የሚደረገው ጉዞ በልዩነት እና በትብብር የሚመራ ተደጋጋሚ ይሆናል። ፍጥነቱ እየገነባ ነው፣ እና እነዚህን የምህንድስና ፈተናዎችን መፍታት ለቀጣዩ የኢንተርፕራይዝ ፈጠራ ማዕበል መንገድ ይከፍታል።
(የምስል ምስጋናዎች ለDALL-E)