지난 6개월 정도 동안 우리는 대규모 언어 모델의 대중적, 상업적 혁신을 목격했습니다. ChatGPT 및 GPT-4와 같은 AI 모델이 인상적이고 유용하다는 것은 부인할 수 없는 사실입니다. 우리가 보는 것은 단지 정교하게 다듬어진 최종 결과일 뿐입니다. 사용자 친화적인 표면 아래에는 GPT-4 교육에 투입된 1억 달러의 투자 , 이로 인해 남겨진 막대한 탄소 발자국 또는 독성 콘텐츠를 필터링하기 위해 오랜 시간 일한 개발도상국의 저임금 근로자가 보이지 않습니다. ChatGPT용.
더욱이, 대규모 언어 모델은 사용자 생성 콘텐츠 세대에 대해 훈련되었으며, 이제 우리가 액세스하기 위해 비용을 지불할 수 있는 집단적, 무보수 노력입니다. 이런 관점에서 볼 때 현대의 대규모 언어 모델의 놀라운 기능은 약간 기만적일 수 있으며 기술 독점 기업과 일반 대중 간의 지식 및 권력 격차로 인한 자연스러운 결과일 수 있습니다. 우리는 소를 도살하고 고기를 준비하는 데 들어간 무급 노동을 인식하지 못한 채 맛있는 고급 스테이크를 고급 스타일로 제공받고 있습니다.
이제 국회의원들이 AI의 개발과 사용을 규제해야 할 때입니다. 이 일을 하려면 국회의원들의 탁월한 예측력이 필요합니다. EU의 AI법 등 새로운 규제가 최종 발효될 때쯤이면 상황은 아마도 지금과 많이 다를 것이다.
ChatGPT는 이미 AI를 규제하려는 EU 위원회의 계획을 깨뜨린 것으로 알려져 있습니다. 그리고 이제 ChatGPT 및 기타 대형 언어 모델이 EU 위원회의 감시 대상이 되면서 OpenAI CEO인 Sam Altman을 포함한 많은 전문가들은 거대 AI 모델의 시대는 이미 끝났다고 말했습니다.
빅테크 기업들은 점점 더 유혹적인 조치로 사람들의 관심을 끌기 위해 경쟁하고 있으며, 국회의원들은 몇 바퀴 뒤처지고 있습니다. 이 특정 경주에서 거북이가 토끼를 이길 수 있는 유일한 방법은 규제 기관이 앞으로 몇 년, 수십 년 후에 다가올 발전을 기대할 수 있는 경우입니다.
최근의 발전으로 볼 때 AI의 다음 세대는 자동 에이전트가 될 가능성이 높습니다.
저는 자율 에이전트를 차세대 고급 챗봇으로 봅니다. ChatGPT는 간단한 텍스트 기반 작업을 수행하는 데 유용하지만 차세대 고급 챗봇은 훨씬 더 많은 기능을 제공합니다. 즉, 그들은 인간의 영향을 많이 받지 않고 스스로 행동할 수 있을 것입니다.
현재로서는 자율 에이전트를 광범위하게 사용하는 기술이 준비되지 않았습니다 . 그러나 이것이 우리가 그렇게해서는 안된다는 것을 의미하지는 않습니다. 다음은 최근 개발에 대한 간략한 개요입니다.
한 달 전 OpenAI는 ChatGPT에서 플러그인에 대한 초기 지원을 구현했다고 발표했습니다 .
새로운 웹 브라우저 플러그인을 사용하면 ChatGPT가 인터넷에 액세스하여 훈련 데이터 외부의 최신 정보를 검색할 수 있습니다. ChatGPT가 출시된 이후 사용자가 요청해 왔던 기능입니다. OpenAI의 또 다른 새로운 플러그인은 샌드박스 환경에서 Python을 사용하고, 업로드 및 다운로드를 처리하고, 현장 기술이 없는 프로그래밍에 관심이 있는 프로그래머는 물론 프로그래밍에 관심이 있는 사람들의 삶을 더 쉽게 만들어 줄 수 있는 실험적 코드 해석기입니다.
Klarna, Expedia, OpenTable Shopify, Zapier 및 Slack ChatGPT와 같은 타사 서비스에 대한 추가 플러그인을 사용하면 최고의 거래 및 할인을 선택하고, 여행 팁을 제공하고, 쇼핑 목록을 작성하고 식료품을 구매하고, 저녁 식사를 예약하고, 비즈니스 이메일을 작성하여 Gmail이나 Slack의 채팅 메시지를 통해 보냅니다.
이번 달 초 Hugging Face는 HuggingGPT: Hugging Face에서 ChatGPT 및 그 친구들을 사용하여 AI 작업 해결이라는 논문을 발표했습니다.
저자는 ChatGPT가 언어를 사용하여 기존 AI 모델을 관리하는 컨트롤러 역할을 하는 방법을 보여줍니다. ChatGPT와 기타 AI 모델을 연결하면 ChatGPT에 텍스트, 이미지, 비디오 및 오디오를 생성할 뿐만 아니라 다양한 형식의 콘텐츠에서 개체를 식별하고 설명하도록 요청할 수 있습니다.
예를 들어, document.jpg를 ChatGPT에 업로드하고, 찾고 있는 일부 정보를 검색하도록 요청하고, 텍스트를 소리내어 읽도록 할 수 있습니다. 또는 ChatGPT가 이미지의 특정 개체 수를 세도록 요청한 다음 이미지를 자세히 설명하고 설명을 기반으로 비디오를 만들 수 있습니다.
이러한 방식으로 ChatGPT는 다른 AI 모델을 활용하여 복잡한 AI 작업을 해결하는 데 사용될 수 있습니다.
지난주 #AutoGPT는 트위터에서 가장 인기 있는 해시태그였습니다. AutoGPT는 오픈 소스 개발자에게 매우 인기 있는 연구 및 실험 영역이 되었습니다.
본질적으로 AutoGPT , BabyAGI 또는 Microsoft Jarvis 와 같은 오픈 소스 모델은 GPT 3.5 또는 GPT-4 팔과 손과 같은 대규모 언어 모델의 "두뇌"를 제공하여 정의된 목표에 따라 작업을 수행하는 것을 목표로 합니다. 예를 들어, AutoGPT에 근처에서 가장 좋고 저렴한 레스토랑을 찾고 테이블을 예약하도록 요청할 수 있습니다. 아니면 인류를 파괴하고 세계적 지배력을 확립하고 불멸을 달성하도록 요청할 수도 있습니다. 대규모 언어 모델, 인터넷에 액세스하고 장단기 기억을 갖춘 AutoGPT는 이후 제공된 목표를 달성하기 위한 작업을 스스로 실행하게 됩니다.
AutoGPT를 설정하고 사용하려면 약간의 코딩 기술이 필요하지만 웹 기반 버전인 AgentGPT를 사용해 경험해 볼 수 있습니다.
스탠포드 대학과 Google Research가 최근 실시한 실험에서 소위 "생성 에이전트"는 심즈를 연상시키는 시뮬레이션 세계에서 인간의 행동을 시뮬레이션하고 스스로 행동합니다. 논문 에 따르면:
우리의 아키텍처를 ChatGPT 대규모 언어 모델에 연결함으로써 우리는 게임 환경에서 25명의 에이전트로 구성된 소규모 사회를 구현합니다. 최종 사용자는 이러한 에이전트를 관찰하고 상호 작용할 수 있습니다. 예를 들어 최종 사용자나 개발자가 마을에서 게임 내 발렌타인 데이 파티를 주최하기를 원하는 경우 기존 게임 환경에서는 수십 명의 캐릭터 행동을 수동으로 스크립팅해야 합니다. 우리는 생성 에이전트를 사용하여 한 에이전트에게 파티를 열고 싶다고 간단히 말하는 것만으로도 충분하다는 것을 보여줍니다. (..) 그들은 파티에 대한 소문을 퍼뜨린 다음 나타나며 한 에이전트는 다른 에이전트에게 데이트를 요청하기도 합니다. 이 모든 것은 사용자가 생성한 단일 시드 제안에서 나온 것입니다.
여기에서 시뮬레이션된 Sims와 유사한 환경에서 생성 에이전트를 따라갈 수 있습니다.
내 생각에 자율 에이전트를 생각하는 가장 간단한 방법은 개인용 디지털 비서입니다. 그들은 디지털 세계에서 우리의 요구를 처리할 수 있는 항상 존재하는 집사와 같습니다. 그리고 누구도 즐겨하지 않는 지루한 작업을 도와주세요. AI가 대행사에서 성장함에 따라 결국 직원이나 경영진 없이도 성장하는 자율적인 기업을 보게 될 것이라고 상상하는 것은 어렵지 않습니다.
자율 에이전트는 오늘날 이미 AI 및 소셜 미디어와 관련하여 우리가 직면하고 있는 심각한 문제의 깊이와 규모를 확대할 것입니다. 개인정보 보호, 스마트폰 중독, AI 블랙박스 문제, 정렬 문제 등의 문제는 전혀 새로운 의미를 갖게 될 것입니다.
이러한 문제에 대한 내 글을 팔로우하고 싶지만 아직 구독하지 않으셨다면 여기에서 The Gap을 구독하실 수 있습니다.