LLM Knowledge Graph Builder ແມ່ນຫນຶ່ງໃນເຄື່ອງມືລະບົບນິເວດ GraphRAG ຂອງ Neo4j ທີ່ຊ່ວຍໃຫ້ທ່ານສາມາດປ່ຽນຂໍ້ມູນທີ່ບໍ່ມີໂຄງສ້າງໄປສູ່ກາຟຄວາມຮູ້ແບບເຄື່ອນໄຫວ. ມັນໄດ້ຖືກລວມເຂົ້າກັບ chatbot Retrieval-Augmented Generation (RAG), ເຮັດໃຫ້ການສອບຖາມພາສາທໍາມະຊາດແລະຄວາມເຂົ້າໃຈທີ່ອະທິບາຍໄດ້ໃນຂໍ້ມູນຂອງທ່ານ.
Neo4j LLM Knowledge Graph Builder ເປັນຄໍາຮ້ອງສະຫມັກອອນໄລນ໌ທີ່ມີນະວັດກໍາສໍາລັບການປ່ຽນຂໍ້ຄວາມທີ່ບໍ່ມີໂຄງສ້າງເຂົ້າໄປໃນເສັ້ນສະແດງຄວາມຮູ້ທີ່ບໍ່ມີລະຫັດແລະບໍ່ມີ Cypher, ສະຫນອງປະສົບການການປ່ຽນຂໍ້ຄວາມທີ່ມະຫັດສະຈັນ. ມັນໃຊ້ແບບຈໍາລອງ ML (LLMs: OpenAI, Gemini, Diffbot) ເພື່ອຫັນປ່ຽນ PDFs, ຫນ້າເວັບ, ແລະວິດີໂອ YouTube ເຂົ້າໄປໃນຕາຕະລາງຄວາມຮູ້ຂອງຫນ່ວຍງານແລະຄວາມສໍາພັນຂອງພວກເຂົາ.
ສ່ວນດ້ານໜ້າແມ່ນແອັບພລິເຄຊັນ React ໂດຍອີງໃສ່ ຊຸດເຄື່ອງເລີ່ມເຂັມ ຂອງພວກເຮົາ, ແລະດ້ານຫຼັງແມ່ນແອັບພລິເຄຊັນ Python FastAPI. ມັນໃຊ້ ໂມດູນ llm-graph-transformer ທີ່ Neo4j ປະກອບສ່ວນເຂົ້າໃນ LangChain.
ຄໍາຮ້ອງສະຫມັກສະຫນອງປະສົບການ seamless, ປະຕິບັດຕາມສີ່ຂັ້ນຕອນງ່າຍດາຍ:
ພວກເຮົາສະຫນອງຄໍາຮ້ອງສະຫມັກໃນ ສະພາບແວດລ້ອມ Neo4j-hosted ຂອງພວກເຮົາທີ່ບໍ່ມີບັດເຄຣດິດທີ່ຕ້ອງການແລະບໍ່ມີກະແຈ LLM — ບໍ່ມີ friction.
ອີກທາງເລືອກ, ເພື່ອດໍາເນີນການມັນຢູ່ໃນທ້ອງຖິ່ນຫຼືພາຍໃນສະພາບແວດລ້ອມຂອງທ່ານ, ໄປຢ້ຽມຢາມ GitHub repo ສາທາລະນະແລະປະຕິບັດຕາມຄໍາແນະນໍາຂັ້ນຕອນໂດຍຂັ້ນຕອນທີ່ພວກເຮົາຈະກວມເອົາໃນການຕອບນີ້.
ກ່ອນທີ່ພວກເຮົາຈະເປີດແລະນໍາໃຊ້ LLM Knowledge Graph Builder, ໃຫ້ສ້າງຖານຂໍ້ມູນ Neo4j ໃຫມ່. ສໍາລັບການນັ້ນ, ພວກເຮົາສາມາດນໍາໃຊ້ຖານຂໍ້ມູນ AuraDB ຟຣີໂດຍປະຕິບັດຕາມຂັ້ນຕອນເຫຼົ່ານີ້:
ໃນປັດຈຸບັນທີ່ພວກເຮົາມີຖານຂໍ້ມູນ Neo4j ຂອງພວກເຮົາແລ່ນແລະຂໍ້ມູນປະຈໍາຕົວຂອງພວກເຮົາ, ພວກເຮົາສາມາດເປີດ LLM Knowledge Graph Builder, ແລະຄລິກໃສ່ ການເຊື່ອມຕໍ່ກັບ Neo4j ໃນມຸມຂວາເທິງ.
ວາງໄຟລ໌ຂໍ້ມູນປະຈໍາຕົວທີ່ດາວໂຫລດມາໃນກ່ອງໂຕ້ຕອບການເຊື່ອມຕໍ່. ຂໍ້ມູນທັງຫມົດຄວນຈະຖືກຕື່ມໃສ່ໂດຍອັດຕະໂນມັດ. ອີກທາງເລືອກ, ທ່ານສາມາດໃສ່ທຸກສິ່ງທຸກຢ່າງດ້ວຍຕົນເອງ.
ຂະບວນການເລີ່ມຕົ້ນດ້ວຍການເອົາຂໍ້ມູນທີ່ບໍ່ມີໂຄງສ້າງຂອງທ່ານ, ເຊິ່ງຫຼັງຈາກນັ້ນໄດ້ຜ່ານ LLM ເພື່ອກໍານົດຫນ່ວຍງານທີ່ສໍາຄັນແລະຄວາມສໍາພັນຂອງພວກເຂົາ.
ທ່ານສາມາດ drag ແລະລົງ PDF ແລະໄຟລ໌ອື່ນໆເຂົ້າໄປໃນເຂດການປ້ອນຂໍ້ມູນທໍາອິດຢູ່ເບື້ອງຊ້າຍ. ການປ້ອນຂໍ້ມູນທີສອງຈະເຮັດໃຫ້ເຈົ້າຄັດລອກ/ວາງລິ້ງໄປຫາວິດີໂອ YouTube ທີ່ເຈົ້າຕ້ອງການໃຊ້, ໃນຂະນະທີ່ການປ້ອນຂໍ້ມູນທີສາມໃຊ້ລິ້ງໜ້າ Wikipedia.
ຕົວຢ່າງນີ້, ຂ້ອຍຈະໂຫລດ PDF ຈໍານວນຫນ້ອຍທີ່ຂ້ອຍມີກ່ຽວກັບບໍລິສັດລະບົບຕ່ອງໂສ້ການສະຫນອງທີ່ເອີ້ນວ່າ GraphACME, ບົດຄວາມຂ່າວຈາກ Forbes , ແລະ ວິດີໂອ YouTube ກ່ຽວກັບ Corporate Sustainability Due Diligence Directive (CSDDD), ເຊັ່ນດຽວກັນກັບສອງຫນ້າຈາກ Wikipedia: ຄໍາແນະນໍາຂອງບໍລິສັດຄວາມຍືນຍົງເນື່ອງຈາກຄວາມພາກພຽນ ແລະ ບັງກະລາເທດ .
ໃນຂະນະທີ່ການອັບໂຫລດໄຟລ໌, ແອັບພລິເຄຊັນຈະເກັບແຫຼ່ງທີ່ອັບໂຫລດໄວ້ເປັນຈຸດເອກະສານໃນກາຟໂດຍໃຊ້ LangChain Document Loaders ແລະຕົວແຍກວິເຄາະ YouTube. ເມື່ອໄຟລ໌ທັງຫມົດໄດ້ຖືກອັບໂຫລດ, ທ່ານຄວນເຫັນບາງສິ່ງບາງຢ່າງທີ່ຄ້າຍຄືກັນນີ້:
ທັງໝົດທີ່ພວກເຮົາຕ້ອງເຮັດຕອນນີ້ແມ່ນເລືອກຕົວແບບເພື່ອໃຊ້, ຄລິກ ສ້າງກຣາບ , ແລະປ່ອຍໃຫ້ເວດມົນເຮັດສ່ວນທີ່ເຫຼືອໃຫ້ກັບເຈົ້າ!
ຖ້າທ່ານຕ້ອງການສ້າງການເລືອກໄຟລ໌, ທ່ານສາມາດເລືອກໄຟລ໌ທໍາອິດ (ໂດຍມີກ່ອງກາເຄື່ອງຫມາຍຢູ່ໃນຖັນທໍາອິດຂອງຕາຕະລາງ) ແລະຄລິກ ສ້າງຕາຕະລາງ .
⚠️ ສັງເກດວ່າຖ້າທ່ານຕ້ອງການໃຊ້ແຜນຜັງທີ່ກໍານົດໄວ້ລ່ວງຫນ້າຫຼືຮູບແບບກາຟຂອງທ່ານເອງ, ທ່ານສາມາດຄລິກໃສ່ໄອຄອນການຕັ້ງຄ່າໃນມຸມຂວາເທິງແລະເລືອກ schema ທີ່ກໍານົດໄວ້ກ່ອນຈາກເມນູເລື່ອນລົງ, ໃຊ້ຂອງທ່ານເອງໂດຍການຂຽນລົງ. ປ້າຍຊື່ແລະການພົວພັນ, ດຶງ schema ທີ່ມີຢູ່ຈາກຖານຂໍ້ມູນ Neo4j ທີ່ມີຢູ່ແລ້ວ, ຫຼືຄັດລອກ / ວາງຂໍ້ຄວາມແລະຂໍໃຫ້ LLM ວິເຄາະມັນແລະອອກມາດ້ວຍ schema ທີ່ແນະນໍາ.
ໃນຂະນະທີ່ມັນກໍາລັງປະມວນຜົນໄຟລ໌ຂອງເຈົ້າ ແລະສ້າງ Knowledge Graph ຂອງເຈົ້າ, ໃຫ້ຂ້ອຍສະຫຼຸບສິ່ງທີ່ເກີດຂຶ້ນພາຍໃຕ້ຫົວ:
ຂໍ້ມູນທີ່ຖືກແຍກອອກຈາກເອກະສານຂອງທ່ານແມ່ນມີໂຄງສ້າງເປັນຮູບແບບກຣາຟ, ບ່ອນທີ່ຫົວຫນ່ວຍກາຍເປັນ nodes, ແລະຄວາມສໍາພັນໄດ້ກາຍເປັນຂອບການເຊື່ອມຕໍ່ຂໍ້ເຫຼົ່ານີ້. ຄວາມງາມຂອງການນໍາໃຊ້ Neo4j ແມ່ນຢູ່ໃນຄວາມສາມາດໃນການເກັບຮັກສາແລະສອບຖາມເຄືອຂ່າຍຂໍ້ມູນທີ່ສັບສົນເຫຼົ່ານີ້ຢ່າງມີປະສິດທິພາບ, ເຮັດໃຫ້ເສັ້ນສະແດງຄວາມຮູ້ທີ່ສ້າງຂຶ້ນທັນທີເປັນປະໂຫຍດສໍາລັບຫຼາຍໆຄໍາຮ້ອງສະຫມັກ.
ກ່ອນທີ່ພວກເຮົາຈະໃຊ້ຕົວແທນ RAG ເພື່ອຖາມຄໍາຖາມກ່ຽວກັບຂໍ້ມູນຂອງພວກເຮົາ, ພວກເຮົາສາມາດເລືອກເອກະສານຫນຶ່ງ (ຫຼືຫຼາຍ) ດ້ວຍກ່ອງກາເຄື່ອງຫມາຍແລະຄລິກ Show Graph . ນີ້ຈະສະແດງຫນ່ວຍງານທີ່ສ້າງຂຶ້ນສໍາລັບເອກະສານທີ່ທ່ານເລືອກ; ນອກນັ້ນທ່ານຍັງສາມາດສະແດງເອກະສານແລະ chunks node ໃນມຸມເບິ່ງນັ້ນ:
ປຸ່ມ Open Graph with Bloom ຈະເປີດ Neo4j Bloom ເພື່ອຊ່ວຍໃຫ້ທ່ານເຫັນພາບ ແລະນຳທາງກາຟຄວາມຮູ້ທີ່ສ້າງຂຶ້ນໃໝ່ຂອງເຈົ້າ. ການດໍາເນີນການຕໍ່ໄປ — ລຶບໄຟລ໌ — ລຶບເອກະສານທີ່ເລືອກ ແລະ chunks ຈາກກາຟ (ແລະຫນ່ວຍງານຖ້າຫາກວ່າທ່ານເລືອກມັນຢູ່ໃນທາງເລືອກ).
ຕອນນີ້ມາຮອດສ່ວນສຸດທ້າຍ: ຕົວແທນ RAG ທີ່ເຈົ້າສາມາດເຫັນໄດ້ໃນກະດານທີ່ຖືກຕ້ອງ.
ຮູບພາບຂ້າງລຸ່ມນີ້ສະແດງໃຫ້ເຫັນທັດສະນະທີ່ງ່າຍດາຍຂອງຂະບວນການ GraphRAG.
ເມື່ອຜູ້ໃຊ້ຖາມຄໍາຖາມ, ພວກເຮົາໃຊ້ Neo4j vector index ດ້ວຍການສອບຖາມຂໍ້ມູນເພື່ອຄົ້ນຫາ chunks ທີ່ກ່ຽວຂ້ອງທີ່ສຸດສໍາລັບຄໍາຖາມແລະຫນ່ວຍງານທີ່ເຊື່ອມຕໍ່ຂອງພວກເຂົາເຖິງຄວາມເລິກຂອງ 2 hops. ພວກເຮົາຍັງສະຫຼຸບປະຫວັດການສົນທະນາ ແລະໃຊ້ມັນເປັນອົງປະກອບເພື່ອເສີມສ້າງບໍລິບົດ.
ວັດສະດຸປ້ອນແລະແຫຼ່ງຂໍ້ມູນຕ່າງໆ (ຄໍາຖາມ, ຜົນໄດ້ຮັບ vector, ປະຫວັດການສົນທະນາ) ທັງຫມົດຖືກສົ່ງໄປຫາຕົວແບບ LLM ທີ່ເລືອກໃນການກະຕຸ້ນເຕືອນທີ່ກໍາຫນົດເອງ, ຂໍໃຫ້ສະຫນອງແລະຈັດຮູບແບບຄໍາຕອບຕໍ່ຄໍາຖາມທີ່ຖາມໂດຍອີງໃສ່ອົງປະກອບແລະສະພາບການທີ່ສະຫນອງໃຫ້. ແນ່ນອນ, ການກະຕຸ້ນເຕືອນມີ magic ຫຼາຍ, ເຊັ່ນ: ການຈັດຮູບແບບ, ຂໍໃຫ້ອ້າງເຖິງແຫຼ່ງຂໍ້ມູນ, ເພື່ອບໍ່ໃຫ້ຄາດເດົາວ່າຄໍາຕອບແມ່ນບໍ່ຮູ້, ແລະອື່ນໆ. ການເຕືອນແລະຄໍາແນະນໍາຢ່າງເຕັມທີ່ສາມາດພົບໄດ້ເປັນ FINAL_PROMPT ໃນ QA_integration.py .
ໃນຕົວຢ່າງນີ້, ຂ້າພະເຈົ້າໄດ້ໂຫລດເອກະສານພາຍໃນກ່ຽວກັບບໍລິສັດປອມທີ່ມີຊື່ວ່າ GraphACME (ຢູ່ໃນເອີຣົບ), ການຜະລິດແລະເອກະສານຍຸດທະສາດຕ່ອງໂສ້ການສະຫນອງແລະຜະລິດຕະພັນທັງຫມົດຂອງພວກເຂົາ. ຂ້ອຍຍັງໄດ້ໂຫລດບົດຄວາມຂ່າວແລະວິດີໂອ YouTube ທີ່ອະທິບາຍ CSDDD ໃຫມ່, ຜົນກະທົບຂອງມັນ, ແລະກົດລະບຽບ. ຕອນນີ້ພວກເຮົາສາມາດຖາມຄໍາຖາມ chatbot ກ່ຽວກັບຄວາມຮູ້ຂອງບໍລິສັດພາຍໃນ (ປອມ) ຂອງພວກເຮົາ - ຄໍາຖາມກ່ຽວກັບກົດຫມາຍ CSDDD, ຫຼືແມ້ກະທັ້ງຄໍາຖາມໃນທົ່ວທັງສອງ, ເຊັ່ນ: ການຮ້ອງຂໍບັນຊີລາຍຊື່ຂອງຜະລິດຕະພັນ GraphACME ຜະລິດ, ຖ້າພວກເຂົາໄດ້ຮັບຜົນກະທົບຈາກກົດລະບຽບ CSDDD, ແລະ. ຖ້າເປັນດັ່ງນັ້ນ, ມັນຈະສົ່ງຜົນກະທົບຕໍ່ບໍລິສັດແນວໃດ.
ຢູ່ເບື້ອງຂວາຂອງໜ້າຈໍຫຼັກ, ທ່ານຈະສັງເກດເຫັນສາມປຸ່ມທີ່ຕິດຢູ່ກັບໜ້າຕ່າງສົນທະນາ:
ໃນຄໍາຕອບຂອງຕົວແທນ RAG, ທ່ານຈະພົບເຫັນສາມລັກສະນະຫຼັງຈາກການຕອບສະຫນອງ:
ເພື່ອລົງເລິກເຂົ້າໄປໃນ LLM Knowledge Graph Builder, GitHub Repository ສະຫນອງຂໍ້ມູນຈໍານວນຫລາຍ, ລວມທັງລະຫັດແຫຼ່ງແລະເອກະສານ. ນອກຈາກນັ້ນ, ເອກະສານ ຂອງພວກເຮົາໃຫ້ຄໍາແນະນໍາຢ່າງລະອຽດກ່ຽວກັບການເລີ່ມຕົ້ນ, ແລະ ລະບົບນິເວດ GenAI ສະເຫນີຄວາມເຂົ້າໃຈຕື່ມອີກກ່ຽວກັບເຄື່ອງມືແລະຄໍາຮ້ອງສະຫມັກທີ່ກວ້າງຂວາງ.
ປະສົບການຂອງທ່ານກັບ LLM Knowledge Graph Builder ແມ່ນບໍ່ມີຄ່າ. ຖ້າຫາກທ່ານພົບຂໍ້ບົກພ່ອງ, ມີຄໍາແນະນໍາສໍາລັບຄຸນນະສົມບັດໃຫມ່, ຕ້ອງການທີ່ຈະປະກອບສ່ວນ, ຫຼືຕ້ອງການທີ່ຈະເບິ່ງການປັບປຸງບາງຢ່າງ, ເວທີຊຸມຊົນແມ່ນບ່ອນທີ່ດີເລີດທີ່ຈະແບ່ງປັນຄວາມຄິດຂອງທ່ານ. ສໍາລັບຜູ້ທີ່ມີຄວາມຊໍານານໃນການຂຽນລະຫັດ, ການປະກອບສ່ວນໂດຍກົງໃນ GitHub ສາມາດເປັນວິທີທີ່ດີທີ່ຈະຊ່ວຍພັດທະນາໂຄງການ. ການປ້ອນຂໍ້ມູນ ແລະ ການປະກອບສ່ວນຂອງທ່ານບໍ່ພຽງແຕ່ຊ່ວຍປັບປຸງເຄື່ອງມືເທົ່ານັ້ນ ແຕ່ຍັງສົ່ງເສີມຊຸມຊົນທີ່ມີການຮ່ວມມື ແລະ ນະວັດຕະກໍາ:
ສຶກສາເພີ່ມເຕີມກ່ຽວກັບຊັບພະຍາກອນໃໝ່ສຳລັບແອັບພລິເຄຊັນ GenAI: Neo4j GraphRAG Ecosystem Tools . ເຄື່ອງມືແຫຼ່ງເປີດເຫຼົ່ານີ້ເຮັດໃຫ້ມັນງ່າຍທີ່ຈະເລີ່ມຕົ້ນດ້ວຍຄໍາຮ້ອງສະຫມັກ GenAI ພື້ນຖານທີ່ມີເສັ້ນສະແດງຄວາມຮູ້, ເຊິ່ງຊ່ວຍປັບປຸງຄຸນນະພາບການຕອບສະຫນອງແລະການອະທິບາຍແລະເລັ່ງການພັດທະນາແລະການຮັບຮອງເອົາ app.