paint-brush
एलएलएम का उपयोग करके स्वचालित उपग्रह चित्र कैप्शन निर्माण की ओर: संदर्भद्वारा@fewshot
115 रीडिंग

एलएलएम का उपयोग करके स्वचालित उपग्रह चित्र कैप्शन निर्माण की ओर: संदर्भ

द्वारा The FewShot Prompting Publication 2m2024/06/16
Read on Terminal Reader

बहुत लंबा; पढ़ने के लिए

शोधकर्ताओं ने एआरएसआईसी प्रस्तुत किया है, जो एलएलएम और एपीआई का उपयोग करके रिमोट सेंसिंग इमेज कैप्शनिंग की एक विधि है, जो सटीकता में सुधार करती है और मानव एनोटेशन की आवश्यकता को कम करती है।
featured image - एलएलएम का उपयोग करके स्वचालित उपग्रह चित्र कैप्शन निर्माण की ओर: संदर्भ
The FewShot Prompting Publication  HackerNoon profile picture
0-item

लेखक:

(1) यिंगक्सू हे, कंप्यूटर विज्ञान विभाग नेशनल यूनिवर्सिटी ऑफ़ सिंगापुर {[email protected]};

(2) क्युकी सन, कॉलेज ऑफ लाइफ साइंसेज नानकाई यूनिवर्सिटी {[email protected]}.

लिंक की तालिका

संदर्भ

[1] आर्मेन अघाजन्यान, बर्नी हुआंग, कैंडेस रॉस, व्लादिमीर करपुखिन, हू जू, नमन गोयल, दिमित्रो ओखोन्को, मंदार जोशी, गार्गी घोष, माइक लुईस और ल्यूक ज़ेटलमॉयर। CM3: इंटरनेट का एक कारणपूर्ण मास्क्ड मल्टीमॉडल मॉडल। CoRR, abs/2201.07520, 2022।


[2] जियान डिंग, नान ज़ू, गुई-सोंग ज़िया, जियांग बाई, वेन यांग, माइकल यांग, सर्ज बेलोंगी, जिएबो लुओ, मिहाई डाटकू, मार्सेलो पेलिलो और लियांगपेई झांग। हवाई छवियों में ऑब्जेक्ट डिटेक्शन: एक बड़े पैमाने पर बेंचमार्क और चुनौतियाँ। IEEE ट्रांजेक्शन ऑन पैटर्न एनालिसिस एंड मशीन इंटेलिजेंस, पेज 1–1, 2021।


[3] जॉन क्लेनबर्ग और ईवा टार्डोस। एल्गोरिदम डिज़ाइन। एडिसन-वेस्ले लॉन्गमैन पब्लिशिंग कंपनी, इंक., यूएसए, 2005। [4] डेरियस लैम, रिचर्ड कुज़्मा, केविन मैकगी, सैमुअल डूली, माइकल लैली, मैथ्यू क्लैरिक, यारोस्लाव बुलाटोव और ब्रेंडन मैककॉर्ड। एक्सव्यू: ओवरहेड इमेजरी में संदर्भ में ऑब्जेक्ट। CoRR, abs/1802.07856, 2018।


[5] जुन्नान ली, डोंगक्सू ली, कैमिंग ज़ियोनग, और स्टीवन सीएच होई। बीएलआईपी: एकीकृत दृष्टि-भाषा समझ और निर्माण के लिए भाषा-छवि पूर्व-प्रशिक्षण को बूटस्ट्रैप करना। सीओआरआर, एब्स/2201.12086, 2022।


[6] शियाओकियांग लू, बिनकियांग वांग, ज़ियांगताओ झेंग और ज़ुएलोंग ली। रिमोट सेंसिंग इमेज कैप्शन जेनरेशन के लिए मॉडल और डेटा की खोज। IEEE ट्रांजेक्शन ऑन जियोसाइंस एंड रिमोट सेंसिंग, 56(4):2183–2195।


[7] ओपनएआई. चैटजीपीटी का परिचय, नवंबर 2022.


[8] रामकृष्ण वेदांतम, सी. लॉरेंस ज़िटनिक और देवी पारिख। साइडर: आम सहमति आधारित छवि विवरण मूल्यांकन, 2015।


[9] जियानफ़ेंग वांग, झेंगयुआन यांग, ज़ियाओवेई हू, लिंज़ी ली, केविन लिन, झे गण, ज़िचेंग लियू, सी लियू, और लिजुआन वांग। गिट: दृष्टि और भाषा के लिए एक जनरेटिव इमेज-टू-टेक्स्ट ट्रांसफॉर्मर, 2022।


[10] शुन्यु याओ, जेफ़री झाओ, डियान यू, नान डू, इज़हाक शफ़रान, कार्तिक नरसिम्हन, और युआन काओ। रिएक्ट: भाषा मॉडल में तर्क और अभिनय का तालमेल, 2023।


[11] शी यी और ग्रेग ड्यूरेट। पाठ्य तर्क के लिए कुछ-शॉट संकेत में स्पष्टीकरण की अविश्वसनीयता, 2022।


[12] लिली यू, बोवेन शि, रमाकांत पासुनुरु, बेंजामिन मुलर, ओल्गा गोलोवनेवा, तियानलू वांग, अरुण बाबू, बिन्ह तांग, ब्रायन करर, शेली शेइनिन, कैंडेस रॉस, एडम पोलाक, रसेल होवेस, वासु शर्मा, पुक्सिन जू, होवनेस तामोयान, ओरोन अशुएल, उरीएल सिंगर, शांग-वेन ली, सुसान झांग, रिचर्ड जेम्स, गार्गी घोष, यानिव ताइगमैन, मरियम फज़ल-ज़रंडी, असली सेलिकिलमाज़, ल्यूक ज़ेटलमॉयर और आर्मेन अघाजन्यान। ऑटोरेग्रसिव मल्टी-मोडल मॉडल को स्केल करना: प्रीट्रेनिंग और इंस्ट्रक्शन ट्यूनिंग, 2023।


[13] वेनकी झांग, योंगलियांग शेन, वीमिंग लू और यूटिंग झुआंग। डेटा-कोपायलट: स्वायत्त वर्कफ़्लो के साथ अरबों डेटा और मनुष्यों को जोड़ना, 2023।