paint-brush
AI እኛ እንደምናደርገው ምስሎችን ቢረዳስ? ይህ ሞዴል ሊሆን ይችላል@hyperbole

AI እኛ እንደምናደርገው ምስሎችን ቢረዳስ? ይህ ሞዴል ሊሆን ይችላል

Hyperbole11m2025/03/01
Read on Terminal Reader

በጣም ረጅም፤ ማንበብ

ሃይ-ማፐር ሃይፐርቦሊክ ቦታን በመጠቀም፣ የትእይንት ግንዛቤን የሚያጎለብት እና የጥልቅ ትምህርት ኔትወርኮችን አፈፃፀም የሚያሳድግ የእይታ ተዋረዶችን የሚቀርፅ የኤአይአይ ሞዴል ነው።
featured image - AI እኛ እንደምናደርገው ምስሎችን ቢረዳስ? ይህ ሞዴል ሊሆን ይችላል
Hyperbole HackerNoon profile picture
0-item

ደራሲዎች፡-

(1) Hyeongjun Kwon, Yonsei ዩኒቨርሲቲ;

(2) Jinhyun Jang, Yonsei ዩኒቨርሲቲ;

(3) ጂን ኪም, Yonsei ዩኒቨርሲቲ;

(4) Kwonyoung Kim, Yonsei ዩኒቨርሲቲ;

(5) Kwanghoon Sohn, Yonsei ዩኒቨርሲቲ እና ኮሪያ የሳይንስ እና ቴክኖሎጂ ተቋም (KIST).

የአገናኞች ሰንጠረዥ

አብስትራክት እና 1 መግቢያ

2. ተዛማጅ ሥራ

3. ሃይፐርቦሊክ ጂኦሜትሪ

4. ዘዴ

4.1. አጠቃላይ እይታ

4.2. ሊሆን የሚችል ተዋረድ ዛፍ

4.3. የእይታ ተዋረድ መበስበስ

4.4. ሃይፐርቦሊክ ቦታ ውስጥ ተዋረድ መማር

4.5. የእይታ ተዋረድ ኢንኮዲንግ

5. ሙከራዎች እና 5.1. የምስል ምደባ

5.2. የነገር ማወቂያ እና የአብነት ክፍፍል

5.3. የትርጉም ክፍል

5.4. የእይታ እይታ

6. የጠለፋ ጥናቶች እና ውይይት

7. መደምደሚያ እና ማጣቀሻዎች

ሀ. የአውታረ መረብ አርክቴክቸር

ለ. ቲዎሬቲካል ቤዝላይን

ሐ. ተጨማሪ ውጤቶች

መ. ተጨማሪ እይታ

7. መደምደሚያ

በዚህ ጽሑፍ ውስጥ፣ የእይታ ትዕይንቶችን ተዋረዳዊ አደረጃጀት የሚመረምር ልብ ወለድ Visual Hierarchy Mapper (Hi-Mapper) አቅርበናል። ግቡን ማሳካት የቻልነው የዛፍ መሰል አወቃቀሩን ከፕሮባቢሊቲ ስርጭት ጋር በመለየት እና በሃይፐርቦሊክ ህዋ ያለውን ተዋረዳዊ ግንኙነት በመማር ነው። ተዋረዳዊ አተረጓጎም ወደ ንፅፅር ኪሳራ ውስጥ አካትተናል እና የእይታ ተዋረድን በመረጃ ቆጣቢ መንገድ በብቃት ለይተናል። በውጤታማ ተዋረድ መበስበስ እና ኢንኮዲንግ ሂደቶች፣ የታወቀው ተዋረድ በተሳካ ሁኔታ ወደ አለምአቀፍ ምስላዊ ውክልና ተዘርግቷል፣ ይህም የአንድን አጠቃላይ ትእይንት የተዋቀረ ግንዛቤ ያሳድጋል። Hi-Mapper ከነሱ ጋር ሲዋሃድ የነባር ዲኤንኤን አፈጻጸም በተከታታይ አሻሽሏል፣ እና በተለያዩ ጥቅጥቅ ያሉ ትንበያዎች ላይም ውጤታማነቱን አሳይቷል።


እውቅና ። ይህ ጥናት በ2022 (2022-22-0002) በ Yonsei Signature Research Cluster Program የተደገፈ ነው።

ዋቢዎች

[1] አሌክሳንደር ኤርሞሎቭ፣ ሌይላ ሚርቫካቦቫ፣ ቫለንቲን ክሩልኮቭ፣ ኒኩ ሴቤ እና ኢቫን ኦሴሌዴትስ። ሃይፐርቦሊክ እይታ ትራንስፎርመሮች፡ በሜትሪክ ትምህርት ውስጥ ማሻሻያዎችን በማጣመር። በ IEEE/CVF ኮንፈረንስ በኮምፒውተር እይታ እና ስርዓተ-ጥለት ዕውቅና ላይ፣ ገጽ 7409–7419፣ 2022። 1፣ 3


[2] ሱንግዮን ኪም፣ ቦሰንግ ጄኦንግ እና ሱሃ ክዋክ። ሂር፡ የመለኪያ ትምህርት ከክፍል መለያዎች በላይ በተዋረድ መደበኛ። በ IEEE/CVF ኮንፈረንስ ላይ በኮምፒውተር እይታ እና ስርዓተ-ጥለት ዕውቅና፣ ገጽ 19903–19912፣ 2023። 1፣ 3


[3] ጆርጂያ Gkioxari፣ Ross Girshick፣ Piotr Dollar እና Kaiming 'He የሰው-ነገር መስተጋብርን መለየት እና ማወቅ። የ IEEE ኮንፈረንስ በኮምፒዩተር እይታ እና ስርዓተ-ጥለት ማወቂያ ሂደት ውስጥ፣ ገጽ 8359–8367፣ 2018። 1


[4] Jinhyun Jang፣ Jungin Park፣ Jin Kim፣ Hyeongjun Kwon እና Kwanghoon Sohn። የት እንደሚያተኩር ማወቅ፡ የ Eventaware ትራንስፎርመር ለቪዲዮ grounding። በ IEEE/CVF ኮንፈረንስ ላይ በኮምፒውተር እይታ እና ስርዓተ-ጥለት ዕውቅና፣ ገጽ 13846–13856፣ 2023።


[5] Zhi Hou፣ Baosheng Yu፣ Yu Qiao፣ Xiaojiang Peng እና Dacheng Tao የሰው-ነገር መስተጋብርን ለመለየት የአቅም ማዘዋወር ትምህርት። በ IEEE/CVF ኮንፈረንስ ላይ በኮምፒውተር እይታ እና ስርዓተ-ጥለት ዕውቅና፣ ገጽ 495–504፣ 2021።


[6] ሃይኦንግጁን ክዎን፣ ታዮንግ መዝሙር፣ ሶሚ ጄኦንግ፣ ጂን ኪም፣ ጂንህዩን ጃንግ እና ክዋንጉዎን ሶን። ጥቅጥቅ ላለ ትንበያ ፕሮባቢሊቲ ፈጣን ትምህርት። በ IEEE/CVF ኮንፈረንስ ላይ በኮምፒውተር እይታ እና ስርዓተ-ጥለት ዕውቅና፣ ገጽ 6768–6777፣ 2023። 1፣ 3


[7] ጂን ኪም፣ ጂዮንግ ሊ፣ ጁንጊን ፓርክ፣ ዶንግቦ ሚን እና Kwanghoon Sohn። ማህደረ ትውስታውን ይሰኩት፡ የትርጉም ክፍልፋዮችን አጠቃላይ ለማድረግ መማር። በ IEEE/CVF ኮንፈረንስ ላይ በኮምፒውተር እይታ እና ስርዓተ-ጥለት ዕውቅና፣ ገጽ 4350–4360፣ 2022።


[8] አሌክሲ ዶሶቪትስኪ፣ ሉካስ ቤየር፣ አሌክሳንደር ኮልስኒኮቭ፣ ዲርክ ዌይሰንቦርን፣ Xiaohua Zhai፣ ቶማስ ኡንተርቲነር፣ ሙስጣፋ ዴህጋኒ፣ ማቲያስ ሚንደርደር፣ ጆርጅ ሃይጎልድ፣ ሲልቫን ጌሊ እና ሌሎችም። ምስል 16x16 ቃላት ዋጋ አለው፡ ለምስል ማወቂያ በመለኪያ። የ arXiv ቅድመ ህትመት አርXiv፡2010.11929፣ 2020. 1


[9] ፕራጂት ራማቻንድራን፣ ንጉሴ ፓርማር፣ አሽሽ ቫስዋኒ፣ ኢርዋን ቤሎ፣ አንሴልም ሌቭስካያ እና ጆን ሽሌንስ። በራዕይ ሞዴሎች ውስጥ ብቻውን ራስን ትኩረት መስጠት። በነርቭ መረጃ ማቀነባበሪያ ሥርዓቶች ውስጥ ያሉ እድገቶች፣ 32፣ 2019. 1


[10] ሄንግሹንግ ዣኦ፣ ጂያያ ጂያ እና ቭላድለን ኮልቱን። ለምስል ማወቂያ ራስን ትኩረት ማሰስ. በ IEEE/CVF ኮንፈረንስ በኮምፒዩተር እይታ እና ስርዓተ-ጥለት ማወቂያ ላይ በገጽ 10076–10085፣ 2020።


[11] Jianyuan Guo፣ Kai Han፣ Han Wu፣ Yehui Tang፣ Xinghao Chen፣ Yunhe Wang እና Chang Xu Cmt፡ Convolutional Neural Networks የእይታ ትራንስፎርመሮችን ያሟላሉ። በ IEEE/CVF ኮንፈረንስ በኮምፒውተር እይታ እና ስርዓተ-ጥለት ዕውቅና ላይ፣ ገጽ 12175–12185፣ 2022።


[12] Haiping Wu፣ Bin Xiao፣ Noel Codella፣ Mengchen Liu፣ Xiyang Dai፣ Lu Yuan እና Lei Zhang Cvt፡ ለዕይታ ትራንስፎርመሮች ውዝግቦችን ማስተዋወቅ። በ IEEE/CVF ዓለም አቀፍ ኮንፈረንስ በኮምፒውተር እይታ ገጽ 22-31፣ 2021። 1፣ 6


[13] Xiaoyi Dong፣ Jianmin Bao፣ Dongdong Chen፣ Weiming Zhang፣ Nenghai Yu፣ Lu Yuan፣ Dong Chen እና Baining Guo። Cswin ትራንስፎርመር፡- የመስቀል ቅርጽ ያላቸው መስኮቶች ያሉት አጠቃላይ እይታ ትራንስፎርመር የጀርባ አጥንት። በ IEEE/CVF ኮንፈረንስ በኮምፒውተር እይታ እና ስርዓተ-ጥለት እውቅና ላይ፣ ገጽ 12124–12134፣ 2022።


[14] Wenhai Wang፣ Enze Xie፣ Xiang Li፣ Deng-Ping Fan፣ Kaitao Song፣ Ding Liang፣ Tong Lu፣ Ping Luo እና Ling Shao። ፒራሚድ ቪዥን ትራንስፎርመር፡ ያለ convolutions ጥቅጥቅ ያለ ትንበያ ለማግኘት ሁለገብ የጀርባ አጥንት። በ IEEE/CVF ዓለም አቀፍ ኮንፈረንስ በኮምፒዩተር ራዕይ ላይ በገጽ 568-578፣ 2021።


[15] ያንጋኦ ሊ፣ ቻኦ-ዩዋን ዉ፣ ሃኦኪ ፋን፣ ካርቲኬያ ማንጋላም፣ ቦ ዢንግ፣ ጂቴንድራ ማሊክ እና ክሪስቶፍ ፌይችተንሆፈር። Mvitv2፡ ለምድብ እና ለመለየት የተሻሻሉ ባለ ብዙ እይታ ትራንስፎርመሮች። በ IEEE/CVF ኮንፈረንስ ላይ በኮምፒውተር እይታ እና ስርዓተ-ጥለት ዕውቅና፣ ገጽ 4804–4814፣ 2022።


[16] ቹን-ፉ ሪቻርድ ቼን፣ ኳንፉ ፋን እና ራምስዋር ፓንዳ። ክሮስቪት፡- ለምስል አመዳደብ ተሻጋሪ ትኩረት ባለብዙ ደረጃ እይታ ትራንስፎርመር። በ IEEE/CVF ዓለም አቀፍ ኮንፈረንስ በኮምፒውተር እይታ ገጽ 357-366፣ 2021። 1፣ 2፣ 6


[17] Pengzhen Ren፣ Changlin Li፣ Guangrun Wang፣ Yun Xiao፣ Qing Du፣ Xiaodan Liang እና Xiaojun Chang። ከመስተካከሉ ባሻገር፡ ተለዋዋጭ የመስኮት ምስላዊ ትራንስፎርመር። በ IEEE/CVF ኮንፈረንስ ላይ በኮምፒውተር እይታ እና ስርዓተ-ጥለት ዕውቅና፣ ገጽ 11987–11997፣ 2022።


[18] ሺታኦ ታንግ፣ ጂያሁ ዣንግ፣ ሲዩ ዡ እና ፒንግ ታን። ለእይታ ትራንስፎርመሮች ባለአራት ትኩረት። arXiv ቅድመ ህትመት አርXiv:2201.02767, 2022. 2, 4


[19] ሚንዩ ዲንግ፣ ይካንግ ሼን፣ ሊጂ ፋን፣ ዜንፋንግ ቼን፣ ዚቲያን ቼን፣ ፒንግ ሉኦ፣ ጆሹዋ ቢ ቴነንባም፣ እና ቹአንግ ጋን። የእይታ ጥገኝነት ትራንስፎርመሮች፡- የጥገኛ ዛፍ ከተገለበጠ ትኩረት ይወጣል። በ IEEE/CVF ኮንፈረንስ ላይ በኮምፒውተር እይታ እና ስርዓተ-ጥለት ዕውቅና ላይ፣ ገጽ 14528–14539፣ 2023። 2፣ 6፣ 7


[20] Tsung-Wei Ke፣ Sangwoo Mo እና X Yu Stella። እውቅና ለማግኘት እና እውቅና ለማግኘት ተዋረዳዊ ምስል ክፍልፍል መማር. በ12ኛው ዓለም አቀፍ የመማሪያ ውክልና ኮንፈረንስ፣ 2023. 2፣ 4


[21] N. Linial, E. London, እና Y. Rabinovich. የግራፎች ጂኦሜትሪ እና አንዳንድ አልጎሪዝም አፕሊኬሽኖቹ። በ35ኛው አመታዊ ሲምፖዚየም የኮምፒውተር ሳይንስ መሠረቶች ገጽ 577–591፣ 1994. doi: 10.1109/SFCS.1994.365733. 2


[22] ሆንግቢን ፔይ፣ ቢንግዜ ዌይ፣ ኬቨን ቻንግ፣ ቹንክሱ ዣንግ እና ቦ ያንግ። በግራፍ መክተት ውስጥ የተዛባነትን ለመከላከል የኩርቫተር መደበኛነት። በነርቭ መረጃ ማቀናበሪያ ስርዓቶች ውስጥ ያሉ እድገቶች፣ 33፡20779–20790፣ 2020።


[23] ማክስሚሊየን ኒኬል እና ዱዌ ኪዬላ። የPoincare መክተቻዎች ተዋረዳዊ ውክልናዎችን ለመማር። በነርቭ መረጃ ማቀነባበሪያ ሥርዓቶች ውስጥ ያሉ እድገቶች፣ 30፣ 2017።


[24] ማክስሚሊየን ኒኬል እና ዱዌ ኪዬላ። በሎሬንትዝ የሃይፐርቦሊክ ጂኦሜትሪ ሞዴል ውስጥ ተከታታይ ተዋረዶችን መማር። በአለም አቀፍ የማሽን መማሪያ ኮንፈረንስ፣ ገጽ 3779–3788. PMLR፣ 2018. 3


[25] ዚ ጋኦ፣ ዩዋይ ዉ፣ ዩንደ ጂያ እና መህርታሽ ሃራንዲ። ጥምዝ ማመንጨት በተጠማዘዙ ቦታዎች ለጥቂት ጥይት ትምህርት። በ IEEE/CVF ዓለም አቀፍ ኮንፈረንስ በኮምፒዩተር ራዕይ ገጽ 8691–8700፣ 2021።


[26] አሌክሳንድሩ ቲፍሬያ፣ ጋሪ ቤሲግኑል እና ኦክታቪያን-ኢዩገን ' Ganea። ፖይንካር ጓንት፡ ሃይፐርቦሊክ ቃል መክተት። arXiv ቅድመ ህትመት አርXiv:1810.06546, 2018. 3


[27] ዩዶንግ ዙ፣ ዲ ዡ፣ ጂንግሁዪ ዢያዎ፣ ሺን ጂያንግ፣ ዢያኦ ቼን እና ኩን ሊዩ። ከፍተኛ ጽሑፍ፡ ፈጣን ጽሑፍን ከሃይፐርቦሊክ ጂኦሜትሪ መስጠት። arXiv ቅድመ ህትመት አርXiv፡2010.16143፣ 2020. 3


[28] ኢኔስ ቻሚ፣ ዚታኦ ዪንግ፣ ክሪስቶፈር ሪ እና ጁሬ ሌስኮቭክ። ሃይፐርቦሊክ ግራፍ convolutional neural አውታረ መረቦች. በነርቭ መረጃ ማቀነባበሪያ ሥርዓቶች ውስጥ ያሉ እድገቶች፣ 32፣ 2019።


[29] ካራን ዴሳይ፣ ማክስሚሊያን ኒኬል፣ ታንማይ ራጃፑሮሂት፣ ጀስቲን ጆንሰን እና ሻንሙካ ራማክሪሽና ቬዳንታም። ሃይፐርቦሊክ የምስል-ጽሑፍ መግለጫዎች። በአለም አቀፍ የማሽን መማሪያ ኮንፈረንስ ገጽ 7694–7731። PMLR, 2023. 2, 3, 5


[30] ሉቃስ Vilnis እና አንድሪው McCallum. የቃላት ውክልናዎች በጋውስያን መክተት። በአለም አቀፍ የመማሪያ ውክልና ኮንፈረንስ, 2015. 2


[31] ቤን አቲዋራትኩን እና አንድሪው ጎርደን ዊልሰን። መልቲሞዳል የቃላት ስርጭቶች። arXiv ቅድመ ህትመት አርXiv:1704.08424, 2017. 3


[32] ቤን አቲዋራትኩን እና አንድሪው ጎርደን ዊልሰን። የተዋረድ ጥግግት ቅደም ተከተል መክተቻዎች። በአለም አቀፍ የመማሪያ ውክልና ላይ፣ 2018።


[33] ጌንግኮንግ ያንግ፣ ጂንጊ ዣንግ፣ ዮንግ ዣንግ፣ ባኦዩዋን Wu እና ዩጂዩ ያንግ። ለትዕይንት ግራፍ ትውልድ የትርጓሜ አሻሚነት ፕሮባቢሊቲ ሞዴሊንግ። በ IEEE/CVF ኮንፈረንስ ላይ በኮምፒውተር እይታ እና ስርዓተ-ጥለት ዕውቅና፣ ገጽ 12527–12536፣ 2021። 2


[34] ካይሚንግ ሄ፣ ዢያንግዩ ዣንግ፣ ሻኦኪንግ ሬን እና ጂያን ሱን። ለምስል ማወቂያ ጥልቅ ቀሪ ትምህርት። የ IEEE ኮንፈረንስ በኮምፒዩተር እይታ እና ስርዓተ-ጥለት ማወቂያ ሂደት ውስጥ፣ ገጽ 770–778፣ 2016። 2፣ 6, 12


[35] ሁጎ ቱቭሮን፣ ማቲዩ ኮርድ፣ ማቲጂስ ዱዜ፣ ፍራንሲስኮ ማሳ፣ አሌክሳንደር ሳላይሮልስ እና ሄርቬ ጄጉ። የስልጠና 'መረጃ ቆጣቢ ምስል ትራንስፎርመሮችን እና ትኩረትን በማራገፍ። በአለም አቀፍ የማሽን መማሪያ ኮንፈረንስ፣ ገጽ 10347–10357። PMLR፣ 2021. 2፣ 6፣ 7፣ 12


[36] ጂያ ዴንግ፣ ዌይ ዶንግ፣ ሪቻርድ ሶቸር፣ ሊ-ጂያ ሊ፣ ካይ ሊ እና ሊ ፌይ-ፊ። Imagenet፡ ትልቅ ደረጃ ያለው የተዋረድ ምስል ዳታቤዝ። በ 2009 የ IEEE ኮንፈረንስ በኮምፒውተር እይታ እና ስርዓተ-ጥለት ማወቂያ ገጽ 248-255። እ.ኤ.አ., 2009. 2, 6, 7, 8, 12, 14


[37] Tsung-Yi Lin፣ Michael Maire፣ Serge Belongie፣ James Hays፣ Pietro Perona፣ Deva Ramanan፣ Piotr Dollar እና C Lawrence 'Zitnick ማይክሮሶፍት ኮኮ፡ በዐውደ-ጽሑፍ ውስጥ የተለመዱ ነገሮች። በኮምፒውተር ቪዥን–ኢሲሲቪ 2014፡ 13ኛው የአውሮፓ ጉባኤ፣ ዙሪክ፣ ስዊዘርላንድ፣ ሴፕቴምበር 6-12፣ 2014፣ ሂደቶች፣ ክፍል V 13፣ ገጽ 740–755። ስፕሪንግ, 2014. 6, 7


[38] ቦሌይ ዡ፣ ሃንግ ዣኦ፣ Xavier Puig፣ Sanja Fidler፣ Adela Barriuso እና አንቶኒዮ ቶራልባ። በade20k ዳታ ስብስብ አማካኝነት ትዕይንት መተንተን። የ IEEE ኮንፈረንስ በኮምፒዩተር እይታ እና ስርዓተ-ጥለት ማወቂያ ሂደት ውስጥ፣ ገጽ 633–641፣ 2017። 2፣ 7


[39] ፔድሮ ኤፍ ፌልዘንዝዋልብ፣ ሮስ ቢ ጊርሺክ፣ ዴቪድ ማክሌስተር እና ዴቫ ራማናን በአድሎአዊነት የሰለጠኑ ከፊል-ተኮር ሞዴሎች ጋር የነገርን መለየት። የIEEE ግብይቶች በስርዓተ-ጥለት ትንተና እና የማሽን እውቀት፣ 32(9)፡1627-1645፣ 2009። 2


[40] ፌንግ ሃን እና ሶንግ-ቹን ዙ። ከታች ወደ ላይ/ከላይ ወደ ታች ምስልን ከባህሪ ሰዋሰው ጋር መተንተን። የIEEE ግብይቶች በስርዓተ-ጥለት ትንተና እና የማሽን እውቀት፣ 31(1)፡59–73፣ 2008


[41] ኤሪክ ቢ ሱደርዝ፣ አንቶኒዮ ቶራልባ፣ ዊሊያም ቲ ፍሪማን እና አላን ኤስ ዊልስኪ። የትዕይንቶች፣ የነገሮች እና ክፍሎች ተዋረዳዊ ሞዴሎችን መማር። በአሥረኛው IEEE ዓለም አቀፍ የኮምፒውተር ራዕይ ኮንፈረንስ (ICCV'05) ቅጽ 1፣ ጥራዝ 2፣ ገጽ 1331–1338። IEEE, 2005.


[42] ዡዌን ቱ፣ ዢያንግሮንግ ቼን፣ አላን ኤል ዩይል እና ሶንግ-ቹን ዙ። ምስልን መተንተን፡- ክፍልፋይን፣ ፈልጎ ማግኘትን እና እውቅናን አንድ ማድረግ። ዓለም አቀፍ የኮምፒዩተር ራዕይ ጆርናል፣ 63፡113–140፣ 2005. 2


[43] ቲያንፉ ዉ እና ሶንግ-ቹን ዙ። ከታች ወደ ላይ እና ከላይ ወደ ታች የማጠቃለያ ሂደቶች እና-ወይም ግራፎች ላይ የቁጥር ጥናት። ዓለም አቀፍ የኮምፒዩተር ራዕይ ጆርናል፣ 93፡226–252፣ 2011. 2


[44] ዌንጓን ዋንግ፣ ዢጂ ዣንግ፣ ሲዩአን ቺ፣ ጂያንቢንግ ሼን፣ ያንዌይ ፓንግ እና ሊንግ ሻኦ። ለሰው ልጅ ትንተና የተቀናጀ የነርቭ መረጃ ውህደት መማር። በ IEEE/CVF ዓለም አቀፍ ኮንፈረንስ በኮምፒውተር እይታ ገጽ 5703–5713፣ 2019።


[45] ዌንጓን ዋንግ፣ ሃይሎንግ ዙ፣ ጂፌንግ ዳይ፣ ያንዌይ ፓንግ፣ ጂያንቢንግ ሼን እና ሊንግ ሻኦ። ተዋረዳዊ የሰው መተንተን በተተየበው ከፊል-ግንኙነት ምክንያት። በ IEEE/CVF ኮንፈረንስ በኮምፒዩተር እይታ እና ስርዓተ-ጥለት ማወቂያ ላይ በገጽ 8929–8939፣ 2020።


[46] ሳንድሮ ብራውን፣ ፓትሪክ ኢሰር እና ብጆርን ኦመር። ክትትል የማይደረግበት ክፍል ግኝት ክትትል በማይደረግበት መበታተን። በስርዓተ-ጥለት እውቅና፡ 42ኛው DAGM የጀርመን ጉባኤ፣ DAGM GCPR 2020፣ Tubingen, Germany፣ ሴፕቴምበር 28–ጥቅምት 1፣ 2020፣ ሂደቶች 42፣ ገጽ 345–359። ስፕሪንግ, 2021. 2


[47] Subhabrata Choudhury፣ Iro Laina፣ Christian Rupprecht እና Andrea Vedaldi። ቁጥጥር የማይደረግበት ክፍል ከንፅፅር ተሃድሶ. በነርቭ መረጃ ማቀናበሪያ ስርዓቶች ውስጥ ያሉ እድገቶች፣ 34፡28104–28118፣ 2021።


[48] ዌይ-ቺህ ሁንግ፣ ቫሩን ጃምፓኒ፣ ሲፊ ሊዩ፣ ፓቭሎ ሞልቻኖቭ፣ ሚንግ-ህሱአን ያንግ እና ጃን ካውትዝ። ስኮፕስ: በራስ ቁጥጥር የሚደረግ የጋራ ክፍል ክፍፍል. በ IEEE/CVF ኮንፈረንስ ላይ በኮምፒውተር እይታ እና ስርዓተ-ጥለት ዕውቅና፣ ገጽ 869–878፣ 2019።


[49] Tsung-Wei Ke፣ Sangwoo Mo እና Stella X. Yu እውቅና ለማግኘት እና እውቅና ለማግኘት ተዋረዳዊ ምስል ክፍልፍል መማር. በ12ኛው ዓለም አቀፍ የመማሪያ ውክልና ኮንፈረንስ፣ 2024. 2


[50] ሳንጊዩክ ቹን፣ ሴኦንግ ጁን ኦ፣ ራፋኤል ሳምፓዮ ደ ረዘንዴ፣ ያኒስ ካላንቲዲስ እና ዳያን ላርለስ። ለመስቀል-ሞዳል መልሶ ማግኛ ፕሮባቢሊቲክ መክተቻዎች። በ IEEE/CVF ኮንፈረንስ በኮምፒውተር እይታ እና ስርዓተ-ጥለት ዕውቅና ላይ፣ ገጽ 8415–8424፣ 2021። 3፣ 5


[51] ዪቹን ሺ እና አኒል ኬ ጄን። ሊሆኑ የሚችሉ የፊት መሸፈኛዎች። በ IEEE/CVF ዓለም አቀፍ የኮምፒውተር ራዕይ ኮንፈረንስ ላይ፣ ገጽ 6902–6911፣ 2019። 3


[52] Jungin Park፣ Jiyoung Lee፣ Ig-Jae Kim እና Kwanghoon Sohn። ለቪዲዮ ንፅፅር ትምህርት ፕሮባቢሊቲ ውክልናዎች። በ IEEE/CVF ኮንፈረንስ በኮምፒዩተር እይታ እና ስርዓተ-ጥለት ማወቂያ ላይ በገጽ 14711–14721፣ 2022።


[53] ማክስሚሊየን ኒኬል እና ዱዌ ኪዬላ። ተዋረዳዊ ውክልናዎችን ለመማር የPoincare መክተቻዎች። በኒውራል መረጃ ማቀነባበሪያ ስርዓቶች ውስጥ ያሉ እድገቶች, 30, 2017. 3


[54] ሚና ጋዲሚ አቲግ፣ ጁሊያን ሾፕ፣ ኤርማን አካር፣ ናኔ ቫን ኖርድ እና ፓስካል ሜትስ። ሃይፐርቦሊክ ምስል ክፍፍል. በ IEEE/CVF ኮንፈረንስ በኮምፒውተር እይታ እና ስርዓተ-ጥለት ማወቂያ ላይ በገጽ 4453–4462፣ 2022።


[55] ዠንዘን ዌንግ፣ መህመት ጊራይ ኦጉት፣ ሻኢ ሊሞንቺክ እና ሴሬና ዬንግ። ቁጥጥር ያልተደረገበት የረጅም ጅራት ግኝት ለምሳሌ ተዋረዳዊ ራስን መቆጣጠርን በመጠቀም። በ IEEE/CVF ኮንፈረንስ ስለ ኮምፒውተር እይታ እና ስርዓተ-ጥለት ማወቂያ፣ ገጽ 2603–2612፣ 2021።


[56] ቫለንቲን ክሩልኮቭ፣ ሌይላ ሚርቫካቦቫ፣ ኢቫንያ ኡስቲኖቫ፣ ኢቫን ኦሴሌዴትስ እና ቪክቶር ሌምፒትስኪ። ሃይፐርቦሊክ ምስል መክተቻዎች። በ IEEE/CVF ኮንፈረንስ ላይ በኮምፒውተር እይታ እና ስርዓተ-ጥለት ዕውቅና ላይ፣ ገጽ 6418–6428፣ 2020። 3


[57] ደርክ ፒ ኪንግማ፣ ቲም ሳሊማንስ እና ማክስ ዌሊንግ። ተለዋጭ ማቋረጥ እና የአካባቢያዊ ማስተካከያ ዘዴ። በኒውራል መረጃ ማቀነባበሪያ ስርዓቶች ውስጥ ያሉ እድገቶች, 28, 2015. 4


[58] አሮን ቫን ደን ኦርድ፣ ያዚ ሊ እና ኦሪዮል ቪኒያልስ። የውክልና ትምህርት ከንፅፅር ትንበያ ኮድ ጋር። arXiv ቅድመ ህትመት አርXiv:1807.03748, 2018. 5


[59] ሚንግክሲንግ ታን እና ኩኦክ ሌ። Efficientnet፡ ለኮንቮሉሽን ነርቭ አውታሮች የሞዴል ልኬትን እንደገና በማሰብ ላይ። በአለም አቀፍ የማሽን መማር ኮንፈረንስ ገጽ 6105–6114። PMLR፣ 2019 6፣ 12


[60] Ze Liu፣ Yutong Lin፣ Yue Cao፣ Han Hu፣ Yixuan Wei፣ ዜንግ ዣንግ፣ እስጢፋኖስ ሊን እና ባይንግ ጉኦ። ስዊን ትራንስፎርመር፡- ተዋረዳዊ እይታ ትራንስፎርመር የተቀየሩ መስኮቶችን በመጠቀም። በ IEEE/CVF ዓለም አቀፍ ኮንፈረንስ በኮምፒውተር እይታ ገጽ 10012–10022፣ 2021። 6፣ 7፣ 12


[61] ዌንሃይ ዋንግ፣ ኢንዜ ዢ፣ ዢያንግ ሊ፣ ዴንግ-ፒንግ ፋን፣ ካይታኦ ዘፈን፣ ዲንግ ሊያንግ፣ ቶንግ ሉ፣ ፒንግ ሉኦ እና ሊንግ ሻኦ። Pvt v2፡ የተሻሻለ የመነሻ መስመሮች ከፒራሚድ እይታ ትራንስፎርመር ጋር። የስሌት ቪዥዋል ሚዲያ፣ 8(3):415–424፣ 2022. 6፣ 7


[62] ሚንዩ ዲንግ፣ ቢን Xiao፣ ኖኤል ኮድላ፣ ፒንግ ሉኦ፣ ጂንግዶንግ ዋንግ እና ሉ ዩዋን። ዳዊት፡- ባለሁለት ትኩረት እይታ ትራንስፎርመሮች። በአውሮፓ የኮምፒዩተር ራዕይ ኮንፈረንስ ገጽ 74-92። ስፕሪንግ, 2022. 6


[63] ፔንግቹዋን ዣንግ፣ ዢያንግ ዳይ፣ ጂያንዌ ያንግ፣ ቢን ዢያኦ፣ ሉ ዩዋን፣ ሌይ ዣንግ እና ጂያንፈንግ ጋኦ። የብዝሃ-ልኬት እይታ ረጅም ሰሪ፡ ለከፍተኛ ጥራት ምስል ኢንኮዲንግ አዲስ ራዕይ ትራንስፎርመር። በ IEEE/CVF ዓለም አቀፍ ኮንፈረንስ በኮምፒዩተር ራዕይ ላይ በገጽ 2998–3008፣ 2021።


[64] Tsung-Yi Lin፣ Priya Goyal፣ Ross Girshick፣ Kaiming He እና Piotr Dollar ጥቅጥቅ ያሉ ነገሮችን ለመለየት የትኩረት ማጣት። በ IEEE ዓለም አቀፍ ኮንፈረንስ ላይ በኮምፒዩተር ራዕይ ገጽ 2980-2988፣ 2017።


[65] ኤላድ ሆፈር፣ ታል ቤን-ኑን፣ ኢታይ ሁባራ፣ ኒቭ ጊላዲ፣ ቶርስተን ሆፍለር እና ዳንኤል ሶድሪ። ባችህን ጨምር፡ በምሳሌ መደጋገም አጠቃላይነትን ማሻሻል። በ IEEE/CVF ኮንፈረንስ ላይ በኮምፒውተር እይታ እና ስርዓተ-ጥለት ዕውቅና ላይ፣ ገጽ 8129–8138፣ 2020።


[66] ኢሊያ ሎሽቺሎቭ እና ፍራንክ ሁተር። የተበላሸ የክብደት መበስበስ መደበኛነት። arXiv ቅድመ ህትመት አርXiv:1711.05101, 2017. 6


[67] ካይሚንግ ሄ፣ ጆርጂያ Gkioxari፣ ፒዮትር ዶላር እና ሮስ ጊርሺክ። ጭንብል r-cnn. በ IEEE ዓለም አቀፍ ኮንፈረንስ ላይ በኮምፒዩተር ራዕይ ሂደት ውስጥ፣ ገጽ 2961–2969፣ 2017። 7፣ 12


[68] ያንጋኦ ሊ፣ ሃንዚ ማኦ፣ ሮስ ጊርሺክ እና ካይሚንግ ሄ። የዕይታ ትራንስፎርመር የጀርባ አጥንቶችን ለዕቃ ፈልጎ ማግኘት። በአውሮፓ የኮምፒዩተር ራዕይ ኮንፈረንስ ገጽ 280-296። ስፕሪንግ, 2022. 7


[69] አሌክሳንደር ኪሪሎቭ፣ ሮስ ጊርሺክ፣ ካይሚንግ ሄ እና ፒዮትር ዶላር። የፓኖፕቲክ ባህሪ ፒራሚድ አውታረ መረቦች። በ IEEE/CVF ኮንፈረንስ በኮምፒውተር እይታ እና ስርዓተ-ጥለት ማወቂያ ላይ በገጽ 6399–6408፣ 2019።


[70] Tete Xiao፣ Yingcheng Liu፣ Bolei Zhou፣ Yuing Jiang እና Jian Sun ለትዕይንት ግንዛቤ የተዋሃደ የማስተዋል ትንተና። በኮምፒዩተር እይታ (ኢ.ሲ.ሲ.ቪ.) የአውሮፓ ኮንፈረንስ ገጽ 418-434፣ 2018። 7፣ 12


ይህ ወረቀት በ CC BY 4.0 DEED ፍቃድ በarxiv ላይ ይገኛል