KompyutaTeknolojia ya habari

Kisasa kompyuta maono. Kazi na teknolojia ya kompyuta maono. Programu ya kompyuta Vision katika Python

Jinsi ya kufundisha kompyuta kuelewa ni depicted katika picha au picha? Hii inaonekana rahisi, lakini kwa ajili ya kompyuta hii ni Matrix yenye zeros na ndio ambayo unataka kutoa maelezo muhimu.

Je kompyuta maono? Ni uwezo wa "kuona" kompyuta yako

Vision - ni chanzo muhimu cha habari kwa ajili ya mtu kutumia hiyo, sisi kupata, kulingana na makadirio mbalimbali, kutoka 70 hadi 90% ya taarifa zote. Na, kwa hakika, kama sisi wanataka kujenga gari smart, tunahitaji kutekeleza ujuzi huo na kompyuta.

tatizo la maono ya kompyuta inaweza kuwa alisema ni wazi kabisa. Nini ni "kuona"? Inaeleweka kuwa ambapo kuna tu kwa kuangalia. Hiyo alihitimisha tofauti ya maono ya kompyuta na maono ya binadamu. Vision kwetu - ni chanzo cha elimu juu ya dunia, na pia chanzo cha habari tani - yaani, uwezo wa kuelewa umbali na ukubwa.

Semantic kernel picha

Kuangalia picha, tunaweza kueleza kuwa na idadi ya sifa, hivyo kusema, kwa kutoa maelezo ya semantic.

Kwa mfano, kuangalia picha hii, tunaweza kusema kwamba ni nje. Ni nini trafiki mji. Kwamba kuna magari. tunaweza nadhani kwamba hii ni ya Kusini-Mashariki Asia na usanidi wa jengo na hieroglyphics. picha ya Mao Zedong kuelewa kwamba hii ni Beijing, na kama mtu yeyote niliona video ya moja au yeye mwenyewe alikuwa huko, bila nadhani kwamba hii ni maarufu Tiananmen Square.

Nini tunaweza kusema zaidi juu ya picha, kuona hivyo? Tunaweza kutambua vitu katika picha, kusema, kwamba kuna watu hapa karibu - uzio. Hapa miavuli, mabango kwamba jengo la. Hii ni mifano ya madarasa ni vitu muhimu sana, ambayo ni kushiriki katika kutafuta kwa muda.

Bado tunaweza kujifunza baadhi ya vipengele au sifa ya vitu. Kwa mfano, hapa tunaweza kuamua kwamba hii si picha ya Kichina ya kawaida, yaani, Mao Zedong.

Kwa mujibu wa gari inaweza kuamua kwamba ni kitu kusonga, na ni ngumu, kwamba ni si deformed wakati wa harakati. Kuhusu bendera inaweza kuwa alisema kwamba vitu, wao pia kusonga, lakini si ngumu, mara kwa mara deformed. Na katika eneo la tukio kuna upepo, ambayo inaweza kuamua na kuendeleza bendera, na wanaweza hata kuamua mwelekeo wa upepo, kwa mfano, ni kupiga kutoka kushoto kwenda kulia.

umbali na urefu katika maono ya kompyuta

muhimu sana ni habari tani kuhusu kompyuta maono sayansi. Hii ni kila aina ya umbali. Kwa mfano, kwa Rover ni muhimu sana kwa sababu timu ni kutoka Dunia dakika 20 na kujibu kama mengi. Kwa hiyo, kiungo kwenda na kurudi - dakika 40. Na kama sisi kufanya mpango wa amri harakati ya Dunia, unahitaji kuchukua katika akaunti.

Mafanikio jumuishi teknolojia ya maono kompyuta katika michezo ya video. Kwa mujibu wa video, unaweza kujenga mifano ya pande tatu ya vitu, watu, na picha kwenye mtumiaji anaweza uondoe vielelezo pande tatu ya miji. Na kisha kutembea juu yao.

maono ya kompyuta - mbalimbali badala kote. Ni inafanaa na sayansi zingine mbalimbali. Sehemu ya maono ya kompyuta Ni Ukamataji picha usindikaji eneo hilo na wakati mwingine kutenga maono ya kompyuta, kihistoria.

Uchambuzi, mfano kutambua - njia ya kuundwa kwa akili mkuu

Hebu kuchunguza dhana hizi tofauti.

Image Processing - hii ni eneo la mipangilio, ambapo pembejeo na pato - picha, na sisi kuwa naye kufanya kitu.

picha ya uchambuzi - ni eneo la kompyuta maono, ambayo inalenga kufanya kazi na picha ya pande mbili na kufanya hitimisho kutokana na hili.

Pattern Recognition - abstract hisabati nidhamu ambayo inatambua data katika mfumo wa wadudu. Hiyo ni, katika mlango - vector na tuna kitu cha kufanya na hayo. Ambapo vector ni, hatuwezi muhimu kujua.

Kompyuta maono - ni awali ilikuwa kurejesha muundo wa picha ya pande mbili. Leo eneo hili imekuwa pana na inaweza kutafsiriwa kama kukubali yote ya vitu halisi na kufanya, kwa kuzingatia picha. Hiyo ni, ni kazi ya akili bandia.

Sambamba na maono ya kompyuta katika uwanja tofauti kabisa, katika geodesy, photogrammetry imebadilika - kipimo cha umbali kati ya vitu juu ya picha mbili-dimensional.

Robots unaweza "kuona"

Na hatimaye - hii ni mashine kuona. Chini ya maono ya mashine ina maana maono ya robots. Hiyo ni uamuzi wa matatizo baadhi ya uzalishaji. Tunaweza kusema kwamba kompyuta maono - ni moja kubwa ya sayansi. Inaunganisha baadhi ya wengine sayansi sehemu. Na maono ya kompyuta anapata maombi fulani, ni zamu katika maono mashine.

Kompyuta maono mkoa ina wingi wa maombi ya vitendo. Ni kuhusishwa na automatisering ya uzalishaji. Wakati makampuni kuwa madhubuti kuchukua nafasi kazi za mikono kwa mashine. mashine haina kupata uchovu, si kulala, alikuwa na ratiba ya kazi ya kawaida, yeye ni tayari kufanya kazi siku 365 kwa mwaka. Hivyo, kwa kutumia mashine ya kazi, tunaweza kupata matokeo uhakika wakati fulani, na ni ya kuvutia kabisa. kazi zote zina matumizi ya wazi kwa ajili ya mifumo ya kompyuta maono. Na kuna kitu bora zaidi kuliko kuona matokeo mara moja kwenye picha tu katika hatua ya hesabu.

Kuingia katika ulimwengu wa akili bandia

Plus eneo - ni ngumu! sehemu kubwa ya ubongo kuwajibika kwa maono, na ni kuamini kwamba kama kufundisha kompyuta yako na "kuona", yaani, full matumizi ya kompyuta maono, ni moja ya malengo ya akili ya bandia. Kama tunaweza kutatua tatizo katika ngazi ya binadamu, uwezekano mkubwa wakati huo huo, sisi kutatua tatizo la AI. Hiyo ni nzuri sana! Au si nzuri sana, kama wewe kuangalia, "Terminator 2".

Kwa nini maono - ni vigumu? Kwa sababu mfano wa kitu hicho inaweza kutofautiana sana kulingana na mambo ya nje. Kulingana na kitu cha pointi uchunguzi kuangalia tofauti.

Kwa mfano, moja na takwimu sawa, kuchukuliwa kutoka pembe tofauti. Na nini ni kuvutia zaidi katika takwimu inaweza kuwa jicho moja, macho mawili na nusu. Na kulingana na muktadha (kama picha hii ya mtu katika shati na macho rangi), jicho inaweza kuwa zaidi ya mbili.

Kompyuta bado haina kuelewa, lakini "kuona"

Sababu nyingine ambayo inafanya kuwa vigumu - ni mwanga. eneo moja na taa mbalimbali kuangalia tofauti. kitu ukubwa inaweza kutofautiana. Zaidi ya hayo, malengo ya darasa yoyote. Unawezaje kusema kuhusu mtu ambaye urefu wake wa mita 2? Chochote. ukuaji wa binadamu na wanaweza 2.3 m, na urefu wa 80. Kama ilivyo kwa aina nyingine ya vitu, hata hivyo, ni malengo ya darasa moja.

Hasa vitu hai kupitia aina ya aina. Hair watu, wanariadha, wanyama. Angalia picha za farasi mbio, kuamua nini kinaendelea na mane yao na mkia ni tu haiwezekani. vitu zinazobadilika kwa mfano? Kama mkupuo kompyuta picha, hata mashine ya nguvu zaidi kupata ugumu wa kutoa uamuzi wa haki.

Next maoni - ni kujificha. Baadhi ya vitu, wanyama wanojisingizia kuwa mazingira, na kabisa kwa ustadi. Na maeneo sawa na Coloring. Hata hivyo, tunaona nao, ingawa si mara zote kwa mbali.

Mwingine tatizo - harakati. Vitu katika mwendo unimaginable kupitia ulemavu.

Wengi wa vitu ni kutofautiana sana. Hapa, kwa mfano, katika picha mbili hapa chini malengo ya "kiti".

Na kwenye hii unaweza kukaa. Lakini kufundisha mashine, kama kwamba mambo tofauti katika sura, rangi, vifaa, kila kitu ni kitu "kiti" - ni vigumu sana. Hii ni changamoto. Kuunganisha njia za maono ya kompyuta - ni kufundisha mashine kuelewa, kuchambua, kubashiri.

Ushirikiano wa maono kompyuta katika majukwaa mbalimbali

wingi wa maono ya kompyuta alianza kupenya zaidi katika 2001, wakati yeye iliyoundwa kwanza uso detector. Sisi alifanya hivyo waandishi mbili: Viola, Jones. Ni mara ya kwanza kwa kasi na ya kuaminika kutosha algorithm, ambayo alionyesha nguvu ya mbinu kujifunza mashine.

Sasa kompyuta maono kutosha programu mpya ya vitendo - kutambua uso wa binadamu.

Lakini kwa kutambua mtu kama katika sinema - katika pembe random, hali tofauti ya taa - ni haiwezekani. Lakini kutatua tatizo, au moja ambayo watu mbalimbali na taa mbalimbali au katika pose tofauti, sawa kama katika picha katika pasipoti, inawezekana kwa kiwango cha juu cha kujiamini.

mahitaji ya pasipoti picha kiasi kikubwa kutokana na hulka ya mipangilio uso kutambuliwa.

Kwa mfano, kama una pasipoti biometriska, katika baadhi ya viwanja vya ndege ya kisasa, unaweza kutumia moja kwa moja mfumo wa pasipoti kudhibiti.

Unsolved tatizo la maono ya kompyuta - uwezo wa kutambua maandishi yoyote

Labda mtu angetumia OCR mfumo. Moja ya hizi - Fine Reader, ni maarufu sana katika mfumo wa RuNet. Kuna aina nyingi ambapo kujaza data, ni kikamilifu scanned, habari ni kutambuliwa na mfumo vizuri sana. Lakini kutokana na maandishi yoyote katika picha hali ni mbaya zaidi. Tatizo hili bado unsolved.

Michezo kuwashirikisha maono ya kompyuta, mwendo kukamata

Tenga eneo kubwa - ni kuundwa kwa mifano pande tatu na mwendo kukamata (ambayo ni kabisa kwa mafanikio katika michezo ya kompyuta). programu ya kwanza, ambayo inatumia maono ya kompyuta - mfumo wa mwingiliano na kompyuta kwa kutumia ishara. Wakati iliundwa ilikuwa mambo mengi ya wazi.

algorithm imeundwa kwa urahisi kabisa, lakini configure ilichukua kujenga jenereta ya picha synthetic ya watu kupata picha milioni. Kompyuta zenye nguvu pamoja nao wa kuchagua vigezo ya algorithm, ambapo yeye sasa kazi vizuri.

Hiyo ni milioni picha na wiki hesabika kompyuta zenye muda inawezekana kuunda algorithm kwamba hutumia 12% ya uwezo wa processor moja na inaruhusu mtu wanaona nafasi katika muda halisi. Mfumo huu wa Microsoft Kinect (2010).

Tafuta picha na maudhui utapata upload photos na mfumo, na matokeo yake kutoa picha zote zenye maudhui sawa na kufanya kutoka upande mmoja.

Mifano ya maono ya kompyuta: pande tatu na ramani ya pande mbili zinafanyika na hayo. Ramani za magari navigation mara kwa mara updated kulingana na DVR.

Kuna database na mabilioni ya picha geotagged. Kwa kupakua picha katika database, unaweza kuamua ambapo ilikuwa alifanya, na hata na baadhi ya mtazamo. Bila shaka, mradi mahali ni maarufu kiasi kwamba kwa wakati mmoja watalii na kufanya idadi kubwa ya picha za eneo kuwa huko.

robots ni kila mahali

Robotics wakati huu, kila mahali, bila kwa njia yoyote. Sasa kuna magari ambayo kamera maalum ambayo kutambua watembea kwa miguu na alama za barabara ili kupitisha amri kwa dereva (hii kwa namna programu ya kompyuta ili kuona, husaidia motorist). Na kuna otomatiki magari robotic, lakini haziwezi kutegemea tu juu ya mfumo wa kamera ya video bila ya matumizi ya kiasi kikubwa cha maelezo ya ziada.

kamera ya kisasa - hii ni mfano kamera obscura

Hebu majadiliano juu ya picha ya digital. Kisasa kamera digital mpangilio wa kanuni ya kamera obscura. Tu badala ya shimo kwa njia ambayo mwanga inaingia kusambaza na makadirio kwenye ukuta nyuma ya chumba ya mzunguko chini, tuna maalum mfumo wa macho kuitwa Lens. kitu yake ni kukusanya kubwa mwanga boriti na kubadilisha ili rays wote walivuka salama uhakika virtual ili kupata makadirio na kuunda picha kwenye filamu au tumbo.

Kisasa digital kamera (tumbo) inaundwa na vipengele mtu binafsi - pikseli. Kila pixel unaweza kupima nishati ya mwanga ambayo ni tukio juu ya pixel jumla, na kutoa moja ya simu pato. Kwa hiyo, katika kamera digital, sisi kupata badala ya mwangaza picha vipimo kuweka mwanga, hawakupata katika pixel moja - kompyuta uwanja wa maoni. Kwa hiyo, wakati picha tunaona si inapita mistari na mtaro wa wazi, na gridi ya mraba rangi katika rangi tofauti - Ukubwa.

Hapa chini unaweza kuona kwanza digital picha katika dunia.

Lakini katika picha hii si? Rangi. rangi ni nini?

Kisaikolojia mtazamo wa rangi

Rangi - hii ni nini cha kuona. rangi ya moja na kitu kimoja kwa binadamu na paka itakuwa tofauti. Tangu sisi (binadamu) na mnyama mfumo wa macho - maono ni tofauti. Kwa hiyo, rangi - ni kisaikolojia ubora wa maono yetu ambayo hutokea wakati kuchunguza vitu na mwanga. Na si mali ya mwili wa kitu na mwanga. Rangi - ni matokeo ya mwingiliano wa vipengele mwanga, na eneo la mfumo wetu kuona.

Programu ya kompyuta Vision katika Python kutumia maktaba

Kama umeamua kushiriki kwa umakini katika utafiti wa maono ya kompyuta, unapaswa mara moja kujiandaa kwa ajili ya idadi ya matatizo, sayansi hii si rahisi na kuficha idadi ya pitfalls. Lakini "Programming Kompyuta Vision juu Python" uandishi wa Jan Erik Solema - kitabu hicho muhtasari lugha zote rahisi zaidi. Hapa utapata kujifahamisha na mbinu za kutambua vitu mbalimbali katika 3D, kujifunza kufanya kazi na picha Stereo, ukweli virtual na maombi mengine mengi ya maono ya kompyuta. Katika kitabu ni mifano ya kutosha katika Python. Lakini maelezo ni iliyotolewa, hivyo kusema, wa jumla, hivyo kama si overload utafiti sana na data ngumu. Kazi yanafaa kwa ajili ya wanafunzi, amateurs, na kukubali. Kupakua kitabu hiki na wengine kuhusu kompyuta maono (pdf ya format) unaweza kuwa katika mtandao.

Kwa sasa, kuna chanzo maktaba ya mipangilio ya kompyuta maono na usindikaji picha na namba mipangilio OpenCV. Ni kutekelezwa na lugha ya kisasa ya programu, ni chanzo wazi. Kama sisi majadiliano juu ya maono ya kompyuta, Python inatumia kama lugha ya programu, pia ina msaada wa maktaba, katika Aidha, ni daima kutoa na ina jamii kubwa.

kampuni "Microsoft" hutoa huduma zake Api-na uwezo wa kutoa mafunzo kwa mtandao wa fahamu kufanya kazi yake na picha ya watu. Pia kuna nafasi ya kutumia maono ya kompyuta, Python inatumia kama lugha ya programu.

Similar articles

 

 

 

 

Trending Now

 

 

 

 

Newest

Copyright © 2018 sw.delachieve.com. Theme powered by WordPress.