Komputer, Téhnologi informasi
Visi komputer modern. Tugas jeung téhnologi visi komputer. Programming Visi Komputer di Python
Kumaha carana ngajarkeun komputer ka ngarti naon anu digambarkeun dina gambar atawa gambar? Ieu sigana basajan, tapi pikeun komputer ieu ngan matriks diwangun ku nol tur leuwih ti nu rék nimba informasi penting.
Naon visi komputer? Ieu kamampuhan pikeun "tingali" komputer
Visi - mangrupa sumber penting informasi pikeun jalma nu ngagunakeun eta, urang ménta, nurutkeun rupa perkiraan, ti 70 nepi ka 90% sagala informasi. Na, tangtosna, lamun urang rék nyieun hiji mobil pinter, urang kudu nerapkeun kaahlian jeung komputer nu sarua.
Masalah visi komputer bisa nyatakeun rada jelas. Naon "tingali"? Hal ieu dipikaharti yén dimana aya ngan ku pilari. Yén menyimpulkan béda visi komputer tur visi manusa. Visi pikeun urang - eta mangrupakeun sumber pangaweruh ngeunaan dunya, kitu ogé mangrupa sumber inpormasi métrik - maksudna, pangabisa pikeun neuleuman jarak sarta ukuran.
gambar kernel semantis
Nempo gambar, urang bisa ngajelaskeun deui ku Jumlah atribut, jadi mun nyarita, nimba informasi semantik.
Contona, pilari dina gambar ieu, urang tiasa disebutkeun yen ieu ker. What is the lalulintas kota. Yén aya mobil. urang tiasa nebak yen ieu Selatan-East Asia dina konfigurasi tina wangunan na hieroglyphics. The potret tina Mao Zedong ngarti yén ieu téh Beijing, sarta lamun saha nempo video live atawa dirina geus aya, bakal nebak yen ieu teh Tiananmen Square kawentar.
Naon tiasa kami nyebutkeun ngeunaan gambar, ningali eta? Urang bisa nangtukeun objék dina gambar, ngomong, yén aya jalma dieu ngadeukeutan - pager. Di dieu payung, poster nu wangunan urang. Di handap ieu mangrupakeun conto kelas téh objék pohara penting, anu keur aya di teang keur momen.
Masih bisa neuleuman sababaraha fitur atawa atribut objék. Contona, di dieu urang bisa nangtukeun yén ieu téh lain potret tina hiji Cina biasa, nyaéta, Mao Zedong.
Numutkeun kendaraan bisa ditangtukeun yén éta téh mangrupa obyék anu gerak, sarta éta teuas, éta henteu cacad salila gerak. Ngeunaan umbul bisa ngomong yén éta objék, aranjeunna oge pindah, tapi maranéhna teu teuas, terus cacad. Sarta dina adegan aya angin, anu bisa ditangtukeun ku ngamekarkeun umbul, komo bisa nangtukeun arah mata angin, contona, eta geus niupan ti kénca ka katuhu.
The jarak na tebih di visi komputer
Kacida pentingna teh informasi métrik ngeunaan elmu visi komputer. Ieu sagala jinis jarak. Contona, pikeun Rover teh hal penting sabab éta tim nyaéta ti Bumi kira 20 menit sarta ngajawab sakumaha loba. Sasuai, link aya na deui - 40 menit. Tur upami urang ngadamel rencana pikeun Paréntah gerak Bumi, Anjeun kudu mawa ieu kana rekening.
Hasil terpadu téknologi visi komputer dina video games. Numutkeun video, Anjeun tiasa ngawangun model tilu diménsi objék, jalma, sarta poto dina pamaké nu tiasa mulangkeun tilu diménsi model dayeuh. Lajeng leumpang dina aranjeunna.
visi komputer - rupa-rupa rada lega. Hal ieu intertwined raket jeung sagala rupa élmu séjén. Bagian tina visi komputer Ieu ngarebut wewengkon pengolahan citra sarta kadangkala allocates visi komputer, baheula.
Analisis, pangakuan pola - jalur ka kreasi kecerdasan punjul
Hayu urang nalungtik konsep ieu nyalira.
Gambar Processing - ieu téh wewengkon algoritma, numana asupan jeung kaluaran - gambar, sarta kami boga anjeunna ngalakukeun hal.
Analisis gambar - nyaeta wewengkon visi komputer, nu museurkeun kana gawé bareng gambar dua diménsi jeung nyieun conclusions tina ieu.
Pola Pangakuan - hiji disiplin matematik abstrak nu sadar data dina bentuk vektor. Hartina, di lawang - véktor sarta kami boga hal ngalakonan jeung eta. Dimana vektor téh, urang henteu jadi penting pikeun nyaho.
visi Komputer - eta asalna éta mulangkeun struktur gambar dua diménsi. Dinten ieu wewengkon geus jadi lega sarta bisa diinterpretasi sakumaha ditampa sadaya tina objék fisik nyieun, dumasar gambar. Maksudna, ieu tugas ti kecerdasan jieunan.
Dina paralel kalawan visi komputer dina widang lengkep beda, dina geodesy, photogrammetry geus mekar - ukuran tina jarak antara objék dina gambar dua diménsi.
Robot bisa "tingali"
Sarta pamustunganana - ieu visi mesin. Dina visi mesin hartina visi robot. Maksudna putusan sababaraha masalah produksi. Urang bisa nyebutkeun yen visi komputer - hiji elmu badag. Ieu ngagabungkeun sababaraha bagian elmu lianna. Sarta lamun visi komputer meunang sagala aplikasi husus, nu kabukti kana visi mesin.
Wewengkon visi Komputer ngabogaan massa aplikasi praktis. Hal ieu pakait jeung automation produksi. Di usaha jadi leuwih éfisién pikeun ngaganti kuli manual ku mesin. mesin teu meunang capé, moal saré, manéhna kapaksa jadwal pagawean henteu teratur, baé daék digawé 365 dinten sataun. Ku kituna, ngagunakeun karya mesin, urang bisa meunangkeun hasilna dijamin dina hiji waktu nu tangtu, sarta éta rada metot. Sakabéh pancén boga pamakéan jelas pikeun sistim visi komputer. Tur aya nanaon hadé ti ningali hasil geuwat on gambar hijina dina peringkat itungan.
Dina bangbarung di dunya kecerdasan jieunan
Tambah rea - rea éta teuas! Hiji bagian signifikan tina otak jawab visi, sareng eta dipercaya yen lamun ngajarkeun komputer ka "tempo", nyaeta, sakabehna visi pamakéan komputer, éta salah sahiji tujuan kecerdasan jieunan pinuh. Lamun urang tiasa ngajawab masalah dina tingkat manusa, paling dipikaresep dina waktos anu sareng, urang bakal ngajawab masalah AI. Yén pisan alus! Atanapi henteu pohara alus, lamun kasampak, "Terminator 2".
Naha nya visi - hese? Kusabab gambar tina objék anu sarua bisa rupa-rupa greatly gumantung kana faktor éksternal. Gumantung kana objek titik observasi kasampak béda.
Contona, hiji jeung inohong anu sarua, dicokot ti sudut nu beda. Sarta naon paling narik dina tokoh bisa jadi salah sahiji panon, dua panon satengah. Sarta gumantung kana konteks nu (mun gambar ieu lalaki dina kaos jeung panon dicét), panon tiasa langkung ti dua.
Komputer nu masih teu ngartos, tapi "nilik"
faktor sejen nu ngajadikeun hésé - éta cahaya nu. Adegan sarua kalayan cahaya béda bakal béda béda. Ukuran obyék bisa rupa-rupa. Leuwih ti éta, objék kelas nanaon. Kumaha anjeun tiasa nyebutkeun ngeunaan lalaki anu jangkungna nya ku 2 méter? Nanaon. pertumbuhan manusa jeung bisa jadi 2.3 m, sarta 80 cm. Salaku kalawan tipe objék séjén, kumaha oge, aya objek tina kelas anu sarua.
Utamana objék hirup ngalaman rupa-rupa galur. Bulu urang, atlit, sato. Tingali dina gambar tina kuda ngajalankeun, nangtukeun naon anu lumangsung kalawan mane maranéhanana jeung buntut nyaeta saukur mungkin. Hiji objek tindih dina gambar? Lamun nyurung hiji gambar komputer, komo mesin pangkuatna manggihan kasusah méré putusan ka katuhu.
view hareup - éta nyamur a. Sababaraha obyek, sato masquerading salaku lingkungan, jeung rada skillfully. Sarta bintik sarua jeung ngawarnaan. Tapi, urang tingali éta, sanajan teu salawasna tina Afar.
masalah sejen - gerakan. Objék ojah henteu kabayang ngalaman deformasi.
Loba objék pisan variabel. Di dieu, contona, dina dua foto handap objék tina "korsi".
Sarta dina ieu anjeun bisa diuk. Tapi ngajar hiji mesin, sapertos yén hal béda dina wangun, warna, bahan, sagalana mangrupa obyek "korsi" - nyaéta pajeujeut. Ieu tantangan dina. Pikeun ngahijikeun métode visi komputer - nyaeta ngajar mesin pikeun ngarti, nganalisis, speculate.
Integrasi visi komputer di sagala rupa platform
Massa visi komputer mimiti tembus leuwih taun 2001, nalika anjeunna nyiptakeun detektor raray munggaran. Simkuring dijieun dua pangarang: Viola, Jones. Ieu kahiji saum sareng dipercaya algoritma cukup, nu ngabuktikeun kakuatan sahiji metodeu mesin learning.
Ayeuna visi komputer boga cukup aplikasi praktis anyar - pangakuan nyanghareupan manusa.
Tapi ngakuan lalaki sakumaha dina pilem - di sudut acak, kondisi pencahyaan béda - mustahil. Tapi pikeun ngajawab masalah, atanapi salah éta jalma béda kalayan cahaya béda atawa dina pasang aksi béda, sarupa sakumaha dina photograph dina paspor, geus mungkin ku gelar luhur kapercayaan.
a sarat poto paspor sakitu legana alatan fitur tina algoritma pangakuan raray.
Contona, upami anjeun gaduh paspor biometric, dina sababaraha bandara modern, anjeun tiasa nganggo sistem kontrol paspor otomatis.
masalahna teu kaungkab visi komputer - kamampuhan pikeun ngakuan téks wae
Meureun batur dipake sistem OCR. Salah sahiji ieu - a Reader Rupa, pohara populér di sistem RuNet. Aya loba bentuk dimana anjeun eusian data, aranjeunna sampurna discan, informasi teh geus dipikawanoh ku sistem nu kacida alusna. Tapi kalayan sagala téks dina gambar kaayaan loba goréng. masalah ieu masih tetep teu kaungkab.
Kaulinan ngalibetkeun visi komputer, newak gerak
Misah aréa badag - nyaeta kreasi model tilu diménsi jeung gerak newak (anu geus rada hasil dilaksanakeun dina kaulinan komputer). Program mimiti, nu migunakeun visi komputer - sistem tina interaksi jeung komputer nu migunakeun sapuan. Lamun eta dijieun ieu loba hal muka.
Algoritma ieu dirancang rada saukur, tapi pikeun ngonpigurasikeun dinya nyandak nyieun generator gambar sintétik tina jalma pikeun meunangkeun juta gambar. Supercomputer sareng maranehna milih parameter tina algoritma, nu manehna ayeuna jalan ogé.
Éta hiji juta Gambar jeung minggu waktos countable supercomputer mungkin nyieun algoritma nu meakeun 12% tina kapasitas hiji prosésor tur ngamungkinkeun hiji jalma keur ngarasa di posisi sacara real waktu. Ieu sistem Microsoft Kinect (2010).
Pilarian pikeun Gambar ku eusi ngidinan Anjeun pikeun unggah poto kana sistem, sarta hasil éta bakal masihan sagala gambar kalawan eusi nu sami tur dijieun tina sudut sarua.
Conto visi komputer: tilu diménsi jeung peta dua diménsi ayeuna keur dilakukeun ku eta. Maps keur mobil navigasi anu rutin diropéa nurutkeun DVR nu.
Aya database jeung milyaran poto nu dibere geotag. Ku ngundeur gambar dina database, Anjeun bisa nangtukeun dimana eta dijieun, sarta sanajan kalawan sababaraha sudut pandang. Tangtu, disadiakeun yén éta tempat téh cukup nu populér di hiji wanci para wisatawan jeung dijieun sababaraha poto di wewengkon éta geus aya.
robot téh madhab
Robotics wanoh hadir, madhab, tanpa éta sagala cara. Ayeuna aya kandaraan nu gaduh kaméra husus nu ngakuan pedestrians jeung tanda jalan pikeun ngirimkeun paréntah ka supir (ieu cara program komputer pikeun nempo, mantuan nu numpakan kandaraan teh). Tur aya hiji kandaraan robotic pinuh otomatis, tapi maranéhna teu bisa ngandelkeun solely dina Sistim kaméra video tanpa pamakéan loba émbaran tambahan.
kaméra modern - ieu mangrupa obscura kaméra analog
Hayu urang ngobrol ngeunaan gambar digital. kaméra digital modéren nu disusun dina prinsip tina kaméra obscura. Ngan tinimbang liang ngaliwatan nu lampu asup beam jeung projected onto tembok deui tina chamber tina circuit matuh, urang boga sistem optik husus disebut lensa. obyek nyaeta ngumpulkeun pancaran cahaya badag sarta ngarobah éta ambéh kabéh sinar dialirkeun kana titik maya dina urutan pikeun ménta proyéksi jeung ngabentuk hiji gambar dina pilem atawa matrix.
kaméra digital modern (matrix) diwangun ku elemen individu - piksel. Tiap piksel bisa ngukur energi cahaya nu kajadian dina total piksel, sarta ngaluarkeun hiji angka kaluaran. Ku alatan éta, dina kaméra digital, urang meunang gaganti ukuran set lampu caang gambar, bray dina piksel tunggal - komputer widang tempoan. Kituna, nalika gambar urang tingali teu ngalir garis tur contours jelas, sarta grid kuadrat warna dina kelir béda - piksel.
Handap nu katingali gambar digital munggaran di dunya.
Tapi gambar ieu teu? Warna. Naon warna?
persépsi psikologis warna
Warna - ieu téh naon urang tingali. Warna salah jeung hal anu sarua pikeun manusa jeung ucing bakal béda. Kusabab urang (manusa) jeung sistem optik sato - visi mah béda. Kituna, warna - éta kualitas psikologi visi urang nu lumangsung nalika observasi objék jeung lampu. Teu sipat fisik objek jeung caang. Warna - mangrupa hasil interaksi komponén lampu, sarta mangrupakeun tempat kajadian Sistim visual urang.
Programming Visi Komputer di Python maké perpustakaan
Lamun geus mutuskeun kalibet serius dina pangajaran visi komputer, kudu geuwat nyiapkeun sababaraha kasusah, sains ieu teu nu panggampangna tur hides sababaraha pitfalls. Tapi "Programming Komputer Visi dina Python" nu Pangarang of Jan Erik Solema - buku nu outlines sakabéh basa paling basajan. Di dieu Anjeun baris perlu acquainted jeung metode pangakuan rupa objék dina 3D, diajar digawekeun ku gambar stereo, kanyataanana maya jeung loba aplikasi sejenna visi komputer. Dina kitab anu cukup conto di Python. Tapi dina guaran dibere, jadi mun nyarita, digeneralisasi, ku kituna teu overload teuing panalungtikan sarta data teuas. Dianggo cocog pikeun siswa, amateurs, sarta peminat. Ngundeur buku jeung nu lianna ngeunaan visi komputer (pdf-format) tiasa di jaringan.
Di momen, aya perpustakaan open source of algoritma visi komputer jeung ngolah gambar na algoritma numeris OpenCV. Hal ieu dilaksanakeun di paling basa programming modern, nyaeta buka sumber. Lamun urang ngobrol ngeunaan visi komputer, Python migunakeun salaku basa programming, éta ogé boga rojongan perpustakaan, sajaba eta, terus ngembang na boga komunitas hébat.
parusahaan "Microsoft" nyadiakeun ladenan na API-bisa ngalatih jaringan neural digawekeun deui kalawan gambar jelema. Aya ogé kasempetan pikeun nerapkeun visi komputer, Python migunakeun salaku basa programming.
Similar articles
Trending Now