Კომპიუტერები, Საინფორმაციო ტექნოლოგიების
Თანამედროვე კომპიუტერული ხედვა. ამოცანები და კომპიუტერული ხედვა ტექნოლოგია. პროგრამირების კომპიუტერული Vision in Python
როგორ ვასწავლოთ კომპიუტერს მესმის, რა არის გამოსახული სურათზე ან სურათების? როგორც ჩანს, ეს მარტივი, მაგრამ კომპიუტერის ეს არის მხოლოდ matrix შედგება zeros და პირობა, რომელიც გსურთ ამონაწერი მნიშვნელოვანი ინფორმაცია.
რა არის კომპიუტერული ხედვა? ეს არის უნარი, რომ "ვხედავ" თქვენს კომპიუტერში
Vision - მნიშვნელოვანი ინფორმაციის წყარო პირი იყენებს, ვიღებთ, სხვადასხვა მონაცემებით, 70-დან 90% ყველა ინფორმაცია. და, რა თქმა უნდა, თუ ჩვენ გვინდა, რომ შევქმნათ ჭკვიანი მანქანა, ჩვენ უნდა განახორციელოს იმავე უნარებისა და კომპიუტერი.
პრობლემა კომპიუტერული ხედვა შეიძლება საკმაოდ მკაფიოდ განაცხადა. რა არის "ვხედავ"? გასაგებია, რომ იქ, სადაც არსებობს მხოლოდ ეძებს. რომელიც დასრულდა განსხვავებები კომპიუტერული ხედვა და ადამიანის ხედვა. Vision ჩვენთვის - ეს არის წყარო ცოდნა სამყაროს შესახებ, ისევე, როგორც წყარო მეტრულ ინფორმაცია - რომ არის, უნარი გაიგოს დისტანციებზე და ზომის.
სემანტიკური ბირთვის სურათი
ეძებს სურათზე, ჩვენ შეგვიძლია აღვწეროთ ის მიერ ხმების ატრიბუტები, ასე ვთქვათ, ამონაწერი სემანტიკური ინფორმაცია.
მაგალითად, ეძებს ამ სურათს, შეიძლება ითქვას, რომ ეს არის გარეთ. რა არის ქალაქის საგზაო. რომ არსებობს მანქანა. ჩვენ შეგვიძლია მგონია, რომ ეს არის სამხრეთ-აღმოსავლეთ აზიის კონფიგურაციის შენობა და იეროგლიფები. პორტრეტი Mao Zedong გვესმოდეს, რომ ეს არის პეკინი, და თუ ვინმე ნახა ვიდეო ან თავად იყო იქ, ვხვდები, რომ ეს არის ცნობილი ტიანანმენის მოედანზე.
რა შეგვიძლია ვთქვათ, უფრო მეტი სურათი, ხედავს? ჩვენ შეგვიძლია გავიგოთ, ობიექტების გამოსახულება, ვთქვა, რომ არიან ადამიანები, აქ უფრო ახლოს - ღობე. აქ ქოლგები, რომ შენობა პლაკატები. ეს არის მაგალითები კლასი არის ძალიან მნიშვნელოვანი ობიექტები, რომლებიც ჩართული ძიება მომენტში.
მიუხედავად ამისა ჩვენ შეგვიძლია ვისწავლოთ ზოგიერთი თავისებურება და ატრიბუტები ობიექტები. მაგალითად, აქ ჩვენ შეგვიძლია განვსაზღვროთ, რომ ეს არ არის პორტრეტი ჩვეულებრივი ჩინური, კერძოდ, მაო Zedong.
მისი თქმით, მანქანა შეიძლება განისაზღვროს, რომ ეს არის მოძრავი ობიექტი, და ძნელია, რომ არ არის დეფორმირებული დროს მოძრაობა. მომხმარებლის დროშები შეიძლება ითქვას, რომ ეს ობიექტები, ისინი ასევე მოძრავი, მაგრამ ისინი არ არის რთული, მუდმივად დეფორმირებული. და სცენა არ არის ქარი, რომელიც შეიძლება განისაზღვროს განვითარებადი დროშებით და შეიძლება კი განსაზღვრავს მიმართულებით ქარი, მაგალითად, აფეთქება მარცხნიდან მარჯვნივ.
დისტანციებზე და lengths კომპიუტერული ხედვა
ძალიან მნიშვნელოვანია მეტრულ ინფორმაცია კომპიუტერული ხედვა მეცნიერება. ეს არის ყველა სახის დისტანციებზე. მაგალითად, იმ rover განსაკუთრებით მნიშვნელოვანია, რადგან გუნდი დედამიწის შესახებ 20-ე წუთზე და უპასუხოს იმდენი. შესაბამისად, ბმული იქ და უკან - 40-ე წუთზე. და თუ ჩვენ მიიღოს გეგმა მოძრაობა ბრძანებები დედამიწის, თქვენ უნდა გაითვალისწინოს.
წარმატებით ინტეგრირებული ტექნოლოგია კომპიუტერული ხედვა ვიდეო თამაშები. მისი თქმით, ვიდეო, შეგიძლიათ აშენება სამგანზომილებიანი მოდელების ობიექტების, ადამიანი, ფოტო და მომხმარებელს შეუძლია აღადგინოს სამგანზომილებიანი მოდელები ქალაქებში. და შემდეგ ფეხით მათ.
კომპიუტერული ხედვა - საკმაოდ ფართო სპექტრი. იგი მჭიდროდ არის დაკავშირებული სხვა მეცნიერებებში. ნაწილი კომპიუტერული ხედვა იგი იღებს დამუშავება ტერიტორია და ზოგჯერ გამოყოფს კომპიუტერული ხედვა, ისტორიულად.
ანალიზი, ნიმუში აღიარება - გზა შექმნას უმაღლესი დაზვერვის
განვიხილოთ ეს ცნებები ცალკე.
დამუშავება - ეს არის ფართობი ალგორითმები, რომელშიც შემავალი და გამომავალი - იმიჯი, და ჩვენ მას რაღაც.
გამოსახულების ანალიზის - არის ფართობი კომპიუტერული ხედვა, რომელიც აქცენტს მუშაობის ორგანზომილებიანი გამოსახულების და დასკვნების ამ.
ნიმუში აღიარება - აბსტრაქტული მათემატიკური დისციპლინა, რომელიც აღიარებს მონაცემების სახით ვექტორები. რომ არის, შესასვლელთან - ვექტორი და გვაქვს რაღაც შუაშია. სადაც ვექტორი, ჩვენ არ ვართ იმდენად მნიშვნელოვანია, რომ ვიცი.
კომპიუტერული ხედვა - ეს თავდაპირველად იყო აღდგენას სტრუქტურა ორგანზომილებიანი გამოსახულება. დღეს ამ სფეროში გახდა უფრო ფართო და ეს შეიძლება იყოს გაგებული, როგორც მიღების ყველა ფიზიკური ობიექტები მიღების საფუძველზე, იმიჯი. რომ არის, ეს ამოცანა ხელოვნური ინტელექტი.
პარალელურად კომპიუტერული ხედვა სრულიად სხვადასხვა სფეროში, გეოდეზია, ფოტოგრამეტრია განვითარდა - საზომი შორის მანძილი ობიექტების ორგანზომილებიანი გამოსახულება.
სამსახური შეიძლება "ვხედავ"
და ბოლოს - ეს არის მანქანა ხედვა. ქვეშ მანქანა ხედვა ნიშნავს ხედვა რობოტები. ეს არის გადაწყვეტილება, ზოგიერთი წარმოების პრობლემებს. შეიძლება ითქვას, რომ კომპიუტერული ხედვა - ერთი დიდი მეცნიერება. იგი აერთიანებს რამდენიმე სხვა მეცნიერების ნაწილი. და როდესაც კომპიუტერი ხედვა იღებს რაიმე კონკრეტული პროგრამა, ის იქცევა მანქანა ხედვა.
კომპიუტერული ხედვა რეგიონში მასობრივი პრაქტიკული პროგრამა. ეს უკავშირდება ავტომატიზაციის წარმოების. საწარმოებში უფრო ეფექტური შეცვლის სახელმძღვანელო შრომის მანქანა. მანქანა არ დაიღალა არ ეძინა, მას არალეგალური სამუშაო გრაფიკი, ის მზად არის სამუშაოდ 365 დღის განმავლობაში. ასე რომ, გამოყენებით მანქანა მუშაობს, ჩვენ შეგვიძლია მივიღოთ გარანტირებული შედეგი გარკვეული დრო, და ეს არის საკმაოდ საინტერესო. ყველა ამოცანები აქვს ნათელი გამოყენება კომპიუტერული ხედვა სისტემები. და არაფერია უკეთესი, ვიდრე სანახავად შედეგების დაუყოვნებლივ სურათზე მხოლოდ გაანგარიშება ეტაპზე.
On ბარიერი სამყაროში ხელოვნური ინტელექტი
Plus სფეროში - ეს არის ძნელი! მნიშვნელოვანი ნაწილი ტვინის პასუხისმგებელი ხედვა და მას სჯეროდა, რომ თუ ასწავლიან თქვენს კომპიუტერში "ვხედავ", რომელიც, სრული გამოყენება კომპიუტერული ხედვა, ეს არის ერთ-ერთი მიზანია სრული ხელოვნური ინტელექტი. თუ ჩვენ არ შეგვიძლია ამ პრობლემის მოსაგვარებლად ადამიანურ დონეზე, სავარაუდოდ, ამავე დროს, ჩვენ ამ პრობლემის მოსაგვარებლად AI. ეს არის ძალიან კარგი! და არ არის ძალიან კარგი, თუ გადავხედავთ, "Terminator 2".
რატომ არის ხედვა - ეს არის რთული? იმის გამო, რომ იმიჯი იგივე ობიექტი შეიძლება განსხვავდება დიდად დამოკიდებულია გარე ფაქტორებზე. დამოკიდებულია ობიექტის დაკვირვების რაოდენობა გამოიყურება სხვადასხვა.
მაგალითად, ერთი და იგივე ფიგურა, აღებული სხვადასხვა კუთხით. და რა არის ყველაზე საინტერესო ფიგურა შეიძლება ერთი თვალი, ორი თვალით და ნახევარი. და დამოკიდებულია კონტექსტში (თუ ეს იმიჯი კაცი პერანგი მოხატული თვალები), თვალის შეიძლება მეტი ორი.
კომპიუტერული დღემდე არ ესმის, მაგრამ "ხედავს"
კიდევ ერთი ფაქტორი, რაც ართულებს - ის განათება. იგივე სცენა სხვადასხვა განათების გამოიყურება სხვადასხვა. ობიექტის ზომა შეიძლება განსხვავდებოდეს. უფრო მეტიც, ობიექტების ნებისმიერი კლასის. როგორ იტყვით კაცი, რომ მისი სიმაღლე 2 მეტრი? არაფერი. ადამიანის ზრდის და შეიძლება 2.3 მ და 80 სმ. ისევე როგორც სხვა სახის ობიექტების, თუმცა, ობიექტების იმავე კლასში.
კერძოდ საცხოვრებელი ობიექტების გაიარონ სხვადასხვა შტამების. თმის ადამიანი, სპორტსმენების, ცხოველები. შეხედეთ სურათები ცხენები გაშვებული, განსაზღვროს, თუ რა ხდება მათი Mane და კუდი უბრალოდ შეუძლებელია. გადახურვის ობიექტების გამოსახულება? თუ თქვენ მისწვდომოდა კომპიუტერული გამოსახულება, თუნდაც ყველაზე ძლიერი მანქანა მოძიების სირთულეები, რათა სწორი გადაწყვეტილება.
შემდეგი კალენდარი - ის შენიღბვას. ზოგიერთი ობიექტების, ცხოველების გადაცმული გარემო და საკმაოდ ოსტატურად. და იმავე წერტილში და შეღებვა. მიუხედავად ამისა, ჩვენ ვხედავთ მათ, თუმცა არა ყოველთვის შორიდან.
კიდევ ერთი პრობლემა - მოძრაობა. ობიექტების მოძრაობის წარმოუდგენელი გაიაროს დეფორმაცია.
ბევრი ობიექტი ძალიან განსხვავებულია. აქ, მაგალითად, ამ ორ ფოტოს ქვემოთ ობიექტების "თავმჯდომარე".
და ამ თქვენ შეგიძლიათ იჯდეს. მაგრამ ასწავლიან მანქანა, ისეთი, რომ სხვადასხვა რამ ფორმა, ფერი, მასალა, ყველაფერი არის ობიექტი "თავმჯდომარე" - ძალიან რთულია. ეს არის გამოწვევა. ინტეგრირება მეთოდები კომპიუტერული ხედვა - ასწავლოს მანქანა უნდა გვესმოდეს, ანალიზი, სპეკულირება.
ინტეგრაციის კომპიუტერული ხედვა სხვადასხვა პლატფორმების
მასობრივი კომპიუტერული ხედვა დაიწყო შეღწევა უფრო 2001 წელს, როდესაც მან შექმნა პირველი სახე აღენიშნება. ჩვენ ეს ორი ავტორები: Viola, Jones. ეს იყო პირველი სწრაფი და საიმედო საკმარისი ალგორითმი, რომელიც აჩვენა ძალა მანქანა სწავლის მეთოდები.
ახლა კომპიუტერული ხედვა გააჩნია საკმარისი ახალი პრაქტიკული განაცხადების - აღიარება ადამიანის სახე.
მაგრამ აღიარებს ადამიანის, როგორც ფილმები - შემთხვევითი კუთხით, სხვადასხვა განათების პირობებში - ეს შეუძლებელია. მაგრამ ამ პრობლემის მოსაგვარებლად, ან ერთი, რომ განსხვავებული ადამიანები სხვადასხვა განათების ან სხვადასხვა უქმნის, მსგავსი როგორც ფოტოს პასპორტი, შესაძლებელია მაღალი ნდობის ხარისხი.
პასპორტის ფოტო მოთხოვნები მეტწილად თვისება სახე აღიარება ალგორითმები.
მაგალითად, თუ თქვენ გაქვთ ბიომეტრიული პასპორტი, ზოგიერთ თანამედროვე აეროპორტი, შეგიძლიათ გამოიყენოთ ავტომატური საპასპორტო კონტროლის სისტემა.
გადაუჭრელი პრობლემა კომპიუტერული ხედვა - უნარი აღიარებს ნებისმიერი ტექსტი
იქნებ ვინმე გამოიყენება OCR სისტემა. ერთ-ერთი ასეთი - სახვითი Reader, ძალიან პოპულარულია RuNet სისტემა. არსებობს ბევრი ფორმები, სადაც თქვენ შეავსოთ მონაცემები, ისინი შესანიშნავად დასკანერებული, ინფორმაცია ცნობს სისტემა ძალიან კარგად. მაგრამ ნებისმიერი ტექსტი სურათზე სიტუაცია გაცილებით უარესი. ეს პრობლემა კვლავ გადაუჭრელი რჩება.
თამაშები, მათ შორის კომპიუტერული ხედვა, მოძრაობის ხელში
ცალკე დიდი ფართობი - არის შექმნას სამგანზომილებიანი მოდელების და მოძრაობის ხელში (რომელიც საკმაოდ წარმატებით ხორციელდება კომპიუტერული თამაშები). პირველი პროგრამა, რომელიც იყენებს კომპიუტერული ხედვა - სისტემის ურთიერთქმედების კომპიუტერული გამოყენებით ჟესტები. როდესაც იგი შეიქმნა, რომ ეს იყო ბევრი რამ ღია.
ალგორითმი შექმნილია უბრალოდ, მაგრამ კონფიგურაციის დასჭირდა, რათა შეიქმნას გენერატორი სინთეზური გამოსახულებები ადამიანები მისაღებად მილიონი სურათები. სუპერკომპიუტერი მათთან აირჩიოს პარამეტრების ალგორითმი, რომელიც მან ახლა კარგად მუშაობს.
სწორედ მილიონი გამოსახულებები და კვირაში თვლადი სუპერკომპიუტერი დროს შესაძლებელია შექმნათ ალგორითმი, რომელიც მოიხმარს 12% რანგში ერთ პროცესორი და საშუალებას იძლევა პირის აღიქვამენ პოზიცია რეალურ დროში. ეს Microsoft Kinect სისტემა (2010).
სურათების ძიება შინაარსით გაძლევთ საშუალებას ატვირთოთ ფოტოები სისტემა, შედეგები და ეს მისცემს ყველა სურათები იგივე შინაარსის და მზადდება იგივე კუთხე.
მაგალითები კომპიუტერული ხედვა: სამგანზომილებიანი და ორგანზომილებიანი რუკები ახლა კეთდება ეს. Maps ნავიგაცია მანქანა რეგულარულად მიხედვით DVR.
ბაზა არსებობს მილიარდობით geotagged ფოტოები. ავტორი გადმოწერის სურათი მონაცემთა ბაზაში, შეგიძლიათ განსაზღვრავს, სადაც ეს გაკეთდა, და თუნდაც გარკვეული პერსპექტივა. რა თქმა უნდა, იმ პირობით, რომ ადგილი არის პოპულარული საკმარისი, რომ ერთ დროს ტურისტებს და არაერთი ფოტო ტერიტორიაზე არ ყოფილა.
სამსახური ყველგან
Robotics აწმყოში, ყველგან, გარეშე არანაირად. ახლა არსებობს მანქანები, რომ აქვს სპეციალური კამერები აღიარებს, რომ ფეხით მოსიარულეთა და საგზაო ნიშნები გადასცეს ბრძანებები მძღოლი (ეს ისე, კომპიუტერული პროგრამა, რომ ნახოთ, ეხმარება motorist). და არ არის სრულად ავტომატური robotic მანქანები, მაგრამ მათ არ შეუძლიათ დაეყრდნოს მხოლოდ ვიდეო კამერა სისტემის გამოყენების გარეშე დიდი რაოდენობით დამატებით ინფორმაციას.
თანამედროვე კამერა - ეს არის იუმორისტული კამერა-ობსკურა
მოდით ვისაუბროთ ციფრული გამოსახულება. თანამედროვე ციფრული ფოტოკამერები ეწყობა პრინციპი კამერა-ობსკურა. მხოლოდ ნაცვლად ხვრელი, რომლის მეშვეობითაც ნათელი შემოდის სხივი და დაპროექტებული გადატანა უკან კედლის პალატის საგანი ჩართვა, ჩვენ გვაქვს სპეციალური ოპტიკური სისტემა სახელწოდებით ობიექტივი. მისი მიზანია შეაგროვოს დიდი სინათლის სხივი და დააკონვერტიროთ ის ისე, რომ ყველა სხივები გაიარა ვირტუალური წერტილი, რათა მიიღოს პროექტირება და შექმნას იმიჯი ფილმი ან matrix.
თანამედროვე ციფრული (matrix) შედგება ცალკეული ელემენტები - პიქსელი. თითოეული pixel შეგიძლიათ გაზომოთ ენერგია შუქი, რომელიც ინციდენტის pixel სულ, და გასცეს ერთი გამომავალი ნომერი. აქედან გამომდინარე, ციფრული კამერა, მივიღებთ ნაცვლად გამოსახულების სიკაშკაშე კომპლექტი მსუბუქი ღონისძიებების, დაიჭირეს ერთი pixel - კომპიუტერული სფეროში ხედი. ამიტომ, როდესაც გამოსახულება ჩვენ ვხედავთ, არ მიედინება ხაზები და ნათელი კონტურები და ქსელის ფერადი მოედნებზე სხვადასხვა ფერის - პიქსელი.
ქვემოთ ხედავთ პირველი ციფრული გამოსახულების მსოფლიოში.
მაგრამ ამ სურათზე არ არის? ფერი. რა არის ფერი?
ფსიქოლოგიური აღქმა ფერი
ფერი - ეს არის ის, რაც ჩვენ ვხედავთ. ფერი ერთი და იგივე ადამიანები და კატა იქნება განსხვავებული. მას შემდეგ, რაც ჩვენ (ადამიანები) და ცხოველთა ოპტიკური სისტემა - ხედვა განსხვავებულია. აქედან გამომდინარე, ფერი - ეს ფსიქოლოგიური ხარისხის ჩვენი ხედვა, რომელიც ხდება, როდესაც აკვირდებიან ობიექტები და მსუბუქი. და არა ფიზიკური საკუთრების ობიექტის და ნათელი. ფერი - არის შედეგი ურთიერთქმედების მსუბუქი კომპონენტები, და სცენა ჩვენი ვიზუალური სისტემა.
პროგრამირების კომპიუტერული Vision in Python გამოყენებით ბიბლიოთეკების
თუ თქვენ გადაწყვიტეთ, რომ ჩაერთონ სერიოზულად შესწავლა კომპიუტერული ხედვა, დაუყოვნებლივ უნდა მომზადდეს რიგი სირთულეები, ამ მეცნიერების არ არის იოლი და მალავს ნომერი pitfalls. მაგრამ "პროგრამირების კომპიუტერული ხედვა Python" ავტორობას Jan ერიკ Solema - წიგნი, რომელიც ასახავს ყველა ყველაზე მარტივი ენა. აქ თქვენ გაეცნობიან მეთოდები აღიარების სხვადასხვა ობიექტების 3D, ვისწავლოთ მუშაობა სტერეო გამოსახულება, ვირტუალური რეალობა და ბევრი სხვა პროგრამა კომპიუტერული ხედვა. წიგნში საკმარისი მაგალითები Python. მაგრამ განმარტებები წარმოდგენილი, ასე ვთქვათ, განზოგადებული, ისე, რომ არ გადატვირთვისაგან ძალიან ბევრი კვლევა და მძიმე მონაცემები. მუშაობა განკუთვნილია სტუდენტები, მოყვარულთა და ენთუზიასტების. ჩამოტვირთვა ეს წიგნი და სხვათა შესახებ კომპიუტერული ხედვა (pdf ფორმატში) შეიძლება ქსელში.
ამ ეტაპზე, არსებობს ღია ბიბლიოთეკის კომპიუტერული ხედვა ალგორითმები და დამუშავება და რიცხვითი ალგორითმები OpenCV. იგი ხორციელდება ყველაზე თანამედროვე პროგრამირების ენების, არის ღია. თუ ვსაუბრობთ კომპიუტერული ხედვა, Python იყენებს, როგორც პროგრამირების ენა, მას ასევე აქვს მხარდაჭერა ბიბლიოთეკა, გარდა ამისა, ის მუდმივად ვითარდება და აქვს დიდი თანამეგობრობას.
კომპანია "Microsoft" უზრუნველყოფს მისი მომსახურების Api შეუძლია მოამზადებენ ნერვული ქსელის მუშაობა იგი გამოსახულებები ადამიანი. არსებობს ასევე შესაძლებლობა გამოიყენოს კომპიუტერული ხედვა, Python იყენებს, როგორც პროგრამირების ენა.
Similar articles
Trending Now