Zusammenfassung
Infolge von sinkenden Hardwarepreisen und der zunehmenden Automatisierung in Produktionsprozessen wird maschinelles Lernen für industrielle Sichtprüfungsaufgaben immer interessanter. In diesem Beitrag wird die Detektierbarkeit von Objekten in Bildern mit verschiedenen Auflösungen mittels eines neuronalen Netzes untersucht. Die verwendeten Datensätze beinhalten die Erkennung von Defekten in Leiterplatten, Ziffern von Hausnummern und Verkehrsschildern. Es wird gezeigt, dass die Information über das Vorhandensein eines Objekts bis zu einer bestimmten Schwelle beim Heruntertasten nicht verschwindet. Dadurch kann die Auflösung des Eingabebildes des Detektors reduziert werden, ohne hohe Verluste bei der Detektion hinnehmen zu müssen, was den Ressourcenbedarf der Inferenz reduziert. Dies erleichtert die Implementierung des Detektors auf kleineren Geräten wie bspw. einem FPGA erheblich. Für die untersuchten Datensätze ist so eine Reduktion der Seitenlängen der Eingangsbilder um bis zu
Abstract
As a result of falling hardware prices and increasing automation in production processes, machine learning is becoming increasingly interesting for industrial visual inspection tasks. In this paper, the detectability of objects in images with different resolutions by using a neural network is investigated. The data sets contain the detection of defects in printed circuit boards (PCBs), house numbers and traffic signs. It is shown that the information about the presence of an object up to a certain threshold does not disappear if the image is sampled down. Thus, the resolution of the detector’s input can be reduced without high losses during detection, which reduces the resource consumption of the inference. This makes it much easier to implement the detector on smaller devices such as an FPGA. For the investigated data sets a reduction of the side lengths of the input images by up to
About the authors

Norbert Mitschke ist Mitarbeiter am Institut für Industrielle Informationstechnik (IIIT) des Karlsruher Instituts für Technologie (KIT) in der Forschungsgruppe von Prof. Heizmann. Hauptarbeitsgebiete: FPGA basierte Sichtprüfung und Bildverarbeitung.

Prof. Dr.-Ing. Michael Heizmann ist Institutsleiter am Institut für Industrielle Informationstechnik (IIIT) des Karlsruher Instituts für Technologie (KIT). Hauptarbeitsgebiete: Mess- und Automatisierungstechnik, Automatische Sichtprüfung und Bildverarbeitung, Bild- und Informationsfusion.
Literatur
1. Cai, Y.: How Many Pixels Do We Need to See Things? In: International Conference on Computational Science Springer, 2003, S. 1064–1073.10.1007/3-540-44863-2_105Search in Google Scholar
2. Cubuk, E. D.; Zoph, B.; Mané, D.; Vasudevan, V.; Le, Q. V.: AutoAugment: Learning Augmentation Policies from Data. In: CoRR abs/1805.09501 (2018). http://arxiv.org/abs/1805.09501.Search in Google Scholar
3. Devries, T.; Taylor, G. W.: Improved Regularization of Convolutional Neural Networks with Cutout. In: CoRR abs/1708.04552 (2017). http://arxiv.org/abs/1708.04552.Search in Google Scholar
4. Girshick, R.; Donahue, J.; Darrell, T.; Malik, J.: Rich Feature Hierarchies for Accurate Object Detection and Semantic Segmentation. In: Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition, 2014, S. 580–587.10.1109/CVPR.2014.81Search in Google Scholar
5. Goodfellow, I.; Bengio, Y.; Courville, A.: Deep Learning. MIT Press, 2016. http://www.deeplearningbook.org.Search in Google Scholar
6. Huang, L. L.: Chinese Traffic Sign Database. http://www.nlpr.ia.ac.cn/pal/trafficdata/. Version: 2019.Search in Google Scholar
7. Krizhevsky, A.; Sutskever, I.; Hinton, G. E.: Imagenet Classification with Deep Convolutional Neural Networks. In: Advances in Neural Information Processing Systems, 2012, S. 1097–1105.Search in Google Scholar
8. Li, J.; Dai, T.; Tang, Q.; Xing, Y.; Xia, S.-T.: Cyclic Annealing Training Convolutional Neural Networks for Image Classification with Noisy Labels. In: 2018 25th IEEE International Conference on Image Processing (ICIP) IEEE, 2018, S. 21–25.10.1109/ICIP.2018.8451331Search in Google Scholar
9. Ma, J.; Chen, L.; Gao, Z.: Hardware Implementation and Optimization of Tiny-YOLO Network. In: Zhai, G.; Zhou, J.; Yang, X. (Hrsg.): Digital TV and Wireless Multimedia Communication. Singapore: Springer Singapore, 2018. ISBN 978-981-10-8108-8, S. 224–234.10.1007/978-981-10-8108-8_21Search in Google Scholar
10. Mitschke, N.; Heizmann, M.; Noffz, K.-H.; Wittmann, R.: A Fixed-Point Quantization Technique for Convolutional Neural Networks Based on Weight Scaling. In: 2019 26th IEEE International Conference on Image Processing (ICIP) IEEE, 2019, S. 3438–3442.10.1109/ICIP.2019.8803490Search in Google Scholar
11. Netzer, Y.; Wang, T.; Coates, A.; Bissacco, A.; Wu, B.; Ng, A. Y.: Reading Digits in Natural Images with Unsupervised Feature Learning. In: NIPS Workshop on Deep Learning and Unsupervised Feature Learning Bd. 2011, 2011, S. 5.Search in Google Scholar
12. Redmon, J.; Divvala, S.; Girshick, R.; Farhadi, A.: You Only Look Once: Unified, Real-Time Object Detection. In: Proceedings of the IEEE conference on computer vision and pattern recognition, 2016, S. 779–788.10.1109/CVPR.2016.91Search in Google Scholar
13. Redmon, J.; Farhadi, A.: YOLO9000: Better, Faster, Stronger. In: Proceedings of the IEEE conference on computer vision and pattern recognition, 2017, S. 7263–7271.10.1109/CVPR.2017.690Search in Google Scholar
14. Ren, S.; He, K.; Girshick, R.; Sun, J.: Faster R-CNN: Towards Real-Time Object Detection with Region Proposal Networks. In: Advances in neural information processing systems, 2015, S. 91–99.Search in Google Scholar
15. Simonyan, K.; Zisserman, A.: Very Deep Convolutional Networks for Large-Scale Image Recognition. In: arXiv preprint arXiv:1409.1556 (2014).Search in Google Scholar
16. Tamura, S.; Kawai, H.; Mitsumoto, H.: Male/Female Identification from 8×6 Very Low Resolution Face Images by Neural Network. In: Pattern recognition 29 (1996), Nr. 2, S. 331–335.10.1016/0031-3203(95)00073-9Search in Google Scholar
17. Tang, S.; He, F.; Huang, X.; Yang, J.: Online PCB Defect Detector On A New PCB Defect Dataset. In: CoRR abs/1902.06197 (2019). http://arxiv.org/abs/1902.06197.Search in Google Scholar
18. Wang, Z.; Chang, S.; Yang, Y.; Liu, D.; Huang, T. S.: Studying Very Low Resolution Recognition Using Deep Networks. In: The IEEE Conference on Computer Vision and Pattern Recognition (CVPR), 2016.10.1109/CVPR.2016.518Search in Google Scholar
19. Zou, W. W.; Yuen, P. C.: Very Low Resolution Face Recognition Problem. In: IEEE Transactions on image processing 21 (2012), Nr. 1, S. 327–340.10.1109/TIP.2011.2162423Search in Google Scholar PubMed
© 2019 Walter de Gruyter GmbH, Berlin/Boston