Toward Full Autonomy for Vision-Guided Robots: From Self-Calibration to Self-Directed Exploration



Ähnliche Dokumente
Efficient Design Space Exploration for Embedded Systems

Dynamic Robot Architecture for Robust Realtime Computer Vision

Visual Mapping and Pose Estimation for Self-Driving Cars

Immersive Environments: From Virtual Indoor Tours to Outdoor Modelling

EEX Kundeninformation

Research Collection. Digital estimation of continuous-time signals using factor graphs. Doctoral Thesis. ETH Library. Author(s): Bolliger, Lukas

Einführung in die Robotik Kinematik. Mohamed Oubbati Institut für Neuroinformatik. Tel.: (+49) 731 / mohamed.oubbati@uni-ulm.de

Einführung in die Robotik Autonome Mobile Roboter

Security Patterns. Benny Clauss. Sicherheit in der Softwareentwicklung WS 07/08

Biologisch motivierter SLAM Algorithmus

Research Collection. Real-time multi-object tracking. Doctoral Thesis. ETH Library. Author(s): Roth, Daniel Eugen. Publication Date: 2010

CarMedia. Bedienungsanleitung Instruction manual. AC-Services Albert-Schweitzer-Str Hockenheim

Video Line Array Highest Resolution CCTV

On the List Update Problem

Group and Session Management for Collaborative Applications

Alle Informationen zu Windows Server 2003 Übersicht der Produkte

Das neue Volume-Flag S (Scannen erforderlich)

Customer-specific software for autonomous driving and driver assistance (ADAS)

Unigraphics Schnittstelle entfernen

Konzept zur Push Notification/GCM für das LP System (vormals BDS System)

Information Systems Engineering Seminar

miditech 4merge 4-fach MIDI Merger mit :

Daten haben wir reichlich! The unbelievable Machine Company 1

VPN / IPSec Verbindung mit dem DI 804 HV und dem SSH Sentinel

Was ist LDAP. Aufbau einer LDAP-Injection. Sicherheitsmaßnahmen. Agenda. LDAP-Injection. ITSB2006 WS 09/10 Netzwerkkonfiguration und Security

Diss. ETH No SCALABLE SYSTEMS FOR DATA ANALYTICS AND INTEGRATION. A dissertation submitted to ETH ZURICH. for the degree of. Doctor of Sciences

Einführung in die Robotik Einführung. Mohamed Oubbati Institut für Neuroinformatik. Tel.: (+49) 731 / mohamed.oubbati@uni-ulm.de

Anwendung einer Monokularen Kamera als Bewegungs-Sensor für Mobile Roboter p.1

Wenn Russland kein Gas mehr liefert

BartPE. Dokumentation. Projektarbeit Network Services. Dozent: Wolf-Fritz Riekert. Belmondo Kovac. Autor: Andreas Dinkelacker, 3.

Installation mit Lizenz-Server verbinden

Preisliste für The Unscrambler X

A dissertation submitted to ETH ZURICH. for the degree of Doctor of Sciences. presented by ALEXANDER SCHILLING Dipl. Masch.-Ing.

Windows Server 2012 R2 Essentials & Hyper-V

Bes 10 Für ios und Android

AGROPLUS Buchhaltung. Daten-Server und Sicherheitskopie. Version vom b

Kybernetik Intelligent Agents- Action Selection

Research Collection. Live 3D Reconstruction on Mobile Phones. Doctoral Thesis. ETH Library. Author(s): Tanskanen, Petri. Publication Date: 2016

arlanis Software AG SOA Architektonische und technische Grundlagen Andreas Holubek

Big Data Projekte richtig managen!

Use Cases. Use Cases

Geometric Change Detection and Image Registration in Large Scale Urban Environments

Kurzanleitung um Transponder mit einem scemtec TT Reader und der Software UniDemo zu lesen

Usability ohne Maus und ohne Bildschirm

Aufbau eines IT-Servicekataloges am Fallbeispiel einer Schweizer Bank

EchoLink und Windows XP SP2

UC4 Rapid Automation HP Service Manager Agent Versionshinweise

Datenübernahme easyjob 3.0 zu easyjob 4.0

Smartphone Benutzung. Sprache: Deutsch. Letzte Überarbeitung: 25. April

Geometrie und Bedeutung: Kap 5

Über die Internetseite Hier werden unter Download/aktuelle Versionen die verschiedenen Module als zip-dateien bereitgestellt.

Technical Support Information No. 123 Revision 2 June 2008

QS solutions GmbH. präsentiert das Zusammenspiel von. Ihr Partner im Relationship Management

Dominik Stockem Datenschutzbeauftragter Microsoft Deutschland GmbH

Die Kunst des Programmierens...

Seite Wireless Distribution System (Routing / Bridging) 3.1 Einleitung

Würfelt man dabei je genau 10 - mal eine 1, 2, 3, 4, 5 und 6, so beträgt die Anzahl. der verschiedenen Reihenfolgen, in denen man dies tun kann, 60!.

Kybernetik Braitenberg Vehikel

Die chemische Natur der Pigmente aus photosynthetischen Reaktionszentren von Rhodospirillum ruhrum G-9+

Registrierungsprozess des Boardgeräts (OBU) Inhalt Registrierung auf der Online-Benutzeroberfläche HU-GO

Magic Figures. We note that in the example magic square the numbers 1 9 are used. All three rows (columns) have equal sum, called the magic number.

Version/Datum: Dezember-2006

Im Folgenden wird die Konfiguration der DIME Tools erläutert. Dazu zählen die Dienste TFTP Server, Time Server, Syslog Daemon und BootP Server.

Pädagogische Hochschule Thurgau. Lehre Weiterbildung Forschung

Lizenzierung von System Center 2012

Contents. Interaction Flow / Process Flow. Structure Maps. Reference Zone. Wireframes / Mock-Up

Business Application Framework für SharePoint Der Kern aller PSC-Lösungen

KNXCONTROL LÖSUNGEN 3 - KNX H-SERVER 1 - KNX M-SERVER 2 - KNX M-SERVER KNX H-SERVER + INTERCOM INTERCOM UPGRADE KNXSERVER UPGRADE KNXSERVER +

Agile Software Development

Rock-Band. Einleitung. Scratch. In diesem Projekt lernst du, wie du deine eigenen Musikinstrumente programmieren kannst! Activity Checklist

Reporting Services und SharePoint 2010 Teil 1

Listening Comprehension: Talking about language learning

Wir unterscheiden folgende drei Schritte im Design paralleler Algorithmen:

Group signature schemes and payment systems based on the discrete logarithm problem

The B Method. B ist eine Methode zur Spezifikation zum Entwurf zur Implementierung von Software Systemen. Bücher zur B-Methode

Critical Chain and Scrum

Agentur für Werbung & Internet. Schritt für Schritt: -Konfiguration mit Apple Mail

Grüne Elektronik. Wir sind Sicherheit!

ICS-Addin. Benutzerhandbuch. Version: 1.0

Bedienungsanleitung PC-Konfigurationssoftware des ID Inclinometers

UWC 8801 / 8802 / 8803

Getting Started General Workflow. Anlegen von Schablonen Ausrichtung 3.2. Atoms Precision V2 Tutorial. Working with Images Direct from Camera

ISA Server 2004 Erstellen eines neuen Netzwerkes - Von Marc Grote

Eigenen WSUS Server mit dem UNI WSUS Server Synchronisieren

How-to: Webserver NAT. Securepoint Security System Version 2007nx

OP-LOG

Schritt für Schritt Hilfe Neufahrzeugkonfigurator

ecaros-update 8.2 Update 8.2 procar informatik AG 1 Stand: DP 02/2014 Eschenweg Weiterstadt

SALSAH eine virtuelle Forschungsumgebung für die Geisteswissenschaften

Anleitung zur Installation des AP-Manager-II

SEMINAR Modifikation für die Nutzung des Community Builders

SJ OFFICE - Update 3.0

Installation der SAS Foundation Software auf Windows

MailUtilities: Remote Deployment - Einführung

Anleitung zum erstellen von DVD/ CD zum Sichern der Volumes:


Print2CAD 2017, 8th Generation. Netzwerkversionen

Inhalt. 1 Einleitung AUTOMATISCHE DATENSICHERUNG AUF EINEN CLOUDSPEICHER

Folgende Voraussetzungen für die Konfiguration müssen erfüllt sein: - Ein Bootimage ab Version Optional einen DHCP Server.

Transkript:

DISS. ETH NO. 22400 Toward Full Autonomy for Vision-Guided Robots: From Self-Calibration to Self-Directed Exploration A thesis submitted to attain the degree of DOCTOR OF SCIENCES of ETH ZURICH (Dr. sc. ETH Zurich) presented by LIONEL HENG M.S. in Computer Science Stanford University born on 12.08.1983 citizen of Singapore accepted on the recommendation of Prof. Marc Pollefeys Prof. Roland Siegwart Prof. Wolfram Burgard 2014

Abstract Many building blocks have to be put in place for full robot autonomy to happen: self-calibration, control, perception, path planning, and high-level behaviors. Hence, a considerable number of algorithms has to run on-board a robot, which however, has a finite amount of computational resources. Vision-based perception algorithms are inherently computationally expensive, and this fact makes full autonomy for a vision-guided robot even more challenging to achieve. Given only 2D image data, computationally efficient algorithms are needed to compute accurately and in real-time the robot s current pose and the 3D geometric representation of the environment. An accurate 3D map of the environment with a high update rate is a primary requisite for high-level behaviors on the robot. We propose a 3D occupancy mapping algorithm that runs in real-time, has constant space complexity, and scales well to large environments. Through extensive real-world experiments with a micro aerial vehicle (MAV) equipped with a forward-looking stereo camera, we demonstrate our 3D occupancy mapping algorithm to work well in both indoor and outdoor environments. In addition, we build on the 3D mapping results by showing wall-following and frontier-based exploration behaviors. With automated 3D reconstruction in mind, we continue our work on exploration by proposing an algorithm for simultaneous exploration and coverage. Simulation experiments show the feasibility of this algorithm. The use of multiple cameras increases a robot s perceptual awareness of its environment. However, transformations between cameras must be known with high accuracy. In this case, an unsupervised and markerless calibration algorithm is ideal as expert supervision and modification of the environment are not required. We propose SLAM-based self-calibration algorithms for two different configurations of multi-sensor systems: one with multiple monocular cameras and a calibrated odometry system, and one with multiple calibrated stereo cameras. Metric scale is inferred from odometry and calibrated stereo viii

respectively. These self-calibration algorithms do not assume an overlapping field of view between any two cameras. We also come up with an infrastructurebased calibration algorithm that leverages image-based localization and the map built by SLAM-based self-calibration to calibrate a multi-camera system in near real-time. Motion estimation algorithms for single cameras cannot easily be extended to multi-camera systems. Using the generalized camera model, we propose a 3-point motion estimation algorithm for a calibrated multi-camera system. This algorithm uses inertial information from an IMU and estimates the relative motion with metric scale. In addition, we use this multi-sensor system on a MAV to demonstrate real-time and on-board SLAM with loop closures. All these works enable vision-guided robots to take a big step towards full autonomy. The work on self-calibration and infrastructure-based calibration enables a robot to perform self-maintenance, facilitating long-term operation in the field without expert supervision. The mapping algorithm allows robots to efficiently map out large environments without running out of memory. The SLAM implementation allows robots to use multiple cameras at the same time for pose estimation. The successful demonstration of high-level behaviors in the form of wall-following, frontier-based exploration, and simultaneous exploration and coverage serves to show that full autonomy for vision-guided robots can be a realistic goal. ix

Zusammenfassung Um die vollständige Autonomität von Robotern zu ermöglichen, werden viele Baublöcke benötigt: Selbstkalibrierung, Lenkung, Perzeption, das Planen von Pfaden und intelligentes Verhalten. Daher muss eine erhebliche Anzahl von Algorithmen auf dem Roboter selbst ausgeführt werden. Allerdings sind die Ressourcen des Roboters für Berechnungen limitiert. Algorithmen zur bildbasierten Perzeption sind inherent rechenintensiv. Dieser Umstand erschwert das Erreichen vollständiger Autonomität eines durch Bilder gesteuerten Roboters zusätzlich. Um die aktuelle Positionierung des Roboters und die dreidimensionale Repräsentation der Umgebung akkurat und in Echtzeit alleine anhand von 2D-Bilddaten zu berechnen, werden effiziente Algorithmen benötigt. Eine genaue dreidimensionale Karte der Umgebung, welche mit hoher Frequenz aktualisiert wird, ist die Hauptvoraussetzung für das intelligente Verhalten des Roboters. Wir schlagen einen Algorithmus basierend auf einer dreidimensionalen Karte der Raumbelegung vor. Der Algorithmus läuft in Echtzeit, verfügt über konstante Specherkomplexität und funktioniert auch für grosse Umgebungen gut. Durch ausgiebige Experimente in der realen Welt mit einem kleinen Fluggefährt ( Micro Aerial Vehicle, kurz MAV), welches mit einer nache vorne ausgerichteten Kamera ausgestattet wurde, zeigen wir, dass unser Algorithmus zur Erstellung einer dreidimensionalen Karte der Raumbelegung sowohl inner- als auch ausserhalb von Gebäuden funktioniert. Zusätzlich bauen wir auf den Resultaten zur Erstellung dreidimensinaler Karten auf, indem wir das Folgen entlang von Wänden und grenzbasierte Erkundung zeigen. Mit Blick auf automatisierte dreidimensionale Rekonstruktion setzen wir unsere Arbeit an der Erkundung fort, indem wir einen Algorithmus zur simultanen Erkundung und Abdeckung vorschlagen. Simulationen zeigen die Umsetzbarkeit dieses Algorithmus. Die Verwendung mehrerer Kameras erhöht die Wahrnehmung der Umgebung des Roboters. Allerdings müssen die Transformationen zwischen den x

Kameras mit hoher Genauigkeit bekannt sein. In diesem Fall ist ein unbeaufsichtigter Algorithmus, welcher keine Marker verwendet, ideal, da er keine Beaufsichtigung durch Experten und keine Anpassung der Umgebung benötigt. Wir schlagen Algorithmen zur SLAM-basierten Selbstkalibrierung für zwei verschiedene Konfigurationen von Systemen mit mehreren Sensoren vor: einen mit mehreren monokularen Kameras und einem kalibrierten System für Odometrie und einen mit mehreren kalibrierten Stereokameras. Die metrische Skala wird von der Odometrie, beziehungsweise von kalibrierten Stereoaufnahmen abgeleitet. Diese Algorithmen zur Selbstkalibrierung gehen nicht von überlappenden Gesichtsfeldern zwischen irgendwelchen zwei Kameras aus. Zusätzlich schlagen wir einen Algorithmus zur auf Infrastruktur basierenden Kalibrierung vor, welcher die bildbasierte Lokalisierung und die durch SLAM-basierte Selbstkalibrierung erstellte Karte ausnutzt, um ein Multi-Kamera-System in Nahe- Echtzeit zu kalibrieren. Algorithmen zur Schätzung von Bewegungen für einzelne Kameras können nicht einfach für Multi-Kamera-Systeme erweitert werden. Unter Verwendung des generalisierten Kameramodells schlagen wir einen 3-Punkte-Algorithmus zur Schätzung der Bewegung eines kalibrierten Multi-Kamera-Systems vor. Dieser Algorithmus verwendet die Informationen eines IMU-Systems und schätzt die relative Bewegung mit einer metrischen Skala. Zusätzlich verwenden wir dieses Multi-Sensor-System auf einem MAV um SLAM inklusive dem Schliessen von Schleifen in Echtzeit zu demonstrieren. All diese Arbeiten ermöglichen den bildbasiert gesteuerten Robotern einen grossen Schritt in Richtung vollständiger Autonomität. Die Arbeit an Selbstkalibrierung und Kalibrierung basierend auf Infrastruktur ermöglicht es einem Roboter, sich selbst instand zu halten, was wiederum lange andauernde praktische Einsätze ohne Beaufsichtigung von Experten ermöglicht. Der Algorithmus zur Erstellung von Karten erlaubt es Robotern grosse Umgebungen aufzuzeichnen, ohne dass der Speicherplatz ausgeht. Die Implementierung von SLAM erlaubt es Robotern meherere Kameras gleichzeitig für das Schätzen von Posen zu verwenden. Die erfolgreiche Demonstration von intelligentem Verhalten in Form vom Folgen entlang von Wänden, der grenzbasierten Erkundung und der simultanen Erkundung und Abdeckung dient dem Zweck zu zeigen, dass vollständige Autonomität für bildbasiert gesteuerte Roboter ein realistisches Ziel sein kann. xi