izpis_h1_title_alt

AVTONOMNO UČENJE ROBOTSKIH OPERACIJ V KONTAKTU Z OKOLICO
ID Kramberger, Aljaž (Author), ID Ude, Aleš (Mentor) More about this mentor... This link opens in a new window

.pdfPDF - Presentation file, Download (14,26 MB)
MD5: B42E003D16AC05AA6E775D775BB583DD
PID: 20.500.12556/rul/b2bfec69-54e6-4dab-b54e-0b1bdd7e6ae9

Abstract
Robotski sistemi imajo pomembno vlogo v današnji sodobni industrijski proizvodnji. Realizacija današnjih masovnih načinov proizvodnje brez vpeljave robotskih sistemov ne bi bila mogoča. Omenjeni sistemi delujejo v zaprtih, strukturiranih okoljih z visoko natančnostjo in zanesljivostjo. Zaradi visoke cene in amortizacijske dobe lahko te sisteme najdemo v velikih industrijskih obratih. S prihodom novih tehnologij in povezovanja sistemov v t.i. industriji 4.0 je opazen počasen trend tranzicije v manjše industrijske obrate, kjer je potreba po kooperacijskem delovanju človeka in robota ter spreminjanju izdelkov bolj pogosta. V ta namen je potrebno razviti robotske sisteme, ki so dovzetni za okolico v kateri delujejo in omogočajo hiter prenos znanja, prilagodljivost in varno delovanje. Klasični pristopi programiranja industrijskih robotov so kompleksni in dolgotrajni. Rešitev predstavljajo metode, ki uporabljajo programiranje s posnemanjem človeka [14, 15, 4]. Pri učenju s posnemanjem prenos znanja na robotske sisteme poteka na različne načine: s haptičnim vmesnikom [7], optičnimi senzorji [8], ter v zadnjih letih zelo popularnim kinestetičnim vodenjem [5, 10]. Kinestetično vodenje je posledica novih trendov razvoja robotskih mehanizmov, na primer: Kuka LWR, Universal Robot, Franka Emika, idr. V tej doktorski disertaciji smo se osredotočili na programiranje robotov s kinestetičnim vodenjem, pri čemer nismo zajemali samo kinematične trajektorije, ampak tudi pripadajoče sile in navore potrebne za izvedbo naloge v kontaktu. Klasični pristopi vodenja po sili so v robotiki dobro poznani [36, 37], manj pa so raziskane metode, ki omogočajo hitro učenje novih gibanj v kontaktu z okolico in njihovo adaptacijo na nepredvidljive dogodke. Za uspešno izvedbo adaptacije je potrebno robotsko gibanje prilagoditi med izvajanjem in pri tem upoštevati nastopajoče sile in navore. V ta namen zapišemo trajektorije z dinamičnimi generatorji gibov (angl. Dynamic Movement Primitives - DMP) [22, 23], ki omogočajo spreminjanje le-teh med izvajanjem ter niso neposredno odvisni od časa. Časovna odvisnost robotskih trajektorij je pogosto neprimerna, ker je med izvedbo adaptacije – glede na signale, izmerjene s senzorji [32] – gibanje robota potrebno večkrat pospešiti ali popolnoma ustaviti[24]. V disertaciji obravnavamo regulator, ki poskrbi za prilagajanje robotskega gibanja na podlagi predvidenih sil, pridobljenih z demonstracijo, in dejanskih izmerjenih sil. Ena izmed pomembnih lastnosti pri fizični interakciji človeka z okoljem je njegova sposobnost prilagajanja podajnosti. S spreminjanjem podajnosti je mogoče prilagoditi interakcijske sile med robotskim sistemom in okolico [30]. Prav tako se z uporabo metod robotskega učenja sistem sam nauči potrebnih znanj za izvedbo naloge [52], na primer za učenje sil potrebnih za odpiranje vrat. Najbolj pogosto uporabljene metode so spodbujevano učenje [51] in robotsko učenje s ponavljanjem [103]. V tem delu smo se osredotočili predvsem na slednjo metodo, ter s pomočjo ponavljanja naloge minimizirali napako med dejanskimi in želenimi silami in navori. Na ta način se lahko robotski sistem sam nauči optimalnega gibanja glede na želeno nalogo. Posebno pozornost je potrebno posvetiti varnemu in stabilnemu izvajanju nalog pri kontaktu z okolico oz. neposredni bližini človeka. Ocena pasivnosti nam pove, ali sistem porablja več energije, kot je predpisano [47, 48]. Da zagotovimo pasivno in stabilno delovanje, je potrebno sistemu predpisati določeno energijo v obliki rezervoarja energije [50, 49], ki jo robot lahko porabi za izvedbo naloge. Za doseganje vsestranskosti delovanja robotskih mehanizmov je potrebno s postopki statističnega učenja obstoječa znanja povezovati z novimi. Med vsemi obstoječimi metodami velja poudariti dve, lokalno uteženo regresijo (angl. "LocallyWeighted Regression- LWR) [64] in Gasussovo regresijo (angl. "Gaussian Process Regression-GPR) [66]. Statistično učenje na podlagi baze znanja, generira nova znanja glede na podane parametre naloge. V preteklosti so se statistične metode uporabljale predvsem za robotska gibanja, ki niso bila v stiku z okolico, kot na primer robotsko seganje [72]. V tem delu smo se osredotočili predvsem na statistično učenje profilov sil in navorov, ter orientacij zapisanih s kvaternioni, ki so uporabljeni kot referenca za adaptacijo. Prenos naučenega znanja znotraj delovnega območja robota je zelo pomembno, ker na ta način zagotovimo izkoristek celotnega delovnega področja. Za pridobivanje informacij, ki jih potrebujemo za prenos gibanja, v ne strukturiranih okoljih uporabimo globinske kamere, s katerimi zaznamo lego objektov. Lego objekta lahko zaznamo na več načinov, v tem delu smo uporabili algoritem iterativne najbližje točke [80, 82]. Med transformacijo trajektorij lahko pride do odstopanj med dejansko pozicijo objekta in izmerjeno, ki je posledica raznih zunanjih vplivov in natančnosti kalibracije med sistemi. V ta namen smo razvili metode za kompenzacijo odstopanja, s katerimi zagotovimo uspešno izvedbo naloge. Prav tako so te metode lahko uporabljene v povezavi s algoritmom planiranja zaporedja sestavljanja. Algoritmu lahko na več načinov predstavimo relacije med sestavnimi deli, na primer: sestavljanje v virtualnem okolju [83], nepopolna zaporedja montaže [90], govornimi ukazi [86], itd. V tem delu smo se osredotočili na samostojno učenje relacij med danimi sestavnimi deli. Sistem planiranja samostojno tvori poizkuse in jih izvede na realnem sistemu. Po končani izvedbi se nauči modela relacij montažne naloge in tvori optimalna zaporedja izvedbe sestavljanja. Predlagane metode smo preizkusili z raznimi eksperimenti v simulacijah in na realnih sistemih.

Language:English
Keywords:učenje s posnemanjem, prilagajanje robotskih trajektorij, manipulacija, dinamični generatorji gibov, transformacija gibanja, pasivna interakcija, detekcija objektov, planiranje montažnih nalog
Work type:Doctoral dissertation
Organization:FE - Faculty of Electrical Engineering
Year:2018
PID:20.500.12556/RUL-100147 This link opens in a new window
COBISS.SI-ID:11995476 This link opens in a new window
Publication date in RUL:09.03.2018
Views:2297
Downloads:577
Metadata:XML DC-XML DC-RDF
:
Copy citation
Share:Bookmark and Share

Secondary language

Language:Slovenian
Title:AUTONOMOUS LEARNING OF ROBOT ACTIONS IN CONTACT WITH THE ENVIRONMENT
Abstract:
One of the major challenges of modern robotics is to enable robot operation in unstructured environments. Such environments are typically not only cluttered with various objects, but also tend to change frequently and thus cannot be modelled adequately. This is one of the main reasons why the applicability of most of the current robot manipulators is still limited to strictly controlled industrial environments. The existing robot programming technologies and pure position control, which is used in most of the current robot manipulators, are inadequate to extend the applicability of robots outside of the controlled industrial work cells. Tasks that involve contacts with objects, whose positions are not accurately known, require controllers that regulate the relationship between the robot pose and the arising forces and torques. When operating in contact with the environment, e.g. in assembly tasks, it is important that a robot properly responds to external forces and torques that act on it during the task execution. In the first part of the thesis we present a new learning and adaptation approach for teaching robot operations in contact with the environment. Such tasks are hard to program by means of traditional robot programming techniques, therefore we developed a new approach based on capturing data for learning contact tasks from a human demonstrator. With the proposed approach, the acquired data are utilized for robot movement adaptation according to contact forces and torques arising during the task execution. The resulting adaptation process iteratively improves the initial robot movements to ensure appropriate contact forces during motion and to speed up the task execution. Both contacts with objects in the work cell as well as contacts with humans, which arise in cooperative task execution, are considered. Stable and – even more importantly – safe execution of a contact task has to be ensured when working in cooperation or in vicinity of humans. Therefore, in the second part of the thesis we present a passivity based approach for robot control in contact tasks. The energy produced by the system is monitored and acted upon accordingly to ensure passivity if the environment changes. This method ensures safe interaction with humans and the environment. In the third part, the generalization of contact movements is presented. Here the learned operations are adapted and safely executed according to changes that occur in the robot environment. Generalization relies on a database of example demonstrations of robot movements that lead to successful task execution in varying configurations of the robot work cell. For this purpose, a library, which consists of position and orientation trajectories, the accompanying force-torque profiles, and the parameters describing the task configuration associated with each demonstration, is recorded. The proposed generalization method enables the robot to perform the desired task although the demonstrated task configuration has changed. This way the number of demonstrations necessary to learn a skill can be reduced. In the fourth part of the thesis we discuss the issue of transferring the learned assembly skills to new locations within the workspace of the robot. We apply external sensors to detect objects and acquire information about their poses in the vicinity of the robot. Object pose estimation with external sensors, e.g. RGB-D cameras, always introduces noise into the system. Therefore, the trajectories are first transformed to the new location an then adapted to ensure reliable, safe and fast execution of the task. Finally, we show that a library of example demonstrations can be used for stepby- step training of a planning algorithm, which can generate all possible assembly sequences.

Keywords:learning by demonstration, trajectory adaptation, iterative learning, manipulation, dynamic movement primitives, passivity, passive interaction, generalization, trajectory transfer, object detection, planning

Similar documents

Similar works from RUL:
Similar works from other Slovenian collections:

Back