"#$%&'()$"*+,(%'-()$" A$,()'*B'3)#01*C*.,D$*43(%(, "#$%&'(%&)*+,-.#/$0(.,12)#$#3)(04,5 7,(2)#1(080*94*:;', <(,0)#1)/)10)#*=>?>@=>?? "#$%&'(%&)*+,-.#/$0(.,12)#$#3)(04,5*6*7,(2)#1(080*94*:;',*6*<(,0)#*=>?>@=>??
.$()/'()$" +//)#*/)&#*G)E0*H*I+,-.#/$0(.,1J3)#-'404,5K Text ist nicht strukturiert Für automatisierte Verarbeitung Struktur nötig Informationen sollen gefunden, extrahiert und repräsentiert werden. "#$%&'(%&)*+,-.#/$0(.,12)#$#3)(04,5*6*7,(2)#1(080*94*:;',*6*<(,0)#*=>?>@=>??
L(,-J,5 "#$%&'()$"*+,(%'-()$" "#$%&'()$"01+(%)+/'2 M)N$#-O*$''5)/)(,)*#)')2$,0)*+,-.#/$0(.,*94*)(,)/*G&)/$* 4%&$,-#$5)O*%&'J11)'P;#0)#*QF)R*P.#N1S* L#1%&'()T4,5*2.,*A.F4/),0),*.N)#*M)10$,N0)('),*2.,*A.F4/),0), 1(%&0),U*1$//)',U*P)(0)#2)#$#3)(0), "#$%&'(%&)*+,-.#/$0(.,12)#$#3)(04,5*6*7,(2)#1(080*94*:;',*6*<(,0)#*=>?>@=>??
L(,-J,5 "#$%&'()$"*+,(%'-()$" 3+,(0.)")"4 ")9()'')*B,P),N4,5),U*N()*$4-*N()*V),)#()#4,5*3)10(//0)#*+,-.#/$0(.,* $39()'),U*N()*)1*2.#&)#*,(%&0*5$3W M1"W*G)E0F'$11(-(F$0(.,U*"$/6X('0)# "#$%&'()$"*+,(%'-()$" M)(1"()'O*Y)#.,),,$/),*(,*A.F4/),0),1$//'4,5),*-(,N),*94#* B,#)(%&)#4,5*)(,)#*Y)#1.,),6A$0),3$,FW M)N$#-O*")9(-(1%&)*+,-.#/$0(.,*$41*3)10(//0),*A.F4/),0),* B,-#$5)*J3)#*1")9(-(1%&)*Z410)#*H*A)#*V#.T0)('*$,*+,-.#/$0(.,*(,*)(,)/* A.F4/),0*P(#N*(5,.#()#0* I[)#$419()&),K*N)#*5)PJ,1%&0),*+,-.#/$0(., "#$%&'(%&)*+,-.#/$0(.,12)#$#3)(04,5*6*7,(2)#1(080*94*:;',*6*<(,0)#*=>?>@=>??
L(,-J,5 "#$%&'()$"*+,(%'-()$" " Information Retrieval vs. Text Mining IE Teilbereich Text Mining "#$%&'(%&)*+,-.#/$0(.,12)#$#3)(04,5*6*7,(2)#1(080*94*:;',*6*<(,0)#*=>?>@=>?? "#$%&'(%&)*+,-.#/$0(.,12)#$#3)(04,5*6*7,(2)#1(080*94*:;',*6*.//)#1)/)10)#*=>?>
L(,-J,5 "#$%&'()$"*+,(%'-()$" V#.3)1*\()'O +,-.#/$0(.,),*$41*G)E0),*&)#$41')1),* H*"#$"$%#&'$"#()*+$,#)-.$/$" "#$%&'(%&)*+,-.#/$0(.,12)#$#3)(04,5*6*7,(2)#1(080*94*:;',*6*<(,0)#*=>?>@=>??
5"6+"78"4*9+%+):;+ " <(11),1/$,$5)/),0 L#10)''4,5*2.,*A$0),3$,F)(,0#85),U*B4-3$4*2.,*],0.'.5(), " +^ _)#3)11)#4,5*N)#*+,N(9)1 Y.106X('0)#*N)#*4%&)#5)3,(11) B4--(,N),*2.,*A.F4/),0),*QY$#$5#$"&),SU*N()*-J#*)(,)* X#$5)10)''4,5*N)1*M),409)#1*#)')2$,0*1(,N* _)#-)(,)#0)*4%&)O*9W*MW*X(#/),6U*Y)#1.,),14%&) " G)E0F'$11(-(F$0(., 2)#-)(,)#0)*A(/),1(.,),*`*,4#*3)10(//0)*G)(')*)(,)1*A.F4/),01*-J#* N()*:'$11(-(F$0(.,*2)#P),N), "#$%&'(%&)*+,-.#/$0(.,12)#$#3)(04,5*6*7,(2)#1(080*94*:;',*6*<(,0)#*=>?>@=>??
5"6+"78"4*9+%+):;+ " G)E0941$//),-$114,5 G)E0-('0)#4,5U*[)#2.#&)3), a4#*n()*#)')2$,0)10),*b31%&,(00)*)(,)1*g)e0)1*p)#n),*$'1* \41$//),-$114,5*)E0#$&()#0* " X#$5)3)$,0P.#04,5*Qb4)10(.,*B,1P)#(,5*S B,$'R1)*N)#*X#$5)*c*X)10')54,5*N)1*B,0P.#00R"1* +L*(10*)(,)*G)('$4-5$3)*2.,*bBO*LE0#$F0(.,*N)#*#)')2$,0),* +,-.#/$0(.,*$41*A.F4/),0),*4,N*V),)#()#),*N)#*B,0P.#0 " Y)#1.,),14%&)*9W*MW*&00"O@@PPPWR$1,(W%./@ " )/$,0(1%&)*_)#,)094,5*3)10(//0)#*L,0(0()1*Q]#0)U*Y)#1.,),U*41PWS*9W* MW*&00"O@@PPPW0)E0/$"W%./@ " 7,0)#10J094,5*L6A(1%.2)#R*9W*MW*&00"O@@PPPW#)%.//(,NW%./@ "#$%&'(%&)*+,-.#/$0(.,12)#$#3)(04,5*6*7,(2)#1(080*94*:;',*6*<(,0)#*=>?>@=>??
<)+2 " Das Ziel der IE ist die Konstruktion von Systemen, die gezielt domänspezifi sche Informationen aus freien Texten aufspüren und strukturieren können, bei gleichzeitigem Überlesen irrelevanter Information. (Neumann, 2000: 1) "#$%&'(%&)*+,-.#/$0(.,12)#$#3)(04,5*6*7,(2)#1(080*94*:;',*6*<(,0)#*=>?>@=>?? "#$%&'(%&)*+,-.#/$0(.,12)#$#3)(04,5*6*7,(2)#1(080*94*:;',*6*.//)#1)/)10)#*=>?>
5224+&+)"+%05"*'(= " d.f$'(1()#)*g)e0)*4,n*g)e0$31%&,(00)u*n()*n()*5)pj,1%&0)* +,-.#/$0(.,*),0&$'0), " +5,.#()#)*N()*,(%&0*#)')2$,0)*+,-.#/$0(.,* " LE0#$&()#)*N()*#)')2$,0),*+,-.#/$0(.,10)(')* " XJ5)*N()*+,-.#/$0(.,10)(')*941$//),*4,N*J3)#-J&#)*1()*(,*N$1* 5)5)3),)*]40"40-.#/$0 "#$%&'(%&)*+,-.#/$0(.,12)#$#3)(04,5*6*7,(2)#1(080*94*:;',*6*<(,0)#*=>?>@=>??
<84%8"7+2)+4+"7+0>'(+" Ausgangslage " Datenbanken " Web Content Redaktioneller Content Usergenerierter Content " Dokumentensammlungen "#$%&'(%&)*+,-.#/$0(.,12)#$#3)(04,5*6*7,(2)#1(080*94*:;',*6*<(,0)#*=>?>@=>?? "#$%&'(%&)*+,-.#/$0(.,12)#$#3)(04,5*6*7,(2)#1(080*94*:;',*6*.//)#1)/)10)#*=>?>
<84%8"7+2)+4+"7+0>'(+" Ausgangslage " Inhalte (Allgemein, Nachrichten, Medizinische Texte, Produktbewertungen ) " Form (Dateiformate, Webseiten, Artikel, Technische Reports ) " Skopus (bspw. Dokumentensammlung zu bestimmten Thema) " Autoren (Perspektive, Standpunkt) " Redaktioneller / Usergeneriert Content Unterschiedliche Aufgaben der Vorverarbeitung "#$%&'(%&)*+,-.#/$0(.,12)#$#3)(04,5*6*7,(2)#1(080*94*:;',*6*<(,0)#*=>?>@=>?? "#$%&'(%&)*+,-.#/$0(.,12)#$#3)(04,5*6*7,(2)#1(080*94*:;',*6*.//)#1)/)10)#*=>?>
<84%8"7+02)+4+"7+0>'(+" " &00"O@@PPPW1"()5)'WN)@ "#$%&'(%&)*+,-.#/$0(.,12)#$#3)(04,5*6*7,(2)#1(080*94*:;',*6*<(,0)#*=>?>@=>??
<84%8"7+02)+4+"7+0>'(+" Z)(,*G(""*(%&*&$3)*J3)#*N()*G_*:$#0)*N),*Y#.D)F0.#*'$4-),*4,N* N),*.4,N*2./*e./"(*$4-*N)/*4#.4,N*?+%*(+%-+%*N$1*5(30* )(,-$%&*"+"04+")'2+"0@##+-(*-J#*"()')*(,*/)#3(,N4,5*/(0*)(,* P),(5*X4,F*\43)&;#*/(0*N)/*/$,*N$,,*N()*"()')*10)4)#0*P(#N* )1*1.*$'1*P),,*/$,*1(%&*(/*A$&B)*3)P)50*f g6s 6 #.-'**6 540)*ah 6*fffffffff*6*144444444444")# 6 666Qi2iS666 "#$%&'(%&)*+,-.#/$0(.,12)#$#3)(04,5*6*7,(2)#1(080*94*:;',*6*<(,0)#*=>?>@=>??
?+%#';%+" @)"4'9+ <(11),1j4)'') A)-(,(0(.,*N)#*5)-#$50),*+,-.#/$0(.,* 58*4'9+ 0#4F04#()#0)U*1)/$,0(1%&*)E"'(9(0*5)/$%&0)*+,-.#/$0(., "#$%&'(%&)*+,-.#/$0(.,12)#$#3)(04,5*6*7,(2)#1(080*94*:;',*6*<(,0)#*=>?>@=>??
?+%#';%+" @)"4'9+ <(11),1j4)'')* " Z),5)*2.,*G)E0N.F4/),0),*QA.F4/),0),1$//'4,5),U*9W*MW* Y#)11)/(00)('4,5),U*+,0)#,)06A.F4/),0)S A)-(,(0(.,*N)#*5)-#$50),*+,-.#/$0(., " ")9(-(F$0(.,*N)1*GR"1*N)#*#)')2$,0),*+,-.#/$0(.,*(,*X.#/*2.,* G)/"'$0)1*QB00#(340)U*P()*IY)#1.,a$/)KS 58*4'9+ 0#4F04#()#0)U*1)/$,0(1%&*)E"'(9(0*5)/$%&0)*+,-.#/$0(., " +,10$,0(()#0)*G)/"'$0)1*5)-J''0*/(0*#)')2$,0)#*+,-.#/$0(.,U*NW&W*/(0* )E0#$&()#0),*4,N*,.#/$'(1()#0),*0#(,51*Q<)#0)*-J#*N()*N)-(,()#0),* B00#(340)S "#$%&'(%&)*+,-.#/$0(.,12)#$#3)(04,5*6*7,(2)#1(080*94*:;',*6*<(,0)#*=>?>@=>??
?+%#';%+" C+)*B)+20DE+8&'""F0GHHIJ V)14%&0O*+,-.#/$0(.,),*J3)#*Y)#1.,$'P)%&1)' A$0),O*],'(,)6A.F4/),0) Verlassende Person (PersonOutput) Position Organisation wann (TimeOut) Neue Person (PersonIn) wann (TimeIn) "#$%&'(%&)*+,-.#/$0(.,12)#$#3)(04,5*6*7,(2)#1(080*94*:;',*6*<(,0)#*=>?>@=>??
?+%#';%+" 3+,( A#W*[)#/$,,*<(#0&U*3(1&)#(5)#*d)(0)#*N)#*Z41(F&.%&1%&4')*ZJ,%&),U* 2)#$31%&()N)0)*1(%&*&)40)*$41*N)/*B/0W*A)#*klD8&#(5)*0#(00*1)(,),* P.&'2)#N(),0),*^4&)10$,N*$,W*B'1*1)(,)*a$%&-.'5)#(,*P4#N)*$3(,)*:'(,5)#* 3),$,,0W*L3),-$''1*,)4*3)1)090*P4#N)*N()*0)'')*N)1*Z41(F6*N(#)F0.#1W* B,,)'()*[8-,)#*-.'50*e&#(10($,*Z)(,N'*,$%&W 3+&B2'(+ [ PersonOut PersonIn Position Organization TimeOut TimeIn ] "#$%&'(%&)*+,-.#/$0(.,12)#$#3)(04,5*6*7,(2)#1(080*94*:;',*6*<(,0)#*=>?>@=>??
?+%#';%+" 3+,( A#W*[)#/$,,*<(#0&U*3(1&)#(5)#*d)(0)#*N)#*Z41(F&.%&1%&4')*ZJ,%&),U* 2)#$31%&()N)0)*1(%&*&)40)*$41*N)/*B/0W*A)#*klD8&#(5)*0#(00*1)(,),* P.&'2)#N(),0),*^4&)10$,N*$,W*B'1*1)(,)*a$%&-.'5)#(,*P4#N)*$3(,)*:'(,5)#* 3),$,,0W*L3),-$''1*,)4*3)1)090*P4#N)*N()*0)'')*N)1*Z41(F6*N(#)F0.#1W* B,,)'()*[8-,)#*-.'50*e&#(10($,*Z)(,N'*,$%&W "*('"())+%(+*03+&B2'(+ PersonOut Dr. Hermann Wirth PersonIn Sabine Klinger Position Leiter Organization Musikhochschule München TimeOut heute TimeIn "#$%&'(%&)*+,-.#/$0(.,12)#$#3)(04,5*6*7,(2)#1(080*94*:;',*6*<(,0)#*=>?>@=>??
?+%#';%+" "#$%&'()&*"(&(+,-'.#'/0 "#$%&'(%&)*+,-.#/$0(.,12)#$#3)(04,5*6*7,(2)#1(080*94*:;',*6*<(,0)#*=>?>@=>??
?+%#';%+" " +,-.#/$0(.,*(10*J3)#*9P)(*809)*2)#0)('0 " Z$,*/411*P(11),U*P)'%&)*M)N)404,5*I1)(,)*a$%&-.'5)#(,K*&$0 " I&)40)K*/411*$4-5)';10*P)#N), " G(/)+,*(10*,(%&0*)E"'(9(0*5),$,,0*WWW 3+,( A#W*[)#/$,,*<(#0&U*3(1&)#(5)#*d)(0)#*N)#*Z41(F&.%&1%&4')*ZJ,%&),U* 2)#$31%&()N)0)*1(%&*&)40)*$41*N)/*B/0W*A)#*klD8&#(5)*0#(00*1)(,),* P.&'2)#N(),0),*^4&)10$,N*$,W*B'1*1)(,)*a$%&-.'5)#(,*P4#N)*$3(,)*:'(,5)#* 3),$,,0W*L3),-$''1*,)4*3)1)090*P4#N)*N()*0)'')*N)1*Z41(F6*N(#)F0.#1W* B,,)'()*[8-,)#*-.'50*e&#(10($,*Z)(,N'*,$%&W "#$%&'(%&)*+,-.#/$0(.,12)#$#3)(04,5*6*7,(2)#1(080*94*:;',*6*<(,0)#*=>?>@=>??
?+%#';%+" A)#*N#(00)*$09*&$,N)'0*2.,*)(,)#*P)(0)#),*+,10$,9 PersonOut Christian Meindl PersonIn Annelie Häfner Position Musikdirektors Organization Musikhochschule München TimeOut TimeIn G(/)+,*4,N*G(/)]40*3')(3),*4,1")9(-(9()#0 ]#5$,(9$0(.,*&$0*N),1)'3),*<)#0*P()*(,*N)#*)#10),*+,10$,9 A$-J#*3)NJ#-0)*)1*1)&#*1")9(-(1%&)#*^)5)',O*I"#$%#&'#()#%(*#$+(,-.( /-0#+/+(1#200+#'(3#'40,+#5((6#&0#$,%270081 "#$%&'(%&)*+,-.#/$0(.,12)#$#3)(04,5*6*7,(2)#1(080*94*:;',*6*<(,0)#*=>?>@=>??
?+%#';%+" L(,9)',)*B00#(340)*F;,,),*$4%&*P()N)#*G)/"'$0)10#4F04#*3)1(09),U*9W*MW* Y)#1.,),,$/),* m*a$%&,$/)*_.#,$/)*g(0)'*v)1%&')%&0*41pw*n K$&B2)=)+%(+*0L%$92+& Z$,*/411*5),$4*P(11),U*P$1*/$,*)E0#$&()#),*/;%&0) B00#(340)6<)#0*Y$$#)*3')(3),*&84-(5*'))# H*B4-0)('4,5*(,*G)('"#.3')/) "#$%&'(%&)*+,-.#/$0(.,12)#$#3)(04,5*6*7,(2)#1(080*94*:;',*6*<(,0)#*=>?>@=>??
?+%#';%+" C+)*B)+2M0N+"()&+"(0@,(%':()$" ],'(,)6B#0(F)' 0)+$/1,$2#34+1.)4+*5,$67$, 8467$,/$-"**$#94#:;1"$$,#<8=>?@A@B C$D$,+4"/#E#8+$,"$#F1"#E >,&)7,4"/*-$,67+#=#845$,#0.)"/#34+1.)4+*5,$67$, A()*M.E),*1(,N*1)&#*)/"-)&'),1P)#0*4,N*(%&*-(,N)*1()*&$3),*)(,*14")#*"#)(1*')(104,51*2)#&8'0,(1W* +%&*1)'3)#*3)1(09)*N()1)*M.E),*$4%&W*()*&$3),*)(,),*14")#*F'$,5*4,N*$4%&*1)&#*540)*&;&),W* A4#%&*N()*1")9($'*M)1%&(%&04,5*&$'0),*1()*9()&/'(%&*2()'*$41W*+%&*&$3)*1()*1%&.,*1)&#*.-0* )(,5)3$40*3)(*X#)4,N),*4,N*M)F$,,0),*1()*P$#),*3)5)(10)#0W*+%&*&$3)*,.%&*,(%&01*1%&')%&0)1* J3)#*N()*M.E),*5)&;#0W*+%&*")#1;,'(%&*&$3)*N$,,*,.%&*)(,)*M$11#.'')*2.,*/$5,$0*N$94*-J#*,.%&* /)&#*M$11W*<),,*)1*540*$35)10(//0*(10*&$0*/$,*)(,),*&)#2.##$5),N),*:'$,5W*+%&*F$,,*1()*,4#* P)(0)#*)/"-)'),*4,N*2()'*"$T*3)(/*)(,3$4W "#$%&'(%&)*+,-.#/$0(.,12)#$#3)(04,5*6*7,(2)#1(080*94*:;',*6*<(,0)#*=>?>@=>??
?+%#';%+" '.&1233).&.'3&4.%56").&"$((.,.30 "#$%&'(%&)*+,-.#/$0(.,12)#$#3)(04,5*6*7,(2)#1(080*94*:;',*6*<(,0)#*=>?>@=>??
?+%#';%+".O42):;+*0"*('"())+%(+*03+&B2'(+M ProduktCategory ProductInstance ProductValue ProductValue ProductValue ProductFeature ProductFeatureValue ProductFeature ProductFeatureValue ProductFeature... Autolautsprecher Pioneer TS-E2090 empfehlenswert 5 Sterne super preis leistungs verhältnis Klang super Höhen sehr gut Beschichtung "#$%&'(%&)*+,-.#/$0(.,12)#$#3)(04,5*6*7,(2)#1(080*94*:;',*6*<(,0)#*=>?>@=>??
@/'28'()$" L'8*+P "#$%&'(%&)*+,-.#/$0(.,12)#$#3)(04,5*6*7,(2)#1(080*94*:;',*6*<(,0)#*=>?>@=>??
@/'28'()$" "?ohp6?oop*g$**)/$#h"i$,*+)"i"/#j1"&$,$"6$**qz7es X.#1%&)#6<)003)P)#3*94#*L,0P(%F'4,5*2.,*L2$'4$0(.,110$,N$#N1*-J#*N()* +,-.#/$0(.,1)E0#$F0(., G&)/),O*+L*$41*Z$#(,)6a$%&#(%&0),U*G)E0)*J3)#*0)##.#(10(1%&)*_.#-8'')*(,* d$0)(,$/)#(f$u*g)e0)*j3)#*q.(,0*2),04#)1*qq_s*4,n*[$'3')(0)#-$3#(f$0(.,* QZLSU*$0)''(0),10$#06M)#(%&0) " "80)#*BeL*QB40./$0(%*e.,0),0*LE0#$%0(.,SU*G+AL*QG#$,1'(,54$'* +,-.#/$0(.,*A)0)%0(.,U*LE0#$%0(.,*$,N*4//$#(9$0(.,S _)#1%&()N),)*<)003)P)#3)*94*3)10(//0),*G&)/),O* <$%5>F).K#C1J,$)+F$K#8$"*>F).#LLL "#$%&'(%&)*+,-.#/$0(.,12)#$#3)(04,5*6*7,(2)#1(080*94*:;',*6*<(,0)#*=>?>@=>??
@/'28'()$" 592'8#?W A./8,)*$41P8&'),* =W ")9(-(F$0(.,*N)#*+L6B4-5$3)* rw ")9(-(F$0(.,*N)#*X.#/*N)1*2)#'$,50),*]40"401*QG)/"'$0)1S* sw G)E0)*$41P8&'),* lw ^)-)#),9P)#0)O*LE")#0),*$,$'R1()#),*N()*A.F4/),0)*(/*5)PJ,1%&0),*X.#/$0* kw R10)/*-J�*B4-5$3)*$41* pw _)#5')(%&*N)#*R10)/$415$3),*/(0*N),*^)-)#),9P)#0), "#$%&'(%&)*+,-.#/$0(.,12)#$#3)(04,5*6*7,(2)#1(080*94*:;',*6*<(,0)#*=>?>@=>??
@/'28'()$" 592'8# XJ#*D)N)1*G)/"'$0)*P(#N*J3)#"#J-0 " P()*.-0*)1*2./*LE")#0),*$415)-J''0*P4#N) " P()*.-0*)1*2./*R10)/*$415)-J''0*P4#N) " B,9$&'*N)#*5),$4),*t3)#)(,10(//4,5),*Q/$0%&)1S* " B,9$&'*"$#0()'')#*t3)#)(,10(//4,5),* " B,9$&'*-$'1%&)#*L(,0#85)*QL(,0#$5*(/*-$'1%&),*X)'NS* " B,9$&'*4,3)F$,,0)#*L(,0#85)*Q:)(,)*t3)#)(,10(//4,5*9PW*LE")#0),*4,N*R10)/S* " B,9$&'*-)&'),N)#*L(,0#85) "#$%&'(%&)*+,-.#/$0(.,12)#$#3)(04,5*6*7,(2)#1(080*94*:;',*6*<(,0)#*=>?>@=>??
@/'28'()$".'Q+ ;,M9*1"#;#N;,$6*1"O P1..*+M"I/Q$+#P#N($6)..O R=G)S "#$%&'(%&)*+,-.#/$0(.,12)#$#3)(04,5*6*7,(2)#1(080*94*:;',*6*<(,0)#*=>?>@=>??
@/'28'()$" 7#89'(':3&7&;7#.+'(':3< B,9$&'*F.##)F0*5)P.,,),)#*<(11),1)(,&)(0),*Q<LS*(/*_)#5')(%&*94*$''),* (,15)1$/0*5)-4,N),),*<LW <LO*G)/"'$0)1*.N)#*B00#(340@<)#06Y$$#) [.&)*Y#89(1(.,*H*-$10*$'')*5)-4,N),),*<L*1(,N*#)')2$,0 0 "#$%&'&() *" # +),-./ 0(##$01 2$3())$)$# 4)'1-),$) +),-./ -//$# 2$3())$)$) 4)'1-),$) "#$%&'(%&)*+,-.#/$0(.,12)#$#3)(04,5*6*7,(2)#1(080*94*:;',*6*<(,0)#*=>?>@=>??
@/'28'()$" =:66()83*'/1.')&=&;>.+"66?&@>&"$+,A&4#.BB.#C$:).< B,0)('*N)#*F.##)F0*5)P.,,),),*<L*(/*_)#5')(%&*94*N),*(,15)1$/0* 5)P(,,3$#),*<LW [.&)*_.''108,N(5F)(0*H*-$10*$'')*#)')2$,0),*<L*P4#N),*)E0#$&()#0 0 5$%-// *" # +),-./ 6$# 0(##$01 2$3())$)$) 4)'1-),$) +),-./ -//$# 2$3&))7-#$) 4)'1-),$) "#$%&'(%&)*+,-.#/$0(.,12)#$#3)(04,5*6*7,(2)#1(080*94*:;',*6*<(,0)#*=>?>@=>??
@/'28'()$" R+2:;+*0.'Q0)*(06):;()4+%P ]"0(/()#4,5*2.,*_*4,N*Y*5')(%&9)(0(5*(10*1%&P()#(5W <),,*&.&)*L%S=)*)$"*)#-.#N)#0*N$,,*10)(50*N()*<$%&)(,'(%&F)(0U*N$11* #)')2$,0)*<L*,(%&0*)#F$,,0*P)#N),W <),,*&.&)*?$22*(S"7)4-+)(*."0(/()#0*P(#NU*10)(50*N()*<$%&)(,'(%&F)(0U* N$11*<L*/(0*(,1*L#5)3,(1*$4-5),.//),*P)#N),U*N()*5$#*,(%&0*#)')2$,0*1(,NW "#$%&'(%&)*+,-.#/$0(.,12)#$#3)(04,5*6*7,(2)#1(080*94*:;',*6*<(,0)#*=>?>@=>??
@/'28'()$" <8*'&&+"#'**+"7+*0.'QM0TU.'Q 8 9 : ;-< # = $ "#$%&'&() $ 5$%-//" "#$%&'&() % 5$%-//" 0 a)3),*n)/*$'1*x?*3)9)(%&,)0),*z$tu*3)(*n)/*y*4,n*_*5')(%&*5)p(%&0)0* 1(,NU*5(30*)1*$4%&*$,N)#)*V)P(%&04,5),*H*B''5)/)(,-$''*Xu*Qu*".1(0(2SO 8 > : ;-< # 9 % > = " $ "#$%&'&() $ 5$%-//"" > = $ "#$%&'&() % 5$%-//" R = *5)P(%&0)0*N),*^)%$''*N."")'0*1.*&.%&*P()*N()*Y#89(1(., R >Wl *5)P(%&0)0*N()*V),$4(5F)(0*N."")'0*1.*&.%&*P()*N()*G#)--)#j4.0)W "#$%&'(%&)*+,-.#/$0(.,12)#$#3)(04,5*6*7,(2)#1(080*94*:;',*6*<(,0)#*=>?>@=>??
@/'28'()$" 58#4'9+ =>*G)/"'$0)1*P4#N),*(,*)(,)#*A.F4/),0),1$//'4,5*5)-4,N),W L1*P8#),*$3)#*".0),0()''*h>*G)/"'$0)1*5)P)1),W _.,*N),*=>*5)-4,N),),*1(,N*,4#*?l*F.##)F0W H*<()*&.%&*1(,N*YU*_U*X6Z$Tv <(#*1(,N*)(5),0'(%&*,4#*$,*F.##)F0),*G#)--)#,*(,0)#)11()#0U*P)('*P(#*5)#,)*)(,* ^)-)#),9%.#"41*$4-3$4),*P.''),W*<$1*1.''0),*P(#*04,v "#$%&'(%&)*+,-.#/$0(.,12)#$#3)(04,5*6*7,(2)#1(080*94*:;',*6*<(,0)#*=>?>@=>??
@/'28'()$" 58#4'9+ =>*G)/"'$0)1*P4#N),*(,*)(,)#*A.F4/),0),1$//'4,5*5)-4,N),W L1*P8#),*$3)#*".0),0()''*h>*G)/"'$0)1*5)P)1),W _.,*N),*=>*5)-4,N),),*1(,N*,4#*?l*F.##)F0W H*<()*&.%&*1(,N*YU*_U*X6Z$Tv <(#*1(,N*)(5),0'(%&*,4#*$,*F.##)F0),*G#)--)#,*(,0)#)11()#0U*P)('*P(#*5)#,)*)(,* ^)-)#),9%.#"41*$4-3$4),*P.''),W*<$1*1.''0),*P(#*04,v "#$%&'(%&)*+,-.#/$0(.,12)#$#3)(04,5*6*7,(2)#1(080*94*:;',*6*<(,0)#*=>?>@=>??
@UNV*(+&-$&B$"+"(+" G.F),(1()#4,5*@*G)E0*\.,(,5 d)e(f$'(1%&)*b,$'r1) L(5),,$/),)#F),,4,5 Y$#1(,5 :.#)-)#),9$4-';14,5 L#F),,4,5*N./8,),#)')2$,0)#*Z410)# G)/"'$0)67,(-(F$0(., Q4W*$W*,$%&*a)4/$,,U*=>>?S "#$%&'(%&)*+,-.#/$0(.,12)#$#3)(04,5*6*7,(2)#1(080*94*:;',*6*<(,0)#*=>?>@=>??
@UNV*(+&-$&B$"+"(+" 3$-+")*)+%8"40W03+,(0<$")"40 7,5)P.''0)*@*7,3#$4%&3$#)*)5/),0)*N)1*G)E0)1*P)#N),*),0-)#,0* M#()-F;"-)U*7,0)#1%&#(-0),U*d(0)#$04#$,5$3),U*<)#34,5U*)20'W*M('N)# 809)U*N()*4,(,0)#)11$,0*1(,N*P)#N),*)'(/(,()#0 H*P),(5)#*G)E0*94#*P)(0)#),*_)#$#3)(04,5* G)E0*P(#N*(,*1(,,2.'')*L(,&)(0),*$4-5)0)('0 +N),0(-(9()#4,5*2.,*t3)#1%&#(-0),U*Y$#$5#$"&),U*e'410)#*2.,*Y$#$5#$"&),U* G$3)''),U*V#$"&(F),U*A$04/16*4,N*\)(0$,5$3),U*B3FJ#94,5),U*<.#05#),9),U* $095#),9), "#$%&'(%&)*+,-.#/$0(.,12)#$#3)(04,5*6*7,(2)#1(080*94*:;',*6*<(,0)#*=>?>@=>??
@UNV*(+&-$&B$"+"(+" 3$-+")*)+%8"40W03+,(0<$")"40 Z)0&.N),O G.F),(1()#4,5*&84-(5*/(0*#)54'8#),*B41N#J%F), G)E0*\.,(,5*wZd6@[GZd6Y$#1)# H*A.F4/),0),64,N*0PW*N./8,),$3&8,5(5 d(10)*2.,*%&'j11)'p;#0)#,u*i0$0(10(1%&)1*y#.-('k*-j#*#)')2$,0)*809)*q9w*mw* 143D)F0(2)@.3D)F0(2)*809)S H*B3&8,5(5*2.,*N)#*LE0#$F0(.,1$4-5$3) "#$%&'(%&)*+,-.#/$0(.,12)#$#3)(04,5*6*7,(2)#1(080*94*:;',*6*<(,0)#*=>?>@=>??
@UNV*(+&-$&B$"+"(+" X+,)-'2)*:;+05"'2V*+ ^)%&01%&#)(3F.##)F04#* <.#0$#0),O*0$0(10(1%&)1*Y$#06.-6"))%&6G$55(,5 X')E(.,1-.#/O*9W*MW*5W*@*Y'W d)//$0(1()#4,5 "#$%&'(%&)*+,-.#/$0(.,12)#$#3)(04,5*6*7,(2)#1(080*94*:;',*6*<(,0)#*=>?>@=>??
@UNV*(+&-$&B$"+"(+" @)4+""'&+"+%-+""8"4 ")9()'')*B41N#J%F) Y)#1.,),6U*X(#/),,$/), F./"')E)*A$04/16*4,N*\)(0$,5$3), Z$T$41N#J%F) ")9(-(1%&)*G)#/(,.'.5() )&#*"#.N4F0(2*H*1")9()'')*L(5),,$/),'(10), V#$//$0(F),*94#*L#/(00'4,5*,(%&06')E(F$'(1%&)#*B41N#J%F) "#$%&'(%&)*+,-.#/$0(.,12)#$#3)(04,5*6*7,(2)#1(080*94*:;',*6*<(,0)#*=>?>@=>??
@UNV*(+&-$&B$"+"(+" L'%*)"4 Z)(10),1*F)(,)*2.''108,N(5)*1R,0$F0(1%&)*B,$'R1)*H* -'$%&)U*5#$//$0(1%&)*B,$'R1) 0$#F)*Z.N4'$#(1()#4,5*N)#*Y$#1(,56B4-5$3)O* )(,-$%&)*Y&#$1),*)#F),,), _)#'811'(%&)1*L#F),,),*F')(,)#*G)('10#4F04#),* G#),,4,5*(,*Y&#$1),*aYU*YYU*_Y "#$%&'(%&)*+,-.#/$0(.,12)#$#3)(04,5*6*7,(2)#1(080*94*:;',*6*<(,0)#*=>?>@=>??
@UNV*(+&-$&B$"+"(+" K$%+#+%+"='8#2O*8"40W0K$%+#+%+"='"'2V*+" >T=01,$&$,$"9 IM$#$%F*]3$/$KU*I]3$/$KU*IY#)1(N),0*]3$/$K*H*N()1)'3)*Y)#1., ;,1"1%").$#($&$,$"9 ^)-)#),9),*9P(1%&),*Y#.,./), ($&$,$"9$"#9D*67$"#U$*/")+1,$"#4"I#)"I$,$"#V"*+)"9$" IN()*X(#/$KU*IN)#*A)0#.(0)#*B40.&)#10)'')#K*4,N*IX.#NK "#$%&'(%&)*+,-.#/$0(.,12)#$#3)(04,5*6*7,(2)#1(080*94*:;',*6*<(,0)#*=>?>@=>??
@UNV*(+&-$&B$"+"(+" @%-+""8"407$&S"+"%+2+/'"(+%0.8*(+% A)-(,(0(.,*2.,*^)5)',U*N()*N()*0#4F04#*N)#*G)/"'$0)1*3)10(//), M$40*10$#F*$4-*2.#&)#(5),*:./".,),0),*$4- G)/"'$0)60#4F04#*(10*2.#&$,N),*H* A./8,),1")9(-(1%&)1*I$//)',K*2.,*G)/"'$0)6L(,0#85), M)9()&),*1(%&*/)(10*,4#*$4-*N()*+,-.#/$0(.,U*N()*(,,)#&$'3*)(,)1*$09)1*94* -(,N),*1(,N*H*L#5)3,(1*1(,N*"$#0()'')*G)/"'$0)(,10$,9), "#$%&'(%&)*+,-.#/$0(.,12)#$#3)(04,5*6*7,(2)#1(080*94*:;',*6*<(,0)#*=>?>@=>??
@UNV*(+&-$&B$"+"(+" 3+&B2'(+UY")#)-'()$" L(,*$09*3('N)0*,(%&0*$'')*+,-.#/$0(.,),*-J#*)(,)*+,10$,9*$3*H*J3)#*/)&#)#)* 809)*2)#0)('0W*H*G)/"'$0)1*/J11),*2)#)(,(50*P)#N), %&P()#(5)*B4-5$3)U*N()*(,*+L6R10)/),*.-0*N4#%&*7,(-(F$0(.,*5)';10*P(#NO* <),,*9P)(*G)/"'$0)1*(,*/(,N)10),1*)(,)/*B00#(340*(N),0(1%&)*+,-.#/$0(.,),* ),0&$'0),U*P(#N*N()*5)1$/0)*+,-.#/$0(.,*/(00)'1*7,(-(F$0(.,*2)#)(,(50W XJ#*N()*0R"F./"$0(3'),*B00#(340)*P(#N*9W*MW*J3)#"#J-0U*.3*:.#)-)#),9*3)10)&0U*.3*1()*1)/$,0(1%&*F./"$0(3)'*1(,N*Q2($W*A./8,),')E(F.,U*],0.'.5(),U* R,.,R/'(10),S*.N)#*.3*1()*(,*)(,)/*4314/"0(.,12)#&8'0,(1*10)&),W* H*)&#*$,P),N4,511")9(-(1%& "#$%&'(%&)*+,-.#/$0(.,12)#$#3)(04,5*6*7,(2)#1(080*94*:;',*6*<(,0)#*=>?>@=>??
@UNV*(+&-$&B$"+"(+" @)"=+2"+0D3+&B2'(+UJ58#4'9+" " T)%$I#>"++W#($61/"+1"#NT>O G)E0*/$#F()#),U*N)#*Y)#1.,),U*]#5$,(1$0(.,),U*d.F$0(.,),U*Y#.N4F0)* )0%W*3)9)(%&,)0 " 01,$&$,$"9#NJ1,$&$,$"6$O#NJXO#6*^)-)#),9(,-.#/$0(.,*/$#F()#), " G)/"'$0)*L')/),0*L#/(00'4,5*QGLS*6*L(5),1%&$-0),*2.,*aL1* " G)/"'$0)*^)'$0(.,*B4-5$3)*QG^S*6*M)9()&4,5),*9P(1%&),*a$/)N* L,0(0()1*Q9WMW*[B7YGGBAGx_]aS* " %),$#(.*G)/"'$0)*B4-5$3)*QGS*9WMW*q]+aGx_LaG7^L*QP)#*4,N*P$1* (10*3)0)('(50vS " VJ0)*&8,50*10$#F*2.,*N)#*%&P()#(5F)(0*N)#*B4-5$3)*$3W "#$%&'(%&)*+,-.#/$0(.,12)#$#3)(04,5*6*7,(2)#1(080*94*:;',*6*<(,0)#*=>?>@=>??
@UNV*(+&-$&B$"+"(+".'*:;)"+22+0X+%"/+%#';%+"0#Z%0@ XJ#*N./8,),1")9(-1(%&)*:./".,),0),*/411*)(,*BN$"0()#4,51/)%&$,(1/41* ),0P(%F)'0*P)#N),W \W*MW*_.,*LE")#0),*H*1)&#*$4-P8,N(5 A)1&$'3O*B40./$0(1()#0)*_)#-$&#),O B415)&),N*2.,*$,,.0()#0)#*G#$(,(,51/),5)*P)#N),*$40./$0(1%&*^)5)',* 94/*XJ''),*2.,*G)/"'$0)1*)#/(00)'0W G)/"'$0)(,10$,9),*P)#N),*2)#$''5)/)(,)#0U*1.*N$11*1()*$4%&*$4-*,(%&0$,,.0()#0)*A.F4/),0)*$,P),N3$#*1(,NW "#$%&'(%&)*+,-.#/$0(.,12)#$#3)(04,5*6*7,(2)#1(080*94*:;',*6*<(,0)#*=>?>@=>??
X)(+%'(8% Einführung Natural Language Processing for online applications: Text retrieval, extraction and categorization. Peter Jackson and Isabelle Moulinier. John Benjamins Publishing Company, 2002, 225 pp. Neumann, Günter (2001) Informationsextraktion. In Carstensen et al (eds): Computerlinguistik und Sprachtechnologie - Eine Einführung. Spektrum Akademischer Verlag, Heidelberg. PDF - 8 S. Appelt, Douglas & David Israel (1999) Introduction to Information Extraction Technology. Tutorial at the International Joint Conference on Artifi cial Intelligence (IJCAI-99), Stockholm. PDF - 41 S. "#$%&'(%&)*+,-.#/$0(.,12)#$#3)(04,5*6*7,(2)#1(080*94*:;',*6*<(,0)#*=>?>@=>??