U10: Anmerkungen zur Uebung10


[ Follow Ups ] [ Post Followup ] [ IS-K Diskussionsforum ]

Posted by Michael Mlivoncic on February 08, 2001 at 11:37:11:

Hallo!
Diese Anmerkungen sind besonders
fuer diejenigen gedacht, die bereits am Montag
in der Uebung waren. Denen, die am Freitag kommen,
kann ich es ja dann auch noch sagen.

Noch ein paar Anmerkungen bzgl. der Uebung 10.
1.) Auf Folie "Teil4-40" der Vorlesung steht zum Thema
"Dimensionsreduktion":
"... und sortieren der Reihenfolge der Koordinatenachsen
absteigend..."
Wie bereits am Montag in der Uebung erwaehnt, ist
dieser Schritt nicht zwingend erforderlich. Es genuegt,
die entsprechenden Zeilen bzw. Spalten der drei Matrizen
zu streichen, die den kleinsten Singulaerwerten, die man
eliminieren moechte entsprechen.

2.) Ueb10, A3b): Im Pseudo-Code muesste man korrekter
Weise noch die Terme betrachten, die _nicht_ im
einzufuegenden Dokument vorkommen. Da sich ja "N"
(die Anzahl der Dokumente der Kollektion) geaendert
hat, aendert sich der "idf"-Wert jedes Terms.
Wie das genau geht, kann sich jeder selbst ueberlegen.
Der einfachste "fix" waere wohl, einfach die Fallunterscheidung
in der "foreach"-Schleife so zu lassen.
(wobei man die Berechnung der idf-Werte auch jeweils auslassen kann...)
Am Ende sollte man die idf-Werte aller Terme komplett
aktualisieren:
EXEC SQL UPDATE Terme SET idf = log(10, (:N + 1)/(df + 1) ) ;
[wobei log(10,x) der Logarithmus zur Basis 10 ist.]
Die Berechnung wird so sogar server-seitig ausgefuehrt...

3.) ...weitere offene Punkte sind mir momentan nicht bekannt :)

Viele Gruesse,
Michael



Follow Ups:



Post a Followup

Name:
E-Mail:

Subject:

Comments:

Optional Link URL:
Link Title:
Optional Image URL:


[ Follow Ups ] [ Post Followup ] [ IS-K Diskussionsforum ]
!!! Dieses Dokument stammt aus dem ETH Web-Archiv und wird nicht mehr gepflegt !!!
!!! This document is stored in the ETH Web archive and is no longer maintained !!!