Open Grid

Meta utopia

Metadane, czyli nasze "dane o danych" to informacje takie jak słowa kluczowe, długość strony, ilość słów, abstrakt, lokalizacja, SKU, ISBN itd.

Typowy scenariusz opiera się o uzgodnienie przez kilka organizacji wspólnego standardu metadanych, czyli Definicja Typu Dokumentu (DTD) lub XSD - dla danego zakresu tematycznego. Mogą to być na przykład. pralki. Zostaje ustalony wspólny słownik dla opisywania pralek: wielkość, pojemność, pobór energii, pobór wody, cena. Zostają utworzone odpowiednie bazy danych zasobów, które następnie są udostępnione w całości lub części robotom różnego rodzaju wyszukiwarek i innym bazom danych, tak by potencjalny klient mógł określić parametry pralki, której poszukuje i odpytać wiele różnych źródeł informacji jednocześnie by uzyskać obszerną listę dostępnych pralek, które spełniają kryteria wyszukiwania.

Jeżeli każdy by dołączył do takiego systemu i stworzył dobre metadane dla celów opisywania swoich dóbr, usług i informacji, byłoby wtedy zadaniem trywialnym przeszukiwać sieć w celu uzyskania wysokiej jakości, zbieżnych kontekstowo wyników. To znaczyłoby, że fani mogliby odnaleźć bez problemu muzykę ulubionego gatunku, producent mógłby bez problemu odszukać dostawców, podróżnicy mogliby łatwo zarezerwować najlepszy hotel.

Niestety świat obszernych, godnych zaufania metadanych jest utopią. Jest marzeniem opartym na złudzeniach podsycanych przez teoretyków i rynek.

Jest przynajmniej pięć przeszkód pomiędzy światem jaki znamy, a meta-utopią. Oto one:

Ludzie kłamią

Poszukiwanie dosyć popularnego słowa w większości wyszukiwarek zazwyczaj kończy się natrafianiem na np. treści erotyczne w pierwszych wynikach wyszukiwania.
Skrzynki pocztowe są pełne niechcianej poczty z tematami np. "Odp. Informacje o której prosiłeś"
Wydawnictwa rozsyłają reklamy w stylu "Wygrałeś sto tysięcy złotych!"
Wiele publikacji jest wypełniona dodatkowymi brzęczydłami, aby przyciągnąć czytelników.
Meta-utopia jest światem godnych zaufania metadanych. Niestety rzeczywistość pokazuje jak Internet jest zaśmiecony.

Ludzie są leniwi

Wszyscy jesteśmy bardzo mocno zaangażowani w tworzenie niepoprawnej informacji. Przesyłamy sobie emaile bez tematu, większość stron internetowych nie ma tytułu, a pliki na naszych komputerach są często nazywane "beznazwy.doc".
Lenistwo nie ma końca. Nie ważne jak bardzo systemy staną się łatwe w użyciu i tak jego efekty będą takie same.

Ludzie nie są wykształceni

Nawet jeżeli istnieje dużo pozytywnych aspektów tworzenia dobrych metadanych, ludzie nie będą dbać o ich jakość. Wystarczy wpisać w dowolnej wyszukiwarce internetowej słowo lub frazę z błędem ortograficznym, a i tak otrzymamy setki trafień pasujących do tego błędnego wzorca.

Ludzie nie znają siebie

W meta utopii każdy dokładnie mierzy, sprawdza i obserwuje, dzięki czemu jest w stanie określić poprawne atrybuty obiektów i zapisać otrzymane rezultaty.
Prosta obserwacja ukazuje słabość tego założenia. Gdy zechcemy, aby użytkownicy Internetu notowali dla celów statystycznych jakie strony odwiedzają i w jakim celu, będzie się to znacząco różnić od rzeczywistych danych zapisanych w historii przeglądarki.
Doświadczenia marketingowe pokazują, że mimo ogólnej nienawiści do zjawiska wyskakujących okienek z reklamami, jest to wciąż najskuteczniejsza forma dotarcia do odbiorcy.
Pytanie programisty jak długo zajmie napisanie modułu aplikacji lub dostawcy jak długo będzie trwała dostawa, można śmiało porównać do rzucania rzutkami do tarczy. Otrzymane wyniki będą miały podobny poziom zaufania.

Schematy nie są neutralne

W meta-utopii, informacje mają jednakową spójną hierarchię.
W rzeczywistości nie ma dwóch osób, które stworzyłyby jednakową hierarchę dla katalogu stron internetowych. Wystarczy spojrzeć na dowolny katalog tematyczny, by zauważyć, że w każdym z nich jest inna hierarchia i często przeglądając taki katalog musimy wycofywać się z wybranych tematów, gdyż inaczej postrzegamy hierarchię danego tematu, niż autorzy katalogu. Co w efekcie często powoduje bezużyteczność katalogu, gdyż nie znajdujemy informacji zgodnie z intencją Twórcy.

Dodano 19 december 2005 o 10:58:48 w kategorii Science, Techblog

Comments to "Meta utopia":

1 | MiMaS

14 february 2006, 07:17:31

favicon

Skoro ludzie są tak nieudolni w tworzeniu metadanych to jakim cudem istnieją np. biblioteki?

A poza tym - popatrz na metadane jak na ontologie w Sieci Semantycznej - odpada problem jednakowej hierarchii i dochodzi (no, dojdzie niedługo) zapewnienie zaufania do danych i źródeł.

Zresztą nawiasem mówiąc dokumenty RDF nie mają DTD właśnie dlatego, żeby nie wpadać w taką utopię....

2 | MiMaS

14 february 2006, 08:56:04

favicon

Czy tu jest jakiś trackback? Nie widzę...

anyway: http://mimas.ceti.pl/tarpit/archiwum/metautopia

3 | DrLex

14 february 2006, 10:39:56

- Bibliotekarzem nie może zostać każdy.
- Bibliotekarz specjalizuje się w jednej klasie metadanych
- Bibliotekarz nie kieruje się innymi motywami niż ułatwienie sobie pracy przy wyszukiwaniu książek.

Co do zaufania, to już mam przed oczami sprzedawanie certyfikatów na metadane :)

Swoją drogą, czekam na praktyczne rezultaty nowego podejścia.

Add comment

Textile Lite włączony ( available tags ): *strong* | **bold** | _em_ | __italic__ | "link":http:// | bq. cytat.
code