Video! On-the-fly zoeksuggesties: Levenshtein en Soundex in de praktijk nl

Door creator1988 op vrijdag 24 december 2010 10:59 - Reacties (14)
Categorie: -, Views: 4.191

Naar aanleiding van mijn eerdere post over Levenshtein, Soundex en Burkhard-Keller trees, ťn omdat een video meer zegt dan duizend woorden: een korte impressie van het resultaat. Volgende week ga ik wat dieper in op de onderliggende algorithmes, met voorbeeldcode etc.

Volgende: Intelligente suggesties, deel 1: Introductie en 'StartsWith' 12-'10 Intelligente suggesties, deel 1: Introductie en 'StartsWith'
Volgende: Going Solr! 12-'10 Going Solr!

Reacties



Door Tweakers user kipusoep, vrijdag 24 december 2010 11:43

Dit doet Google/Youtube toch ook al lang??


Door Tweakers user creator1988, vrijdag 24 december 2010 11:52

kipusoep schreef op vrijdag 24 december 2010 @ 11:43:
Dit doet Google/Youtube toch ook al lang??
Uiteraard. Helaas is mijn vriendelijke verzoek om van hun infrastructuur gebruik te maken voor deze functionaliteit nooit beantwoord.
Yay! :)

Door Jeroen Mulder, vrijdag 24 december 2010 11:54

Vooral met de grijze getallen er bij is het zeker indrukwekkend te noemen. Alleen het voorbeeld van specifiek adres laat je niet zien?

Door Tweakers user t.coenraad, vrijdag 24 december 2010 12:12

Geweldig, dit is ťcht nuttig :)


Door Tweakers user Devilly, vrijdag 24 december 2010 12:38

Ik kijk nu al uit naar je volgende post, want die moet volgens mij toch wel heel interessant worden! :)

[Reactie gewijzigd op vrijdag 24 december 2010 12:41]


Door Tweakers user Devilly, vrijdag 24 december 2010 12:38

Ik citeerde mijn eigen post in plaats van hem te bewerken. :+

[Reactie gewijzigd op vrijdag 24 december 2010 12:40]


Door Tweakers user ACM, vrijdag 24 december 2010 12:53

Voor de pricewatch heb ik destijds vergelijkbare functionaliteit gebouwd. En daardoor weet ik dat het inderdaad best lastig om goed te doen is. Al denk ik wel dat de namen van pricewatchproducten door de grote hoeveelheden leestekens e.d. nog wat lastiger zijn dan straatnamen/adressen.
Jouw voorbeelden zien er in ieder geval best goed uit :)

Door Tweakers user creator1988, vrijdag 24 december 2010 13:27

ACM schreef op vrijdag 24 december 2010 @ 12:53:
Voor de pricewatch heb ik destijds vergelijkbare functionaliteit gebouwd. En daardoor weet ik dat het inderdaad best lastig om goed te doen is. Al denk ik wel dat de namen van pricewatchproducten door de grote hoeveelheden leestekens e.d. nog wat lastiger zijn dan straatnamen/adressen.
Jouw voorbeelden zien er in ieder geval best goed uit :)
Wat je in de pricewatch niet hebt, maar hier wel is hierarchie. Bijvoorbeeld:

wibautstraat, noord-holland -> alle wibautstraten in noord-holland
kalf, zaanstreek -> de wijk het kalf in de regio zaanstreek
adriaen, utrecht, utrecht -> alles dat begint met adriaen en een parent utrecht, die ook een parent utrecht heeft. (bijv. plaats Utrecht ligt in provincie Utrecht).

Ook kan je bijvoorbeeld zeggen:

'Buurt Kalf' -> vind de buurt 't Kalf

Maar wat als je een buurt hebt die 'Buurt 42' heet?

Interpretatie van de zoekopdracht gaat dus verder dan alleen op naam, dat is best een uitdaging als je dat zowel snel als memoryefficiŽnt wilt doen. Daarnaast zijn sorteringen ook nog afhankelijk van het aantal woningen te koop in dat geografisch gebied (de grijze getallen). We gebruiken voor deze functionaliteit, inclusief de grijze getallen momenteel slechts 200 MB aan memory.

Door Timo, vrijdag 24 december 2010 16:34

Ziet er netjes uit Jan! Maar mag ik nog een suggestie geven?
Wat ik vaak mis in zoekvelden om mijn tijd nuttiger te besteden is een OF functie. Stel dat je een woning zoekt in de Veluwe ůf ergens in Rotterdam, lijkt het mij fijn om te zoeken op "Veluwe ; Rotterdam" zodat ik gemakkelijker kan vergelijken of sorteren op prijs.

Door Tweakers user postbus51, vrijdag 24 december 2010 19:14

Laan Europa ,, waarom wordt er geen europa laan aangeboden ?

[Reactie gewijzigd op vrijdag 24 december 2010 19:14]


Door Tweakers user creator1988, donderdag 30 december 2010 10:20

Timo schreef op vrijdag 24 december 2010 @ 16:34:
Ziet er netjes uit Jan! Maar mag ik nog een suggestie geven?
Wat ik vaak mis in zoekvelden om mijn tijd nuttiger te besteden is een OF functie. Stel dat je een woning zoekt in de Veluwe ůf ergens in Rotterdam, lijkt het mij fijn om te zoeken op "Veluwe ; Rotterdam" zodat ik gemakkelijker kan vergelijken of sorteren op prijs.
Ja, komt er wel in; maar alleen voor gebieden op hetzelfde geografisch niveau. Kan overigens al voor 'Uitgebreid zoeken'.
postbus51 schreef op vrijdag 24 december 2010 @ 19:14:
Laan Europa ,, waarom wordt er geen europa laan aangeboden ?
Omdat het 'Europalaan' is. We weten niet wanneer we een woord in tweeŽn moeten splitsen; wordt het Europal aan of Euro pallaan? Je kan niet alles indexeren want dat is te traag / gebruikt te veel memory.

Reageren is niet meer mogelijk