Wednesday, October 6, 2010

Lite bättre sök

Sökfunktionen på kartsajterna (Restaurangkartan, Cafekartan etc) är sedan igår lite bättre på att hantera udda stavningar. Till exempel "Peter Dumplings" istället för "Peeters Dumpling".



En petitess kan tyckas. Men God is in the details. På kartsajterna jobbar jag mycket med de små men viktiga detaljerna just nu.



Nu ska det också tilläggas att en sökfunktion aldrig blir perfekt.

Se på Google. Googles stavningskontroll bygger på historiska sökningar. För att det ska funka behöver man stora mängder sökdata. Så det blir i de flesta fall ganska meningslöst att försöka bygga ett sånt system själv. En fantastisk grej, däremot, vore om Google kunde öppna ett API till sin stavningskontroll.



Nu ska det tilläggas att LIBRIS här i Sverige ganska nyligen släppte ett öppet rättstavnings-API. Du kan läsa om API:et på Opendata.se. Rättstavningarna baseras på sökningar i LIBRIS bibliotekskataloger.

Så här ser det ut om man frågar efter en rättstavning till "suhsi":



Ganska bra, eller hur? Väldigt bra jobbat, LIBRIS!

Jag skulle gissa att rättstavnings-API:et fungerar bäst för sådana sökningar som en bibliotekstjänst är mest van att hantera. Det vill säga, böcker, författare, akademiska termer, etc. Testa själv. :)

5 comments :

Jensplan said...

Jag har fler förslag till hur du kan förbättra sökresultatet.

Söker man på:
"Centralen Stockholm" får man inga platsträffar.

Söker man på:
"Centralstation Stockholm" får man samma dåliga träffar.

Men söker man på:
"Stockholm Central" får man dessa resultat:
eller menade du...
Stockholm Central Station
Stockholm Central Vasagatan, Stockholm
Stockholm Centralstation
Stockholm Centralstation, Stockholm

Alla dessa borde grupperas eftersom resultatet är olika ord för samma plats. Därefter bör detta presenteras vid samtliga av dessa tre sökningar.

David Vrensk said...

Google har väl ett stavnings-API? Jag har för mig att jag har sett det i kodexempel i böcker om webb-api-tjänster. En sökning returnerar det här: http://github.com/brandonaaron/jquery-spellcheck samt några andra sidor. Det är nog bara att tuta och köra!

Ted Valentin said...

Hej David!

Kanske är det där något gammalt? Jag hittar den här hos Google (http://code.google.com/intl/sv-SE/apis/soapsearch/reference.html) där det står "no longer available".

I Google code playground hittar jag ingenting om en spell checker.

http://code.google.com/apis/ajax/playground/

... om den fanns borde den ju rimligtvis finnnas där? Eller?

Hej!

Markus "LAKE" Berglund said...

Hej Ted!
Jag har en synpunkt om kart-sidorna, som kanske är lite of-topic, men jag hittade ingen annan lätt-tingänglig kontaktinfo till dig. (Finns det på kart-sidorna?)

Nåväl, jag hade i alla fall en synpunkt på de ungefär veckovis återkommande e-posten från Minkarta. Hur gör jag för att avanmäla mig från dem?

I dagsläget har jag bara "Få mail om nya funktioner och annan relevant info" ikryssad i "Mina inställningar". Och veckovisa e-post med "Tips på andra ställen som du kanske också gillar", tycker jag inte hör hemma i den kategorin.

Jag är gärna med i bidrar på sidan, men då vill jag själv kunna bestämma hur ofta och vilka e-post jag ska få därifrån...

Lev väl!

Jonathan said...

Häftigt att du fortfarande hittar saker att förbättrar. Vad är nästa steg? Du måste ju ha en lång lista över nya kartidéer? Hehe.