Posts RSS Comments RSS

Wikia Search is out

Wikia search
La 1 Octombrie anuntam aici ca fondatorul Wikipedia are in plan un motor de cautare cu features’urile de aici. Dupa cateva luni de dezvoltare si testare in mod privat, versiunea alfa este facuta public la aceasta adresa in 7 Decembrie 2008.
Dupa ce au fost anuntate ambitiile marete de a concura cu google si yahoo, apar primele dezamagiri:

Inca nu am testat destul incat sa-mi fac o parere, dar pot sa va spun ca deocamdata nu am intalnit nimic special. Totusi, Wiki Search vrea sa fie un motor de cautare open source, in care toata lumea poate contribui la rezultatul final. Ascesta e un proces lent de obicei, dar e ca o avalansa. Odata pornit e foarte greu de oprit.

Wikia Search is socially correct, with people weeding out the ranks and the results filtered by the masses. I don’t see how that can be acceptable in the enterprise space.(Ken Poore, senior analyst la Forrester Research)

O sa vedem daca asta va fi un avantaj sau un dezavantaj.


Reactii:

Rezumatul celor mai mari tampenii din business - partea 1

Un rezumat al 101 Dumbest Moments in Business, top realizat de CNNMoney.com, ca sa nu pierdeti vremea pana le rasfoiti pe toate, am facut eu o lista cu cele mai “spumoase” gafe din business. Ordinea lor este aleatoare.

  • Universal Tube & Rollform Equipment da in judecata YouTube.com sub pretextul ca serverele pe care se afla site-ul lor, Utube.com, sunt blocate in urma traficului urias generat de cei care incurca cele doua adrese. Astfel vanzatorii de tevi si “tub”-uri au avut un numar de 68 milioane de vizualizari din partea celor care au scris utube.com in loc de youtube.com. YouTube este cumparat intre timp de Google, deci are cine sa plateasca eventualele amenzi.
  • Si pentru ca google e mare si tare, statisticile realizate de VisitorVille arata ca 2 din 3 angajati Microsoft folosesc Google ca motor de cautare, in loc de MSN. Si mai tare ar fi sa aflam ca acestia folosesc MAC-uri cu OS2 in loc de PC-uri cu Windows.
  • Ca sa taie putin avantul celui mai tare motor de cautare, “school district of Catawba County, N.C.” (asta ar veni echivalentul unui inspectorat scolar din Carolina de Nord, presupun), obtine ordin judecatoresc prin care Google e obligat sa NU! indexeze paginile care contin numele elevilor, notele la teste si alte date confidentiale. Motivul invocat este ca datele nu trebuie sa fie facute publice si paginile sunt protejate de parole. Duuh! Si cum ar putea crawler-ul Google sa indexeze paginile daca-s “parolate”? Oricum, important e ca au obtinut ordinul judecatoresc si Google a fost obligat sa stearga presupusele pagini.
  • Tot ca sa faca Internetul un loc mai bun, compania TextTrust cauta greseli de scriere in textele a peste 16 milioane de pagini web, dar omit greselile in comunicatul lor de presa: “on the 16 million we pages it has spell-checked over the past year”
  • BBC invita la interviu un expert in IT ca sa vorbeasca despre iTunes de la Apple, dar in locul lui in studio este adusa o alta persoana, un tehnician venit pentru un interviu de angajare. Omul se descurca binisor la intrebarile reporterului, dar nu este angajat in urma interviului pentru postul de munca. Pacat, o sa ramana memorabila fraza lui: oriunde mergi o sa vezi oameni care downloadeaza de pe internet si de pe site-uri orice vor ei. Puteti gasi interviul pe youtube.
  • BusinessWeek “il scoleaza” pe Bill Gates invatandul ca nu e bine sa-ti copiezi competitorii, publicand o editie cu o coperta pe care era ilustrat CEO’ul Microsoft scos la tabla, avand titlul : “Bill Gates gets schooled”. Revista a fost “scolata” pe urma de cititori care i-au atras atentia ca in urma cu un an publicase o editie cu acelasi titlu si o coperta asemanatoare.
  • Si pentru ca Microsoft stie ca nu e bine sa-ti copiezi competitia, incepe sa-i copieze pe cei din compania lor. La scurt timp dupa lansarea Windows Live Search, un serviciu adresat publicului pentru cautarea pe web, lanseaza Windows Live Search business-oriented, pentru cautarea in intranet-ul marilor corporatii. Cele doua produse nu au nimic in comun inafara de nume.
  • Iesim din zona Google, Microsoft si Bill Gates, dar ramanem pe internet.E la moda web2.0, e la moda sa-ti concediezi angajatii prin e-mail. RadioShack concediaza 400 de angajati trimitand un e-mail fiecaruia prin care ii anunta ca pozitia lor se afla printre cele eliminate. Asta da departament de Human Resources!
  • Uite iPodul, nu e iPodul. National Semiconductor premiaza fiecare angajat cu cate un iPod de 30 gigabytes. In urmatoarea luna concediaza 35, carora le cere sa inapoieze iPodurle primite CADOU! Hei, macar nu i-au concediat prin e-mail!
  • Nu stiu ce au facut angajatii de la RadioShack sau National Semiconductor de au trebuit concediati, dar stiu ca as concedia pe loc angajatii unei centrale nucleare din Philippsburg. Acestia au pierdut cheile celei mai securizate zone din centrala iar dupa cateva luni de cautari compania anunta ca trebuie schimbate incuietorile.

In postul urmator o sa gasiti alte gafe la fel de socante.

Don’t rely on Google!

Am ajuns la concluzia ca Google e atat de imprevizibil incat pur si simplu nu te poti baza pe el. Vorbesc din punctul de vedere al webmasterilor. Cum am ajuns la concluzia asta? In urma unui fenomen ciudat care nu am reusit inca sa mi-l explic. Sa va povestesc exact despre ce este vorba. In primavara anului acesta am lansat site-ul www.licitatie-porumbei.ro, un site despre care am mai povestit si in alte posturi si care se adreseaza crescatorilor de porumbei care doresc sa vanda sau sa cumpere porumbei. Cuvintele cheie care ne-ar aduce vizitatorii agreati de noi ar fi: porumbei, licitatie porumbei, vanzare sau cumparare porumbei. Am reusit sa castigam niste pozitii destul de bune pe google pentru cuvintele alese, dar pentru unele era clar ca nu o sa putem fi primii. Nici nu mi-am propus primele locuri cel putin pentru o perioada, deoarece pe piata existau deja site-uri cu vechime care se adresau columbofililor si care aveau un continut bogat si de calitate. Unul dintre site-urile acestea e www.porumbei.ro, un blog foarte vizitat, cu articole noi postate aproape zilnic. Pentru ca vizitatorii acestui site se incadreaza in publicul tinta a site-ului de licitatii am ales sa ne facem publicitate aici, avand avantajul unui link de calitate dinspre acest site. La cautarea cuvintului “porumbei” pe google, site’ul www.porumbei.ro se pozitiona intotdeauna primul, fiind cel mai cunoscut site despre porumbei din Romania. De curand (cam de o saptamana incoace), in urma cautarii cuvantului porumbei, din prima pozitie acest site se claseaza undeva sub pozitia 15. Explicatie? N-am. Vizitez acest site destul de des, pentru ca citesc uneori articolele mai interesante si pot sa zic ca practic site-ul a functionat ca si inainte. Au fost adaugate articole noi (referitoare la porumbei, boli ale acestora etc…) fara modificari la design, linkuri, cod etc. Nu am observat nici o schimbare care ar putea avea efectul unei pozitionari atat de nefavorabile. Lucruri ciudate: PR’ul (page rank) a ramas 3, la cautarea dupa cuvintele “porumbei.ro” chiar si blogul meu e pozitionat inaintea acestui site (?).
Care au fost urmarile acestui fenomen? In primul rand toate site-urile care erau afisate pentru cuvantul “porumbei” au urcat o pozitie. Astfel www.Licitatie-Porumbei.ro a ajuns pe pozitia a doua si lucrul acesta s-a simtit in traficul inregistrat. Am avut cam cu 100~150 de vizitatori/zi mai multi de pe google decat de obicei. Intr-un fel acest lucru ar trebui sa ma bucure, dar raman rezervat atata timp cat nu am o explicatie pentru ce se intampla. Ma gandesc ca oricand poate fi si site-ul meu o “victima”. Sunt sigur ca pana la urma se va rezolva situatia si www.porumbei.ro va reveni printre primele pozitii in viitorul apropiat. Oricum, pentru acest site nu e o pierdere foarte mare deoarece majoritatea vizitatorilor sunt fideli si revin constant cu sau fara ajutorul google. In traficul zilnic nu am observat schimbari importante. Asta e motivul pentru care dau sfatul asta: Nu va bazati pe Google! Oricand se poate intampla un fenomen ca cel de mai sus, desi probabilitatea e mica (oarecum…). Dar sa nu uitati sa luati in considerare si asta: oricand poate veni unul mai bun din urma ~ doi mai buni ~ trei mai buni sa te devanseze. Cel mai bine e sa fidelizezi vizitatorii, sa-ti “brand-uiesti” denumirea site-ului, astfel incat publicul tau sa-si aminteasca de site si sa poata intra direct, fara ajutorul motoarelor de cautare. Pentru a gasi vizitatori noi, cauta site-uri din aceeasi categorie cu al tau si incearca sa contactezi proprietarii, poate sunt de acord sa-ti faca reclama site-ului (sau poate chiar sunt interesati de un schimb de linkuri).


Exemplul de mai sus nu e un caz izolat. Un caz foarte cunoscut este cel al lui John Chow, un caz care cu toate ca multa lume “da cu presupusul”, inca a ramas ne-explicat.

Searching for that special character

Tudor thinks that searching for special characters (like: ` ~ ! @ # $ % ^ ( ) - = + { } [ ] | \ : ; ” etc) on Google, generates a weird behavior. Others try to explain why that happens, in the comments area. I had no clue about what is this about, so I’ve googled for: “google about special characters” and found some other people that try to explain that ‘weird behavior’:
Google Special Character Search String Bug
How to search for special characters
I’ve tried other search engines and they all returned no content, but at least they suggested trying other keywords (or search for help elsewhere, like Yahoo! Answers ). My opinion is that Google tried to simplify the algorithm as much as possible but disregarded some minor negative effects on some sensible users.


Because I had a lack of inspiration lately, instead of posting my little research on Tudor’s blog as a comment, I’ve posted this as an article in my own blog. But there is a possibility that, because I’ve put a link to his post, this one will be shown as a trackback, therefore as a comment. Because I want to respect Tudor’s requirement, I had to write this in English.

Cum ar arata netul fara Google?

V-ati gandit vreodata cum ar arata internetul fara motoarele de cautare actuale? Cum ar fi sa ai nevoie de documentatie pentru o functie dintr-un limbaj de programare (aleator ales) si sa nu ai avantajul unui motor de cautare? Cum ai gasi atunci ceea ce ai cauta?
Aici fiecare poate face un mic exercitiu. Unii s-ar gandi ca ar intra pe o pagina anume, dupa care ar urmari linkurile in functie de categoria din care fac parte (un fel de directoare pe categorii). Ar dura cam mult o astfel de cautare “manuala” si cu siguranta nu s-ar gasi toate raspunsurile. Altii s-ar gandi ca fiecare ar avea o lista/baza de date proprie, un fel de bookmarks la care ar face update constant (cum gasesti ceva nou, hop, in lista) si de asemenea, organizate in categorii. Am face schimburi intre noi de CD-uri cu adrese de site’uri. Dar dezavantajele ar fi foarte mari: multe site-uri isi vor schimba continutul iar multi nu vor schimba arhiva personala de linkuri, si atunci vei gasi total altceva pe site. Multi ar “dona” CD-uri cu sacul, doar sa faca reclama la site’urile lor. O afacere s-ar naste din asta.
In functie de imaginatia fiecaruia, ne putem gandi la posibilitati care mai de care mai pesimista, cu dezavantaje si probleme.
Dar eu in principiu sunt un om optimist dar intr-un fel mai ciudat. Eu ma gandesc ca totusi, nevoia de cautare a informatiei intr-un timp scurt, cu eforturi minime si rezultate optime, ar naste solutii comparabile cu cele de acum. Iar optimismul ala ciudat de care ziceam m-ar impinge un pic mai mult si ma face sa ma gandesc ca am avea solutii chiar mai performante decat cele prezente. (Acum o sa trisez un pic, o sa ma gandesc tot la un motor de cautare, dar putin diferit.) Ganditi-va putin la un search engine la care primele 2~3 rezultate ar fi exact ceea ce cauti. Un motor care ar cauta semantica, ideile a ceea ce doresti, nu doar keywords’urile care ar trebui sa se afle intr-un anumit context si aliniate cu planetele la solstitiul de vara dintr-un an bisect. Adica da, pna la urma sunt cuvintele pe care le cauti. Dar de asemenea sunt cuvintele de pe site-uri cu page ranking mare (adica e o companie care-si permite sa plateasca bani multi pentru linkuri valoroase), cuvintele care apar foarte mult pe pagina din rezultat, dar cuvinte care deseori nu au legatura cu “ideea” pe care o cauti.
Wikia Inc, fondatorul Wikipedia are in plan un astfel de motor. Sa speram ca va fi ceea ce promite, cu features’urile de aici si “gustul banului” nu va interveni in procesul de dezvoltare. Stiti voi, vorba celor de la google: Don’t be evil (unless you can make money!).