UTF8 adreses

Lietojot wikipediju, vienmēr meklēto vārdu rakstu uzreiz adresē (http://en.wikipedia.org/wiki/<vajadzīgais vārds>).

Līdzīgu pieeju mēģināju lietot arī latviešu wikipēdijā, bet secināju, ka vārdos ar latviešu diakritiskajiem simboliem tas nedarbojas. Piemēram, mēģinot atrast skaidrojumu vārdam “Māra”, atveras lapa “Mâra” (kur, protams, nekāda satura nav).

Kā noskaidroju, Firefox lietotāji to var labot ar slēdža Network.standard-url.encode-utf8 palīdzību. Uzstādot šo slēdzi uz “true”, Firefox sāk darboties atbilstoši RFC 3987 un visi nestandarta burti tiek kodēti ar URLencode.

Tas gan man nedarīja saprotamu, kāpēc pirmajā gadījumā teksts nokodējās uz
http://lv.wikipedia.org/wiki/M%C3%A2ra (Mâra)
bet otrajā uz
http://lv.wikipedia.org/wiki/M%C4%81ra (Māra)

Upd: Izskatās, ka šeit aprakstītā problēma nepastāv citos datoros kā tikai man mājās pieejamajos.

6 thoughts on “UTF8 adreses”

  1. Nezinu, man ar pirmo reizi aiziet tur, kur Tu kāroji. Man ir noklusētās vērtības – network.standard-url.encode-utf8=false, network.standard-url.escape-utf8=true. Normāli eskeipo un atver.

    Visticamāk, ka Tu nejauši esi input-ojis simbolu ‘â’, jo iekš UTF-8 ‘â’ ir U+00E2 (%C3%A2) un ‘ā’ ir U+0101 (%C4%81), tā kā nekādas maģijas tur nav.

  2. Jep, man arī ar defaultajām vērtībām viss kodējas pareizi uz utf8.

    Kā arī Firefoxī var vēl ātrāk meklēt – izveido bookmarku uz adresi http://lv.wikipedia.org/wiki/%s un pie keywords norādi burtus wp. Tagad vari urlī rakstīt “wp Māra” (bez pēdiņām) un atvērsies pareizā lapa. Šo var darīt arī ar jekburu citu meklētāju, piemēram, gūgli.

Comments are closed.