Forskningstips      ·     Diskussionsöversikt      ·     Sök      ·     Användarkonto
Arkivguiden   >   Arkivguidens Forum   >   Meddelanden   >   Äldre meddelanden   >  
'Underliga' tecken i sökresultat och rubriker
Sidans rubrik Föregående inlägg Nästa inlägg Skriv ett nytt inlägg  Direktlänk till detta inlägg (#post1081) - klicka och kopiera från webläsarens adressfält  Redigera detta inlägg  Av Jörgen Tollesson (Forumguide) - Tisdag den 07 oktober 2008 kl. 19.49
Alla som har använt snabbsökningarna för att få fram de senaste inläggen har säkert noterat dels att sökresultatets rader är olika långa, dels att vissa rader har 'underliga' tecken i slutet. Förklaringen till detta är följande:

Svenska bokstäver har hittills omvandlats till html-kod (det 'språk' som används för websidor) när texten sparats:

Å = Å
Ä = Ä
Ö = Ö

Kodens A och O är små om de kodade bokstäverna är små.

När koden läses av webläsaren, så visas de korrekta bokstäverna på sidan, oavsett webläsarens språk. Men...

Det är ju bara inledningen av inläggstexten som visas i sökresultaten när man söker efter de senaste inläggen, och det finns en gräns för hur många tecken som visas; i Arkivguidens Forum är det 40. Det är då tecknen i koden som räknas, inte de som syns på skärmen. Om då 40-gränsen kommer mitt i ä, så blir det ju ingen fullständig kod som kan omvandlas till en riktig bokstav, utan bara &au eller något sådant.

Att det är tecknen i koden som räknas betyder också att de synliga raderna blir olika långa. Koden för å är ju 7 tecken, och för ä och ö 6 tecken. Om det då finns till exempel ett å, ett ä och ett ö i början av ett inlägg, så lägger de alltså tillsammans beslag på 19 av de 40 tecknen som det finns plats för - men det är ju bara tre tecken (å, ä och ö) som syns på skärmen; till det kommer sedan ytterligare 21 (okodade) tecken, alltså sammanlagt 24 synliga tecken. Och med en annan fördelning på de svenska bokstäverna, så blir det en annan längd på raden. Det är alltså lite hipp som happ hur många bokstäver som visas i sökresultatet.

Av dessa båda skäl valde jag att ta bort html-kodningen av inläggstexten; moderna webläsare ska ju ändå kunna visa våra 'exotiska' bokstäver korrekt år 2008. Detta gjordes i natt; och därmed var de problemen ur världen. Men...

Då dök det upp ett annat problem i stället:

När bokstäverna html-kodas, så är det den koden som sparas. Men koden är ju avsedd att läsas av webläsaren; när man i stället ska öppna inlägget för att redigera det, så måste Discus (forumprogrammet) avkoda texten igen, så att det är de riktiga bokstäverna som visas i redigeringsrutan. Samma sak gäller också när inlägget skickas per epost som oformaterad text, inklusive rubrikerna. Men...

När jag spärrade html-koden för nya inlägg, så fanns det inte längre någon kodtabell som programmet kunde använda 'baklänges' vid avkodningen. Resultatet blev att rubriker som sedan tidigare fanns sparade som html dök upp i dagens epostinlägg som html i 'klartext', om man nu kan kalla det för det...

Då fanns det bara en sak att göra, nämligen att manuellt redigera rubrikerna som låg sparade med html-kod, och sedan spara dem på nytt utan html. Och då inte bara de som dök upp i eposten i dag, utan åtskilliga fler...

Skulle det ändå dyka upp någon mer rubrik med liknande abrakadbra i texten framöver, så är det bara en 'rest' som har missats; den korrigeras i så fall, så att den ser riktig ut i fortsättningen.

Däremot finns ju gamla inläggstexter (gjorda före html-stoppet) fortfarande sparade som html. Det kan därför fortfarande dyka upp stympade rader vid sökning efter de senaste inläggen, men det är ju ett problem som försvinner så småningom.

Av detta följer ett självklart tips till den som ska starta ett Discus-forum: Slå av html-kodningen redan från början! :)

PS!

Observera att det även när allt fungerar korrekt kommer att vara avklippta ord i slutet på sökresultatets rader; detta för att det klipps exakt vid 40 tecken, oavsett om det är mellan eller mitt i ord. Men då är det åtminstone riktiga bokstäver som står där...
Sidans rubrik Föregående inlägg Nästa inlägg Skriv ett nytt inlägg  Direktlänk till detta inlägg (#post1157) - klicka och kopiera från webläsarens adressfält  Redigera detta inlägg  Av Jörgen Tollesson (Forumguide) - Torsdag den 09 oktober 2008 kl. 11.08
Dessa 'hieroglyfer' kan tydligen dyka upp på fler ställen; registreringsformulär, användarprofiler, med mera. Den som upptäcker någon oläslig text får gärna höra av sig, så fixar jag det.
Om Arkivguidens Forum      ·     Forumregler      ·     Kontakt      ·     Upphovsrätt (©)