Användardiskussion:Lsjbot/Projekt alla platser/Arkiv 2015
Projektbeskrivning
[redigera wikitext]Jag håller på att utveckla ett nytt botprojekt, den här gången för att skapa artiklar om geografiska platser. Svenska Wikipedia har idag mycket ojämn täckning av geografin i olika delar av världen. Vi har näst intill fullständig täckning av Sveriges geografi, hygglig täckning i Europa och Nordamerika, men betydligt sämre i andra världsdelar. Till och med bland storstäder är täckningen dålig -- se t.ex. alla rödlänkar i Lista över världens största städer efter land. Den här snedfördelningen vill jag jämna ut, genom att robotskapa artiklar om alla världens städer, berg, sjöar, och andra geografiska platser.
Den huvudkälla jag vill använda är GeoNames, en öppen geografisk databas som täcker hela världen. GeoNames innehåller kring 10 miljoner poster, varav kanske hälften är tillräckligt fullständiga och relevanta för att göra Wikipediaartiklar. En lista med vilka platstyper som finns i GeoNames, och vilka jag har klassat som relevanta, finns här: Användare:Lsjbot/Projekt alla platser/platstyper.
Grundidén är densamma som i mitt tidigare projekt "Alla arter": Utifrån en heltäckande databas, skapa artiklar med basal information om alla relevanta artikelämnen inom ett område. Artiklarna får en kort brödtext och en infobox, och förses om möjligt med lämpliga bilder. Alla artiklar länkas och kategoriseras och källor anges. Kategoriseringen görs så att den passar in i befintligt kategoriträd för geografi, med korrigeringar av inkonsekvenser i det trädet.
Dock görs inte allt likadant som med arterna. Dels är geografi något annat än biologi, och dels har jag lärt mig en del utifrån de svårigheter som tillstötte i artprojektet. Framförallt hanteras särskiljning och dubletter på ett helt annat sätt, och wikidata kopplas nu in vilket inte gjordes för arterna.
Saker som görs annorlunda:
- Brödtext som inte bara upprepar infoboxen:
- Skriver om terrängen kring platsen (platt, kuperad, bergig ...) utifrån tillgängliga höjduppgifter.
- Hur tätbefolkad är trakten kring platsen?
- Skriver om relationen till andra platser:
- Vad är närmaste större samhälle, och åt vilket håll ligger det?
- Hur långt från huvudstaden ligger platsen, och åt vilket håll?
- Vad är högsta punkten i närheten, och åt vilket håll ligger den?
- Vad finns det mycket av i närheten? Många berg, många sjöar, ...?
- Särskiljning och grensidor:
- Detta är ett mycket större problem för platser än för arter, finns ofta många platser med samma namn.
- Kör igenom hela namnlistan i förväg, och skapar en lista med namnkonflikter.
- Kolla mot Wikidata om det redan finns en artikel.
- Skapa också i förväg särskiljningsled för alla platser som behöver det.
- Om platserna är av olika typ används typen som särskiljning.
- Om de är av samma typ men i olika land används landsnamnet,
- ... annars provinsnamnet eller motsvarande,
- ... och till sist latitud och longitud om inget annat särskiljer.
- Utifrån listan med namnkonflikter, skapas behövliga grensidor, med positionskartor.
- Exempel som visar både hur grensidor blir och hur särskiljningsleden ser ut:
- Koppling till Wikidata:
- Identifierar matchande wikidata-objekt, om det finns.
- Tar interwiki från wikidata.
- Kontrollerar mot wikidata för att undvika dublettskapande.
- Lägger in vissa faktauppgifter som wikidata-anrop i artiklarna.
Från Bybrunnen
[redigera wikitext]- Introducerande och fortsatt diskussion från Wikipedia:Bybrunnen#Nytt botprojekt: Världens geografi. --MagnusA 16 juli 2015 kl. 14.15 (CEST)
Jag håller på att utveckla ett nytt botprojekt, den här gången för att skapa artiklar om geografiska platser. Svenska Wikipedia har idag mycket ojämn täckning av geografin i olika delar av världen. Vi har näst intill fullständig täckning av Sveriges geografi, hygglig täckning i Europa och Nordamerika, men betydligt sämre i andra världsdelar – se kartan här bredvid. Till och med bland storstäder är täckningen dålig -- se t.ex. alla rödlänkar i Lista över världens största städer efter land. Den här snedfördelningen vill jag jämna ut, genom att robotskapa artiklar om alla världens städer, berg, sjöar, och andra geografiska platser.
Grundidén är densamma som i mitt tidigare projekt "Alla arter": Utifrån en heltäckande databas, skapa artiklar med basal information om alla relevanta artikelämnen inom ett område. Artiklarna får en kort brödtext och en infobox, och förses om möjligt med lämpliga bilder. Alla artiklar länkas och kategoriseras, och källa anges. Dock görs inte allt likadant som med arterna. Dels är geografi något annat än biologi, och dels har jag lärt mig en del utifrån de svårigheter som tillstötte i artprojektet. Framförallt hanteras särskiljning och dubletter på ett helt annat sätt, och wikidata kopplas nu in vilket inte gjordes för arterna.
Den huvudkälla jag vill använda är GeoNames, en öppen geografisk databas som täcker hela världen.
Saker som görs annorlunda jämfört med artprojektet:
- Mer brödtext som inte bara upprepar infoboxen.
- Namnkonflikter, särskiljning och grensidor hanteras systematiskt.
- Kopplingar till Wikidata används.
Några exempel från provkörningar:
- Användare:Lsjbot/geotest/Thākurgaon
- Användare:Lsjbot/geotest/Zarghūn Shahr (samhälle)
- Användare:Lsjbot/geotest/Zemio
- Användare:Lsjbot/geotest/Zourma
- Exempel på komplex grensida (cebwp).
Mer detaljer om projektet finns på Användardiskussion:Lsjbot/Projekt alla platser. Där tycker jag också är rätt plats för diskussioner om detaljerna.
Här på Bybrunnen vill jag ställa frågan: Finns det konsensus för att genomföra det här projektet på svwp, och få global täckning av världens geografi?
Lsj (diskussion) 13 juni 2015 kl. 15.35 (CEST)
- Jag läste igenom din beskrivning här och på projektsidan, och tycker att målet är ytterst lovvärt! Platsdata är ju ett av de första botprojekten på Wikipedia och det lockade många nykomlingar. Ett stort plus för att du lärt dig av förra gången. En fråga är om det där med longitud/latitud-särskiljning. Det har jag inte sett tidigare. Jag förstår att det är i sista hand, men är det en särskiljning vi behöver diskutera eller är det den enda logiska? En annan fråga är databasens tillförlitlighet. Det står inte mycket om dess tillkomst på geonames.org. Jag gissar att du gått igenom för att kolla några av posterna som du även har information om från andra håll. Förutsatt att du kör enligt tidigare diskussioner (och det är jag övertygad om) så stöder jag projektet till fullo. Låt oss denna gång också göra något mediarelaterat med det här :-) //Hannibal (diskussion) 13 juni 2015 kl. 16.10 (CEST)
- Beträffande databasens tillkomst så finns här en lista med de källor som använts. Huvudkälla är NGA GEOnet Names Server. Jag har också kollat de provkörda artiklarna, främst genom att klicka på koordinatlänken och se att uppgifterna stämmer med den karta som kommer upp. Beträffande särskiljning med latitud/longitud, så finns i grensideexemplet ovan två samhällen (nr 6 och 7 i Italien) där lat/long är enda tillgängliga särskiljande information. Lsj (diskussion) 13 juni 2015 kl. 16.32 (CEST)
- Den sidan missade jag. Jag sökte inte så noga, så tack.
- Det står att det rör sig om ca 5 miljoner poster som kan tänkas vara relevanta. Vid närmare inspektion ställer jag mig lite frågande till vissa av de platstyper som du markerat som relevanta, till exempel:
- vadställe (a shallow part of a stream which can be crossed on foot or by land vehicle)
- spricka (a crack associated with volcanism)
- gap (a low place in a ridge, not used for transportation)
- kulle (a rounded elevation of limited extent rising above the surrounding land with local relief of less than 300m)
- Det kan hända att jag, som inte brukar skriva om platser, tar fel här, men jag ville bara dryfta frågan. Annars är jag en beundrare för såna här projekt.//Hannibal (diskussion) 13 juni 2015 kl. 16.47 (CEST)
- Jag är i princip positiv, speciellt med så lovande provkörningar. Hannibals frågor om relevans behöver dock utredas. Min stora önskan är dock att det i denna stora botkörning läggs uppgifter på Wikidata först, som sedan hämtas in med en uppdaterad Geobox-mall (jag hjälper gärna till att fixa den). Att strunta i hur långt Wikidata har kommit sedan den förra stora botkörningen skulle kännas tråkigt (men för min del är det inte en "blocker", om arbetet genomförs lokalt på svwp innebär det ändå en enorm breddning av ämnena här och en lovvärd insats). ♥Ainali diskussionbidrag 13 juni 2015 kl. 16.56 (CEST)
- Jag ställer mig efter erfarenheterna av de botskapade djurartiklarna tyvärr mycket skeptiskt till fortsatta botprojekt i så väldigt stor skala. Djurartiklarna är inte kvalitetssäkrade än, t.ex när det gäller synonymfel, och de kommer nog inte bli det heller än på många år, om någonsin. Jag tillåter mig att citera Användare:Brya "I suppose that in the long run it may be interesting to see how high this Swedish Wikipedia reaches on the list of Wikipedia's containing the most fictitious species". Detta låter gnälligt och tråkigt, jag är medveten om det, men.. Wikipedia är ingen databas, utan ett uppslagsverk. Jag vill precis som alla andra se fler artiklar, men stress är inte bra för någon. Min önskan är därför att botprojekt när det gäller att skapa artiklar helst utförs i mer begränsad skala. Tanken att jämna ut den geografiska täckningen är bra. Men varför inte i omgångar, till exempel alla orter i ett land med över x antal invånare istället för alla bebodda platser på jorden. Sedan när man är klar med det första landet kan man ta nästa land och så vidare. Höstblomma (diskussion) 13 juni 2015 kl. 17.24 (CEST)
- Jag är i princip positiv, speciellt med så lovande provkörningar. Hannibals frågor om relevans behöver dock utredas. Min stora önskan är dock att det i denna stora botkörning läggs uppgifter på Wikidata först, som sedan hämtas in med en uppdaterad Geobox-mall (jag hjälper gärna till att fixa den). Att strunta i hur långt Wikidata har kommit sedan den förra stora botkörningen skulle kännas tråkigt (men för min del är det inte en "blocker", om arbetet genomförs lokalt på svwp innebär det ändå en enorm breddning av ämnena här och en lovvärd insats). ♥Ainali diskussionbidrag 13 juni 2015 kl. 16.56 (CEST)
- Beträffande databasens tillkomst så finns här en lista med de källor som använts. Huvudkälla är NGA GEOnet Names Server. Jag har också kollat de provkörda artiklarna, främst genom att klicka på koordinatlänken och se att uppgifterna stämmer med den karta som kommer upp. Beträffande särskiljning med latitud/longitud, så finns i grensideexemplet ovan två samhällen (nr 6 och 7 i Italien) där lat/long är enda tillgängliga särskiljande information. Lsj (diskussion) 13 juni 2015 kl. 16.32 (CEST)
Jag anser att botprojekt bör begränsas till områden där sannolikheten för att det annars blir artiklar är liten. Om det är så att de orter som ändå skulle få uppslag redan har dylika kan jag ställa mig bakom projektet. Men det krävs ordentliga förberedelser. I viss mån kan jag hålla med Höstblomma att vestigia terrent. Auktorsuppgifterna borde ha kunnat vara bättre. De kompletteras alltför sporadiskt som det nu är. Tostarpadius (diskussion) 13 juni 2015 kl. 17.55 (CEST)
- Förstår inte heller varför botprojekt måste gå så himla fort och ha ett sådant enormt scope. Det har uppstått stora problem med tidigare botprojekt, vilket bara har ökat min skepticism till att skapa nya artiklar med robot (en skepticism som brukade vara norm). Geonames är antagligen ungefär lika tillförlitlig som databasen som användes för att skapa artiklar om växter när det kommer till mindre orter, som man kan förvänta sig. Sökningar på OpenStreetMap, som använder Geonames som alternativ databas, ger ofta väldigt konstiga sökresultat exempelvis. Det är väl inte så konstigt, eftersom det finns mindre info om mindre orter i mer perifera regioner, men det är väl också ett skäl att inte skapa robotartiklar om dessa platser utan någon form av större källkritik.
- Som Höstblomma säger, identifiera de största städerna i varje land (redan gjort) och se till att det finns artiklar om dessa. Det skulle vara ett bra förstasteg och betydligt lättare att kontrollera infon, främst för att den ofta redan finns på enwp. Låt inte det här bli ännu ett evighetsbotprojekt som aldrig kommer gå att kontrollera. Det är illa nog att vi har miljontals med artiklar med eviga åtgärdsmallar. /Grillo (diskussion) 13 juni 2015 kl. 18.00 (CEST)
- Min erfarenhet från Botswana är att all data som finns inte är bra och tillförlitliga data, så jag rekommenderar en ordentlig kvalitetskontroll innan ett land rullas ut. Jag ser gärna en ny Geobox, men Lua-stöd och lätt tillgång till Wikidata. Arbitrary access rullar på utan klagomål värda att nämna, och ser ut att komma vilken vecka som helst. ruwiki aktiverar tjänsten från 23 september. När det kommit hit, vilket troligen sker ganska snart efter det, finns det stöd för källor i Wikidata, och det blir användbart på riktigt. -- Innocent bystander (diskussion) 13 juni 2015 kl. 18.07 (CEST)
- Jag delar Grillos skepticism inför Geonames. Jag tror den databasen innehåller mycket skräp. Men om man inom varje kategori rangordnar objekten, till exempel efter folkmängd för tätorterna, så kan man undersöka vilka av dem som Wikipedia redan har artiklar om. Om det t.ex. finns 1000 städer i Italien och Wikipedia redan har artiklar om alla de 100 största, men bara hälften av de nästa 200 och nästan inga av de minsta 700, så kan man gå in och skapa de saknade artiklarna i mellanintervallet, men strunta i att skapa bot-artiklar för de 700 minsta italienska städerna. --LA2 (diskussion) 13 juni 2015 kl. 18.17 (CEST)
- behövs verkligen konsensus för att göra något seriöst? Jag tycker det är OK så länge en typartikel på sffr inte ger utfall på att radera. Så föreslår någon av exemplen ovan förs in i artikelrymden och sedan omedelbart till sffr.Yger (diskussion) 13 juni 2015 kl. 18.41 (CEST)
- Relevans är irrelevant i detta fall. Det som är relevant att diskutera, är om källan är tillförlitlig, och det i område för område! I Botswana kunde jag inte lita på ett statlig statistikbyrå. Vad är kvaliten på denna källa i ett land som Afghanistan? -- Innocent bystander (diskussion) 13 juni 2015 kl. 19.07 (CEST)
- Ja en diskussion utifrån källäget for en skapad artikel tycker jag också är av värde. Men sättet artikeln är framställd tycker jag är en ovidkommande fråga.Yger (diskussion) 13 juni 2015 kl. 19.32 (CEST)
- Relevans är irrelevant i detta fall. Det som är relevant att diskutera, är om källan är tillförlitlig, och det i område för område! I Botswana kunde jag inte lita på ett statlig statistikbyrå. Vad är kvaliten på denna källa i ett land som Afghanistan? -- Innocent bystander (diskussion) 13 juni 2015 kl. 19.07 (CEST)
Detta ser ju helt fantastiskt ut! Givetvis kan källornas värde diskuteras men jag förordar att vi kör ändå. Eller finns andra bättre databaser? --افيراتير (diskussion) 13 juni 2015 kl. 19.41 (CEST)
- Uppdraget som du tar på dig är både omfattande och hedersamt, Lsj. Du ska ha stort tack för att du bidrar till Wikipedia så mycket som du gör. Utan att gå in på några detaljer så vill jag säga att jag står bakom projektet i det stora hela. Utopiantos (diskussion) 13 juni 2015 kl. 20.37 (CEST)
- Och jag ger också stöd, men skulle vilja genomförandet sker något annorlunda än förra gången. Att det körs för en ordentligt delmängd först, säg 25000 artiklar, men att det sedan ligger i hold i sex-tolv månader eller så, för att ge ordentligt med tid för återkoppling på de skapade. Och då inte bara genom granskande av de skapade utan genom att man ändå råkar komma till dem (vilket kräver en stor mängd artiklar).Yger (diskussion) 13 juni 2015 kl. 21.18 (CEST)
- Bra initiativ! Jag ger också stöd, men i första hand för orter över en viss storlek och platser inom "relevanta" kategorier (vadställen? sprickor?). Typexemplen ser lovande ut, men där finns också ett antal missar som kan behöva diskuteras vad gäller språk och layout innan vi drar igång.--Paracel63 (diskussion) 13 juni 2015 kl. 21.42 (CEST)
- Och jag ger också stöd, men skulle vilja genomförandet sker något annorlunda än förra gången. Att det körs för en ordentligt delmängd först, säg 25000 artiklar, men att det sedan ligger i hold i sex-tolv månader eller så, för att ge ordentligt med tid för återkoppling på de skapade. Och då inte bara genom granskande av de skapade utan genom att man ändå råkar komma till dem (vilket kräver en stor mängd artiklar).Yger (diskussion) 13 juni 2015 kl. 21.18 (CEST)
- Jag stöder botprojektet till fullo! Det bör inte begränsas i avseende till kvantitet eller relevans. En anmärkning dock är att rubriken "Noter" gärna får ändras till "Kommentarer", för att undvika tvetydighet. Definiendum (?) 14 juni 2015 kl. 10.18 (CEST)
- Jag stödjer initiativet, och är glad att det blev geografiska artiklar som blev nästa botprojekt. Sedan finns det säkert smådetaljer att modifiera innan start, själv skulle jag föreslå att man börjar med en mindre testserie någonstans i Europa eller någon annan plats där det relativt enkelt går att jämföra med andra källor för att se vad och hur mycket som kan bli fel. "I suppose that in the long run it may be interesting to see how high this Swedish Wikipedia reaches on the list of Wikipedia's containing the most fictitious species" tror jag inte alls på. Det är möjligt att svenskspråkiga wikipedia också har artiklar som den fiktiva aboriginska guden som låg i artikelnamnrymden i över tio år och till och med hann hamna i en bok innan den upptäcktes, men tror att chansen är betydligt mindre att den i så fall ligger bland botartiklarna än bland svenskspråkiga wikipedias övriga artiklar. Grillos lista eller att välja ut 100 saknade bland Italiens 300 största städer (har ingen aning om hur det stämmer, bland de 150 största saknar vi 18) antar jag blir ganska meningslöst utifrån botkörningsperspektiv, när serierna blir så små är botprogrammeringsarbetet så stort i jämförelse med vad som skall skrivas att det troligen blir enklare att skapa dem manuellt.FBQ (diskussion) 14 juni 2015 kl. 11.31 (CEST)
- FBQ, det är bara att följa Bryas bidrag så får du exempel. Jag hittade också flera stycken liknade fall under en tid och även om den största andelen av botartiklarna kanske är rätt så är det troligt att det även finns en mängd som är fel. Nu tröttnade jag på att jobba med det, men problemet slutar inte finnas för att det sopas under mattan eller inte låtsas om. Men nu handlar den här diskussionen inte om djurartiklarna, Jag tog det som ett exempel för att jag ville påtala vikten av försiktighet. Höstblomma (diskussion) 14 juni 2015 kl. 13.25 (CEST)
- Nej, Brya hittade inga fiktiva arter bland Lsjbots bidrag. Det Brya hittade var artiklar där h*n inte var överens med den taxonomiska källa som boten och CoL utgick från. Kanske stämmer Bryas uppfattning bättre överens med modern taxonomisk konsensus, CoL följde ofta en konservativ taxonomi. Men "fiktiv" innebär att något är medvetet påhittat, och det är närmast oförskämt att använda det ordet om seriöst avsedda källbelagda artiklar. Lsj (diskussion) 14 juni 2015 kl. 13.52 (CEST)
- Jag vet att det inte rör sig om medvetet påhitt. Taxa som inte finns då, om det är bättre ordval. Det var inte bara en fråga om att inte vara överens om taxonomin, utan även om avläsningsfel som skapade taxon som inte finns. Höstblomma (diskussion) 14 juni 2015 kl. 14.30 (CEST)
- jag har gått igenom en hel del {{mall|slå ihop} förslag görande Lsjbot skapade artiklar. Som jag förstått det så visar det sig av COL innehåller en del brister, där manuella slarvfel vid inmatning av COL uppgifter medfört dubbletter som inte är dubbletter. Och visste är det en brist, men... Det är inte fråga om nyskapade fel utan vidareföring av sådan frän källan. Om artiklarna skapades manuellt skulle betydligt fler fel skapas. Sedan tror jag på kvalitet "good enough" och då tycker jag dessa brister är helt OK, och ofta hittar man dubbletterna efter varandra i efter söksträngen.Yger (diskussion) 14 juni 2015 kl. 15.02 (CEST)
- Jag ger också mitt stöd till detta projekt. Efter att ha följt artboten och vet att Lsj fick mycket mer erfarenhet av den och är försiktig så tror jag att detta kan bli bra. Dock vissa begränsningar till en början. Att vissa källor är felaktiga i vissa fall är svårt att komma från, eftersom det här gäller befolkningsstatistik.De felen skulle uppstå även av icke-botskapade artiklar med. Dock har Lsj redan börjat jobba med det ser jag här under. Så stöd från mig med. Adville (diskussion) 14 juni 2015 kl. 23.55 (CEST)
- jag har gått igenom en hel del {{mall|slå ihop} förslag görande Lsjbot skapade artiklar. Som jag förstått det så visar det sig av COL innehåller en del brister, där manuella slarvfel vid inmatning av COL uppgifter medfört dubbletter som inte är dubbletter. Och visste är det en brist, men... Det är inte fråga om nyskapade fel utan vidareföring av sådan frän källan. Om artiklarna skapades manuellt skulle betydligt fler fel skapas. Sedan tror jag på kvalitet "good enough" och då tycker jag dessa brister är helt OK, och ofta hittar man dubbletterna efter varandra i efter söksträngen.Yger (diskussion) 14 juni 2015 kl. 15.02 (CEST)
- Jag vet att det inte rör sig om medvetet påhitt. Taxa som inte finns då, om det är bättre ordval. Det var inte bara en fråga om att inte vara överens om taxonomin, utan även om avläsningsfel som skapade taxon som inte finns. Höstblomma (diskussion) 14 juni 2015 kl. 14.30 (CEST)
- Nej, Brya hittade inga fiktiva arter bland Lsjbots bidrag. Det Brya hittade var artiklar där h*n inte var överens med den taxonomiska källa som boten och CoL utgick från. Kanske stämmer Bryas uppfattning bättre överens med modern taxonomisk konsensus, CoL följde ofta en konservativ taxonomi. Men "fiktiv" innebär att något är medvetet påhittat, och det är närmast oförskämt att använda det ordet om seriöst avsedda källbelagda artiklar. Lsj (diskussion) 14 juni 2015 kl. 13.52 (CEST)
- FBQ, det är bara att följa Bryas bidrag så får du exempel. Jag hittade också flera stycken liknade fall under en tid och även om den största andelen av botartiklarna kanske är rätt så är det troligt att det även finns en mängd som är fel. Nu tröttnade jag på att jobba med det, men problemet slutar inte finnas för att det sopas under mattan eller inte låtsas om. Men nu handlar den här diskussionen inte om djurartiklarna, Jag tog det som ett exempel för att jag ville påtala vikten av försiktighet. Höstblomma (diskussion) 14 juni 2015 kl. 13.25 (CEST)
- Jag stödjer initiativet, och är glad att det blev geografiska artiklar som blev nästa botprojekt. Sedan finns det säkert smådetaljer att modifiera innan start, själv skulle jag föreslå att man börjar med en mindre testserie någonstans i Europa eller någon annan plats där det relativt enkelt går att jämföra med andra källor för att se vad och hur mycket som kan bli fel. "I suppose that in the long run it may be interesting to see how high this Swedish Wikipedia reaches on the list of Wikipedia's containing the most fictitious species" tror jag inte alls på. Det är möjligt att svenskspråkiga wikipedia också har artiklar som den fiktiva aboriginska guden som låg i artikelnamnrymden i över tio år och till och med hann hamna i en bok innan den upptäcktes, men tror att chansen är betydligt mindre att den i så fall ligger bland botartiklarna än bland svenskspråkiga wikipedias övriga artiklar. Grillos lista eller att välja ut 100 saknade bland Italiens 300 största städer (har ingen aning om hur det stämmer, bland de 150 största saknar vi 18) antar jag blir ganska meningslöst utifrån botkörningsperspektiv, när serierna blir så små är botprogrammeringsarbetet så stort i jämförelse med vad som skall skrivas att det troligen blir enklare att skapa dem manuellt.FBQ (diskussion) 14 juni 2015 kl. 11.31 (CEST)
- Jag stöder botprojektet till fullo! Det bör inte begränsas i avseende till kvantitet eller relevans. En anmärkning dock är att rubriken "Noter" gärna får ändras till "Kommentarer", för att undvika tvetydighet. Definiendum (?) 14 juni 2015 kl. 10.18 (CEST)
- I see my name mentioned, so I would like to repeat that Lsj has created at least hundreds, probably thousands (if not tens of thousands) pages on taxa that do not exist, have never existed and will never exist. Taxonomy does not come into into it. A basic principle is that content should be based on reliable sources: and obviously CoL is not a reliable source (it is just about the worst database one could find): CoL did fabricate these 'taxa', if not deliberately, then by a carelessness that is the next thing to it. - Brya (diskussion) 15 juni 2015 kl. 07.19 (CEST)
Reflektioner så här långt
[redigera wikitext]Tack för stöd från många här. Men jag ser också en del kritiska synpunkter inom följande områden:
- Är källan pålitlig? Mycket väsentlig fråga, och detta bör nog verifieras land för land. Innocent bystander nämner Botswana, och jag har också hittat konstiga befolkningssiffror i Armenien. Finns redan i botkoden att jämföra befolkningssiffror med vad som finns i wikidata och de större språkversionerna. Förmodligen klokt att köra igenom det systematiskt. Förslag på bättre världsomspännande källor mottages tacksamt.
- Takt, urval och omfattning? Det är inte tal om att köra massiv produktion från början. Botkoden är skriven så att det är lätt att köra antingen land för land, platstyp för platstyp (städer, berg etc.), eller med tröskelvärden för t.ex. befolkning, så som olika användare föreslår här ovan. Ygers tanke om att köra en rejäl delmängd först och sedan låta det vila några månader är vettig, och är också vad vi gjorde med arterna. Då kördes 8000 fåglar först, sedan ett halvår senare 50 000 svampar, och ytterligare några månader senare den stora massan.
- Vilka platstyper är relevanta? Viktig fråga, men borde inte vara svårhanterlig. Rekommenderar intresserade att helt enkelt redigera listan Användare:Lsjbot/Projekt alla platser/platstyper. Man kan också tänka sig en prioritetsordning, så att vi skapar de mest relevanta platstyperna först och tar mer marginella typer i en eventuell senare omgång.
Lsj (diskussion) 14 juni 2015 kl. 11.49 (CEST)
- Något jag upptäckte när jag jobbade med Botswana, var inte så mycket att befolkningssiffrorna var fel. (Mätmetoderna har alltid felmarginaler, no big deal om det är 543 eller 534 invånare i en by som räknats genom att soldater gått från dörr till dörr med en penna i hand.) Snarare handlade det om att statistikbyrån delade in landet efter eget huvud, inte efter den administrativa indelning landet faktiskt har/hade. Dessa uppgifter fick jag till slut radera. Ett annat problem var att koordinaterna inte var helt tillförlitliga. Det fanns exempel på orter som enligt källan låg ute i Atlanten eller i grannlandet, men det vanligaste var att de låg i fel provins. Många orter valde jag bort pga detta problem. -- Innocent bystander (diskussion) 14 juni 2015 kl. 12.17 (CEST)
- Täckningskartan för Geonames här bredvid har ett påtagligt "hål" för Botswana, med mindre än en femtedel så många platser som t.ex. Zimbabwe. Det torde vara ett varningstecken. Ska kolla om där finns koordinater som ligger helt utanför landet. Lsj (diskussion) 14 juni 2015 kl. 13.07 (CEST)
- Det är också väldigt väldigt mycket öken, vilket kan ha viss betydelse. Finns även ett jättenaturreservat, som har <100 invånare. -- Innocent bystander (diskussion) 14 juni 2015 kl. 13.59 (CEST)
- Täckningskartan för Geonames här bredvid har ett påtagligt "hål" för Botswana, med mindre än en femtedel så många platser som t.ex. Zimbabwe. Det torde vara ett varningstecken. Ska kolla om där finns koordinater som ligger helt utanför landet. Lsj (diskussion) 14 juni 2015 kl. 13.07 (CEST)
- Jag tycker att LA2 har en bra idé ovan, att fylla ut saknade orter per land, snarare än att pressa ut allt som går att lägga in. Databas vs uppslagsverk som Höstblomma påpekar. Börja med orter över 100 000 invånare (redan här är det svårt att hitta vettiga källor för vissa delar av världen) och fortsätt sedan med orter över 10 000 invånare och gå långsamt neråt. I västvärlden är det lätt att hitta tydliga uppgifter om väldigt små platser (framförallt i USA, vilket Rambot är ett tecken på) men betydligt svårare i det som traditionellt brukar kallas "tredje världen", även om det egentligen är en missvisande term.
- Vill man tvunget skapa "artiklar" om "alla" orter kan man väl lagra info om mindre orter enbart på Wikidata tills vidare? /Grillo (diskussion) 14 juni 2015 kl. 13.52 (CEST)
- Ska vara möjligt att använda Wikidata på det sättet. Enda kruxet är att relevansbegreppet är ett ständigt diskussionsämne som är under omtolkning. Ett projekt som gick ut på att lägga in alla gator i Nederländerna gav en hel del buller, och kan vara svårt att upprepa så snart efteråt. -- Innocent bystander (diskussion) 14 juni 2015 kl. 13.59 (CEST)
- Kul med ännu ett botprojekt. Går det att jobba agilt med delleveranser och tid för paus och reflektion däremellan? Det är lättare att uttala sig efter att man har sett några testartiklar, förslagsvis skapade dels enbart med innehåll från GeoNames, dels även från Wikidata. Kan man även ta det nivå för nivå enligt den hierarkiska uppdelningen av världens länder i administrativa områden i en:Category:Country subdivisions by administrative level? Svenskspråkiga Wikipedia har kort medellängd på artiklarna till följd av hög procent stub-artiklar, så det vore bra om alla botskapade artiklar blir längre än vår nuvarande genomsnittliga artikellängd. Mange01 (diskussion) 14 juni 2015 kl. 22.48 (CEST)
- Agilt, jovisst. En handfull testartiklar finns, länkade i inledningen till den här tråden. Om konsensus nås här kör jag en lite större testserie. Administrativa indelningar finns också på programmet, och kan köras nivå för nivå om man vill. Vad artikellängd beträffar är det många bytes i testartiklarna, men det mesta är infobox. Det är svårt att göra långa brödtexter med bot, men jag gör så gott jag kan. Lsj (diskussion) 15 juni 2015 kl. 08.23 (CEST)
- Testartiklarna är förvånansvärt långa mätt i byte - betydligt längre än lsjbots tidigare artiklar. Bra! Men de innehåller många rödlänkar till artiklar som egentligen existerar men har andra namn. Är handpåläggning nödvändig på varenda artikel, eller går det att förbättra automatiken ytterligare ett snäpp? Om boten börjar med större regioner och viktigare orter, och sedan tar paus, finns en chans att hänga med i den manuella efterredigeringen. Mange01 (diskussion) 16 juni 2015 kl. 19.20 (CEST)
- Rödlänkar av det slaget ska inte vara ett problem när boten kör "på riktigt". Men mycket av maskineriet för att hålla ordning på andra artiklars namn är av olika skäl inte aktivt i testkörningarna, och en del går bara att testa i huvudnamnrymden. Lsj (diskussion) 16 juni 2015 kl. 21.38 (CEST)
- Vilket spännande projekt! Jag är helt och hållet emot det Jag förstår att jag är rätt ensam om en skeptisk hållning visavi botskapade artiklar i massor, men man kan ju alltid framföra sin mening: Jag tror inte att Wikipedia är rätt ställe för att skapa ett bättre användargränssnitt mot de här databaserna. Ett projekt som går ut på att presentera informationen i de här databaserna på ett snyggare sätt är liksom ett annat projekt, det är lovvärt och spännande och allt möjligt, men Wikipedia är inte rätt plats. Och rent datalogiskt är det destruktivt, uppgifterna ligger prydligt strukturerade i databaserna nu, och kommer att ligga löst och obundet i artiklarna efter körningen. Detta är inte bra, och det stör en pedantisk programmerartyp som undertecknad.
- Om man får bli lite mer teoretisk kan man tänka att det här är en konflikt mellan två perspektiv: innehåll vs. form. Innehållet i de här artiklarna kanske det inte är något direkt fel på (eller i alla fall är de inte värre än den genomsnittliga artiklen här). Ur det, vad ska man säga, teknokratiska perspektivet är detta det enda som spelar roll. Det vanliga svaret från den som bara har en teknisk syn på förändringar och innovationer är alltid att "innehållet påverkas ju inte". Det stämmer kanske att innehållet i en bok inte skiljer sig från innehållet i en e-bok, men formen är annorlunda. Att titta på en film på tv har inte samma form som att titta på en film på bio. Att skriva ett brev för hand har en annan form än att skriva ett e-postmeddelande, och det är en brist i vårt samhälle att vi verkar vara så blinda för formens betydelse. Formen här på Wikipedia har på senare år förändrats, från manuellt ihopknåpade till mekaniskt utstansade artiklar. Det är synd, och det gör den här verksamheten till någonting annat. Med detta sagt vill jag också lyfta på hatten för Lsjs fantastiska ansträngningar och önska roboten lycka till i framtiden! Marfuas (diskussion) 15 juni 2015 kl. 08.44 (CEST)
- Skulle man kunna kontrollera uppgifterna mot OpenStreetMap? Om en ort även finns med även där, på ungefär samma ställe, finns den nog i verkligheten också. Janm67 (diskussion) 17 juni 2015 kl. 22.45 (CEST)
- Lätt att göra stickprov i efterhand, koordinatlänken i varje skapad artikel leder till både OSM och andra karttjänster. Går i princip att göra i förväg men är ganska mycket jobb (många månader) att göra för alla orter. Och jag är inte helt övertygad om att OSM är mycket pålitligare än GeoNames på landsbygden i Tredje Världen där dubbelkoll verkligen skulle behövas, så jag är tveksam till om det är värt jobbet. Jag har kolla de flesta provartiklarna, och i de flesta fall stämmer GeoNames med OSM. I ett par fall har orten saknats som namn i OSM, men satellitbilder har visat att där ändå ligger ett samhälle av rimlig storlek på den plats som anges av GeoNames. Lsj (diskussion) 19 juni 2015 kl. 09.32 (CEST)
- Satsar man på orter av rimlig storlek (dvs över 10 000 invånare minst) är problemen med verifiering troligen mindre. Vi behöver ju för all del inte verifiera enbart med hjälp av öppna källor utan kollar man Google Maps och ser att där är bebyggelse och ett platsnamn är det väl "good enough". För orter under 10 000 invånare är nog potentialen för felkällor helt för stor för att det här ska kunna genomföras. /Grillo (diskussion) 19 juni 2015 kl. 13.14 (CEST)
- Jag tycker nog att det borde gå att hitta källor för information även under 10.000, åtminstone i Europa och Nordamerika, men jag kan ju se en poäng i att i många fall fokusera på kommuner eller motsvarande administrativa områden och inte på orterna som sådana. Vi kommer att få samma problem som i Sverige, dvs. ort kan syfta på 1: ett administivt område som utgör en ort 2. ett historiskt område som benämns med ortsnamnet men som inte motsvarar det administrativa området. 3. Ett statistiskt område baserat på befolkningstäthet som möjligen inte alls motsvaras av något av de ovanstående. Har man otur som i Sverige kan de här områdena ha namn som varken finns på kartor eller förkommer i några andra sammanhang. Men så länge det framgår vad som åsyftas ser jag inget problem, vi har artiklar om orter som inte existerar annat än som statistiska enheter hos SCB i Sverige så varför inte i andra länder. Det enklaste är ju dock att man börjar med kommuner.FBQ (diskussion) 19 juni 2015 kl. 15.51 (CEST)
- Vi behöver förvisso inte göra allt på en gång. Av flera skäl är det lämpligt att göra administrativa indelningar (län, kommuner...) först. De är inte så förskräckligt många heller (Frankrike med 50 000 kommuner är ett extremfall, några hundra per land är mer normalt), och enwp har god täckning på dessa så att vi kan dubbelkolla. Därefter kan man ta platser som är över något tröskelvärde: orter med mer än X invånare, berg mer än Y meter höga, sjöar med area mer än Z km2, etc. Sedan får vi se om vi orkar byhålor och småkullar också, även om dessa i Sverige betraktas som relevanta. Lsj (diskussion) 19 juni 2015 kl. 18.36 (CEST)
- jag håller med om ditt resonemang, adm enheter först, sedan större orter och sjöar etc. Jag undrar om det går kolla hur många artiklar på olika språkversioner ett objekt i GeoNames matchar. Om det går så kunde man väl saga att alla objekt som återfinns på minst "fem"(tre) andra språkversioner är OK skapa oberoende av storlek etc?Yger (diskussion) 19 juni 2015 kl. 20.16 (CEST)
- Eftersom boten ändå kollar interwiki när den skapar en artikel, så går det ganska enkelt att villkora på antal språkversioner. Men utfallet av en sådan regel som du föreslår bleve nog blygsamt, det är en minoritet av posterna i GeoNames som alls finns på wikipedia. Lsj (diskussion) 19 juni 2015 kl. 21.03 (CEST)
- jag håller med om ditt resonemang, adm enheter först, sedan större orter och sjöar etc. Jag undrar om det går kolla hur många artiklar på olika språkversioner ett objekt i GeoNames matchar. Om det går så kunde man väl saga att alla objekt som återfinns på minst "fem"(tre) andra språkversioner är OK skapa oberoende av storlek etc?Yger (diskussion) 19 juni 2015 kl. 20.16 (CEST)
- Vi behöver förvisso inte göra allt på en gång. Av flera skäl är det lämpligt att göra administrativa indelningar (län, kommuner...) först. De är inte så förskräckligt många heller (Frankrike med 50 000 kommuner är ett extremfall, några hundra per land är mer normalt), och enwp har god täckning på dessa så att vi kan dubbelkolla. Därefter kan man ta platser som är över något tröskelvärde: orter med mer än X invånare, berg mer än Y meter höga, sjöar med area mer än Z km2, etc. Sedan får vi se om vi orkar byhålor och småkullar också, även om dessa i Sverige betraktas som relevanta. Lsj (diskussion) 19 juni 2015 kl. 18.36 (CEST)
- Jag tycker nog att det borde gå att hitta källor för information även under 10.000, åtminstone i Europa och Nordamerika, men jag kan ju se en poäng i att i många fall fokusera på kommuner eller motsvarande administrativa områden och inte på orterna som sådana. Vi kommer att få samma problem som i Sverige, dvs. ort kan syfta på 1: ett administivt område som utgör en ort 2. ett historiskt område som benämns med ortsnamnet men som inte motsvarar det administrativa området. 3. Ett statistiskt område baserat på befolkningstäthet som möjligen inte alls motsvaras av något av de ovanstående. Har man otur som i Sverige kan de här områdena ha namn som varken finns på kartor eller förkommer i några andra sammanhang. Men så länge det framgår vad som åsyftas ser jag inget problem, vi har artiklar om orter som inte existerar annat än som statistiska enheter hos SCB i Sverige så varför inte i andra länder. Det enklaste är ju dock att man börjar med kommuner.FBQ (diskussion) 19 juni 2015 kl. 15.51 (CEST)
- Jag kan köpa att det inte tillför så mycket, men varför skulle det ta sån tid? OSM-databasen kan man ladda ned som en fil på nätta 43 GB så kontrollen kan göras maskinellt. Det är "bara" att programmera. ;) Janm67 (diskussion) 20 juni 2015 kl. 15.53 (CEST)
- Visst, det är bara att programmera, och borde inte vara mer än någon dags programmeringsarbete. Skulle inte falla mig in att göra för hand i den skalan. Men att kolla två stora databaser mot varann när de inte är samnycklade på något vettigt sätt, tar mycket lång datortid. Gissningen "månader" bygger på min erfarenhet av att koppla ihop GeoNames med Wikidata, vilket tar någon sekund per post i snitt. Och med 10 miljoner poster att kolla blir det månaders körtid. Lsj (diskussion) 20 juni 2015 kl. 16.03 (CEST)
- Försöken att "nyckla ihop" Wikidata och OSM har väl inte varit särskilt framgångsrika. Efter vad jag förstått, så saknas det stabila identifierare i OSM. Det vore kanske något för OSM-utvecklarna att bita i! -- Innocent bystander (diskussion) 20 juni 2015 kl. 18.15 (CEST)
- Visst, det är bara att programmera, och borde inte vara mer än någon dags programmeringsarbete. Skulle inte falla mig in att göra för hand i den skalan. Men att kolla två stora databaser mot varann när de inte är samnycklade på något vettigt sätt, tar mycket lång datortid. Gissningen "månader" bygger på min erfarenhet av att koppla ihop GeoNames med Wikidata, vilket tar någon sekund per post i snitt. Och med 10 miljoner poster att kolla blir det månaders körtid. Lsj (diskussion) 20 juni 2015 kl. 16.03 (CEST)
- Satsar man på orter av rimlig storlek (dvs över 10 000 invånare minst) är problemen med verifiering troligen mindre. Vi behöver ju för all del inte verifiera enbart med hjälp av öppna källor utan kollar man Google Maps och ser att där är bebyggelse och ett platsnamn är det väl "good enough". För orter under 10 000 invånare är nog potentialen för felkällor helt för stor för att det här ska kunna genomföras. /Grillo (diskussion) 19 juni 2015 kl. 13.14 (CEST)
- Lätt att göra stickprov i efterhand, koordinatlänken i varje skapad artikel leder till både OSM och andra karttjänster. Går i princip att göra i förväg men är ganska mycket jobb (många månader) att göra för alla orter. Och jag är inte helt övertygad om att OSM är mycket pålitligare än GeoNames på landsbygden i Tredje Världen där dubbelkoll verkligen skulle behövas, så jag är tveksam till om det är värt jobbet. Jag har kolla de flesta provartiklarna, och i de flesta fall stämmer GeoNames med OSM. I ett par fall har orten saknats som namn i OSM, men satellitbilder har visat att där ändå ligger ett samhälle av rimlig storlek på den plats som anges av GeoNames. Lsj (diskussion) 19 juni 2015 kl. 09.32 (CEST)
Jämförelse GeoNames - wikipedia
[redigera wikitext]Frågor har ställts om pålitligheten hos GeoNames. Har därför kört en snabb jämförelse av de samhällen i ca 50 länder som har befolkningsuppgifter både i GeoNames och i någon av de större wikipediaversionerna (oftast enwp). Korrelationskoefficienten mellan befolkning enligt Geonames och befolkning enligt Wikipedia är 0,97, vilket får ses som ett gott tecken. Finns dock några procent avvikare, med större skillnader mellan GN och wiki. Har handkollat ett antal av dessa. För större städer handlar avvikelserna oftast om att den ena siffran är för storstadsområdet och den andra för själva staden. I några fall är det mindre orter med mycket vanliga namn, där det sannolikt har skett en förväxling med en namne någonstans. Har också hittat ett gäng mindre orter där siffran i GeoNames uppenbarligen inte är en befolkningssiffra -- finns bl.a. ett helt gäng orter med exakt 4 invånare. Sannolikt är det noter eller liknande som slunkit med.
Kvaliteten varierar kraftigt mellan länder, inte helt oväntat. Stora avvikelser i Afrika, nästan inga i Europa. Det är dock inte alltid GeoNames som har fel - har hittat en del märkligheter på wiki också, som att staden Luanda på frwp har större befolkning än provinsen den ligger i (och 3 ggr större befolkning än på enwp). Lsj (diskussion) 14 juni 2015 kl. 21.20 (CEST)
- När jag tittar på kartan över den administrativa indelningen runt Luanda, kan det finnas en naturlig förklaring till det. Det kan vara samma förklaring som varför Stockholms tätort har större folkmängd än Stockholms stad. -- Innocent bystander (diskussion) 14 juni 2015 kl. 21.47 (CEST)
- Ok, jag ser vad du menar, staden brer ut sig utanför sin provins. Det är svårt det där med att entydigt definiera en stads befolkning. Men det är fortfarande lite problematiskt att om man tittar runt bland språkversionerna på wiki kan befolkningstalen för Luanda vara 2, 3, 4, 5 eller 8 miljoner. Jag undrar om korrelationen mellan språkversioner överlag är bättre än korrelationen mellan enwp och GeoNames? Lsj (diskussion) 14 juni 2015 kl. 22.15 (CEST)
- @Lsj: Ja, och runt städer som dessa är det ofta svårt att sätta gränser för storstadsområdena. Och ofta är det nog just dessa som artiklarna handlar om. -- Innocent bystander (diskussion) 18 juni 2015 kl. 21.26 (CEST)
- Ofta nog är det oklart om en artikel handlar om storstadsområdet eller den formella staden, och iw-länkarna för Luanda verkar blanda friskt. Lsj (diskussion) 19 juni 2015 kl. 09.26 (CEST)
- Angola höll sin första folkräkning på över 40 år 2014, och det cirkulerar nog fortfarande en del gamla beräkningar och uppskattningar för Luandas folkmängd på de olika wp-versionerna vilket resulterar i en blandad giv när det gäller uppgifter om folkmängden. Vad som även tydliggjordes när folkräkningsresultaten presenterades var att provinsen Luandas gräns kraftigt utökats (förr ca 2400 km² mot dagens ca 20000 km²). Även detta har nog inte uppdaterats på många språkversioner än. Luandas sammanhängande bebyggelse hade ca 6,4 miljoner invånare 2014, men enwp använder folkmängden för den kommun i provinsen som heter Luanda, vilket endast täcker den absolut centralaste delen av staden.--Pjred (diskussion) 19 juni 2015 kl. 21.51 (CEST)
- Ofta nog är det oklart om en artikel handlar om storstadsområdet eller den formella staden, och iw-länkarna för Luanda verkar blanda friskt. Lsj (diskussion) 19 juni 2015 kl. 09.26 (CEST)
- @Lsj: Ja, och runt städer som dessa är det ofta svårt att sätta gränser för storstadsområdena. Och ofta är det nog just dessa som artiklarna handlar om. -- Innocent bystander (diskussion) 18 juni 2015 kl. 21.26 (CEST)
- Ok, jag ser vad du menar, staden brer ut sig utanför sin provins. Det är svårt det där med att entydigt definiera en stads befolkning. Men det är fortfarande lite problematiskt att om man tittar runt bland språkversionerna på wiki kan befolkningstalen för Luanda vara 2, 3, 4, 5 eller 8 miljoner. Jag undrar om korrelationen mellan språkversioner överlag är bättre än korrelationen mellan enwp och GeoNames? Lsj (diskussion) 14 juni 2015 kl. 22.15 (CEST)
Är det någon som vet varför kartan till höger visar Frankrike som extra ljusstark? Kan det verkligen stämma att svwiki har så många artiklar med koordinater i Frankrike? Varför just Frankrike? Utopiantos (diskussion) 14 juni 2015 kl. 23.05 (CEST)
- En koordinatsatt artikel för var och en av de 36 680 kommunerna i Frankrike kan nog ge den "upplysande" effekten. --Larske (diskussion) 14 juni 2015 kl. 23.12 (CEST)
- Utopiantos, se [1]. Nirmos (diskussion) 14 juni 2015 kl. 23.22 (CEST)
- Botkörning har skapat geografiska artiklar i stor skala i Sverige och Frankrike, tack vare Nasko, vilket syns tydligt på kartan. I mindre skala har botkörningar gjorts också i Filippinerna och USA, vilket även det framgår av kartan -- Filippinerna är en ganska ensam ljusblå plätt i högerkanten. Lsj (diskussion) 15 juni 2015 kl. 08.36 (CEST)
- Och de mer tättbefolkade delarna av södra Botswana! :) -- Innocent bystander (diskussion) 18 juni 2015 kl. 18.59 (CEST)
- Icke att förglömma. Hur många artiklar blev det i Botswana? Lsj (diskussion) 19 juni 2015 kl. 09.26 (CEST)
- 383. Det tillkom dessutom lite artiklar vid sidan av och andra befintliga uppdaterades. -- Innocent bystander (diskussion) 19 juni 2015 kl. 16.07 (CEST)
- Icke att förglömma. Hur många artiklar blev det i Botswana? Lsj (diskussion) 19 juni 2015 kl. 09.26 (CEST)
- Och de mer tättbefolkade delarna av södra Botswana! :) -- Innocent bystander (diskussion) 18 juni 2015 kl. 18.59 (CEST)
- Botkörning har skapat geografiska artiklar i stor skala i Sverige och Frankrike, tack vare Nasko, vilket syns tydligt på kartan. I mindre skala har botkörningar gjorts också i Filippinerna och USA, vilket även det framgår av kartan -- Filippinerna är en ganska ensam ljusblå plätt i högerkanten. Lsj (diskussion) 15 juni 2015 kl. 08.36 (CEST)
- Utopiantos, se [1]. Nirmos (diskussion) 14 juni 2015 kl. 23.22 (CEST)
Var står vi nu, och hur går vi vidare?
[redigera wikitext]Efter en vecka är diskussionen inte så intensiv längre. Omkring 20 användare har deltagit. Tre användare uppfattar jag som principiellt mot projketet: Höstblomma, Grillo, och Marfuas. Tre användare uttrycker tveksamhet av olika slag utan att vara principiellt mot: Innocent Bystander, Tostarpadius och LA2. Tio användare uttalar tydligt stöd för projektet: Hannibal, Ainali, Yger, Averater, Utopiantos, Paracel63, Definiendum, FBQ, Adville och Mange01. Ytterligare tre användare har kommit med konstruktiva förslag här eller på projektsidan, utan att explicit uttala stöd: Nasko, Svensson1 och Janm67. Ber om ursäkt om jag har misstolkat eller glömt någon -- hör av er i så fall.
Jag ser ovanstående som tillräckligt mandat för att gå vidare med förberedelser och provkörning. Flera omgångar provkörning behövs hur som helst innan det är aktuellt att köra något större antal artiklar, och jag har både mjukvara kvar att utveckla och en del förberedande körningar som pågår.
För en första provkörning i huvudnamnrymden är mitt förslag att köra hela geografin i ett mycket litet land, som t.ex. Andorra eller Barbados. Nasko föreslår Norge, men jag kör hellre i lite mindre skala först. En sådan körning skulle ge en överblick av hur botprogrammets olika delar fungerar och samverkar, bättre än ett urval av t.ex. de största städerna i ett större land.
Tankar om detta? Lsj (diskussion) 20 juni 2015 kl. 18.42 (CEST)
- Jag tycker det låter som en bra idé. Om det ska testköras i så små länder gör det ingenting om man kör fram små (och potentiellt irrelevanta) platser. Det går ju alltid att radera platserna vid behov och jobba vidare därifrån. Wikidata behöver inte kopplas in i detta skede, utan bör fixas senare när vi vet hur omfattande projektet blir. Jag ber om ursäkt att jag svarar på brunnen och inte på projektsidan. Hela den här diskussionen bör flyttas dit för att arkiveras korrekt. Nasko (diskussion) 20 juni 2015 kl. 18.54 (CEST)
- Instämmer med Nasko. Jag är också av uppfattningen att vid ev begränsning av urvalet inte använda typ 10000 invånare utan hellre då iw förekomst.Yger (diskussion) 20 juni 2015 kl. 19.49 (CEST)
- Har tänkt lite till på länder. Vad tror ni om Färöarna? Där borde det gå bra att hitta pålitliga danska källor att ha som "facit". Lsj (diskussion) 20 juni 2015 kl. 20.20 (CEST)
- Färöarna kan vara bra, även om jag inte vet något om källor för dessa. Jag har själv haft funderingar på att vi borde göra en insats på svenskspråkiga Wikipedia och skriva mer om dessa öar.--Historiker (diskussion) 20 juni 2015 kl. 20.38 (CEST)
- Om det är så att boten ska testas, och man vill se till att det just är artiklar där det finns bra källor kanske man kunde testa med ett område i Sverige, typ ett landskap eller län och täcka upp det först (om det är praktiskt möjligt att ta artiklar inom en viss geografisk area utan att det blir hela landet). Sverige innebär att det är lättare att kolla om det stämmer. Men annars tycker jag att Lsj:s förslag fungerar bra.//Hannibal (diskussion) 20 juni 2015 kl. 21.45 (CEST)
- Att testa Sverige på svwp har nackdelen att täckningen redan är mycket god. Eftersom de flesta artiklar redan finns blir viktiga delar av botkoden inte testade om vi kör Sverige. Däremot skulle jag kunna köra några Sverigeartiklar på cebwp :) Lsj (diskussion) 20 juni 2015 kl. 22.02 (CEST)
- Tänka utanför boxen = . Den varianten hade jag aldrig tänkt på. //Hannibal (diskussion) 20 juni 2015 kl. 22.05 (CEST)
- Att testa Sverige på svwp har nackdelen att täckningen redan är mycket god. Eftersom de flesta artiklar redan finns blir viktiga delar av botkoden inte testade om vi kör Sverige. Däremot skulle jag kunna köra några Sverigeartiklar på cebwp :) Lsj (diskussion) 20 juni 2015 kl. 22.02 (CEST)
- Om det är så att boten ska testas, och man vill se till att det just är artiklar där det finns bra källor kanske man kunde testa med ett område i Sverige, typ ett landskap eller län och täcka upp det först (om det är praktiskt möjligt att ta artiklar inom en viss geografisk area utan att det blir hela landet). Sverige innebär att det är lättare att kolla om det stämmer. Men annars tycker jag att Lsj:s förslag fungerar bra.//Hannibal (diskussion) 20 juni 2015 kl. 21.45 (CEST)
- Färöarna kan vara bra, även om jag inte vet något om källor för dessa. Jag har själv haft funderingar på att vi borde göra en insats på svenskspråkiga Wikipedia och skriva mer om dessa öar.--Historiker (diskussion) 20 juni 2015 kl. 20.38 (CEST)
- Har tänkt lite till på länder. Vad tror ni om Färöarna? Där borde det gå bra att hitta pålitliga danska källor att ha som "facit". Lsj (diskussion) 20 juni 2015 kl. 20.20 (CEST)
- Instämmer med Nasko. Jag är också av uppfattningen att vid ev begränsning av urvalet inte använda typ 10000 invånare utan hellre då iw förekomst.Yger (diskussion) 20 juni 2015 kl. 19.49 (CEST)
@Hannibal: @Lsj: Där finns en poäng. Apropå inget så är det nu endast elva dagar kvar innan vi ([2]) kan börja illustrera svenska ortsartiklar med skärmdumpar från Översiktskartan ([3]). --Paracel63 (diskussion) 20 juni 2015 kl. 21.59 (CEST)
- Även jag stöder tanken med att börja i ett litet land. Andorra låter som ett utmärkt förslag. Tostarpadius (diskussion) 20 juni 2015 kl. 23.57 (CEST)
- Eftersom jag har en författarkompis, Kevyn Arthur, från Barbados så skulle jag tycka det var mycket roligt att kunna berätta för honomatt vi på svwp började med att skriva om hans ö... Därför förespråkar jag på rent egoistiska maneer att vi börjar med Barbados. Då lovar jag även att skriva hans artikel här ;-) mvh Adville (diskussion) 21 juni 2015 kl. 01.09 (CEST)
- Jag stöder, men förespråkar försiktighet. De exempel jag sett på hur den här källan redan använts på andra projekt, lämnar en del övrigt att önska, tyvärr. Men jag är övertygad att Lsj har betydligt bättre förutsättningar att använda den här källan rätt än de kolbaserade användare som använt den. Andorra, Barbados, Färöarna etc. Whatever, spelar roll? Just Färöarna ser dock ut att vara en ganska ljus prick i kartan över vår befintliga täckning. Det vore också intressant att se en körning i en svensk kommun på ceb eller war, det vore också intressant att se en körning i ett land i tredje världen med sämre ordning än ganska välordnade Andorra, Färöarna eller Barbados. Det vore också intressant att se vad som går att få ut ur ett land med ett annat skrivsystem! Kina avråder jag dock från, uppsättningen mallar som används där är främmande jämfört med resten av världen, och är därför mindre lämplig för jämförelser.
- Något jag också efterfrågat är en ny Modulbaserad Geobox, men det är ingen brådska! -- Innocent bystander (diskussion) 21 juni 2015 kl. 08.55 (CEST)
- Tror det är klokt att göra första provkörningen i ett "enkelt" land med god ordning, och i nästa rond ge sig på länder med mindre pålitliga uppgifter. Färöarna är "vitt" därför att Twincinema för tio år sedan skapade stubbar om en mängd platser på Färöarna. Kina finns problem med, jag får väldigt dåligt utfall när jag försöker koppla GeoNames till Wikidata just för Kina (ungefär lika många träffar i Kina som i Colombia, vilket knappast är rimligt). Lsj (diskussion) 21 juni 2015 kl. 11.34 (CEST)
- Innocent bystander är skeptisk till GeoNames kvaliteter, och det är jag också till viss del. Hur det ser ut beror mycket på vilket land man tittar på och vilken typ av geografiskt objekt det gäller. Jag kikade på GeoNames när jag gjorde sjöarna, och kom fram till (inte helt oväntat), att den var sämre än SMHI:s databaser. GeoNames innehåller mycket bra data som lyfts dit från primärkällor, men också sådant som kommer från annat håll, t.ex. enwiki. Länder med god ordning, lång tradition med demokratisk transparens och med centraliserad hantering och standardisering av data har alla förutsättningar att ha geografiska data av god kvalitet. Antagligen avspeglas detta även i GeoNames. Nasko (diskussion) 21 juni 2015 kl. 12.08 (CEST)
- Tror det är klokt att göra första provkörningen i ett "enkelt" land med god ordning, och i nästa rond ge sig på länder med mindre pålitliga uppgifter. Färöarna är "vitt" därför att Twincinema för tio år sedan skapade stubbar om en mängd platser på Färöarna. Kina finns problem med, jag får väldigt dåligt utfall när jag försöker koppla GeoNames till Wikidata just för Kina (ungefär lika många träffar i Kina som i Colombia, vilket knappast är rimligt). Lsj (diskussion) 21 juni 2015 kl. 11.34 (CEST)
- Eftersom jag har en författarkompis, Kevyn Arthur, från Barbados så skulle jag tycka det var mycket roligt att kunna berätta för honomatt vi på svwp började med att skriva om hans ö... Därför förespråkar jag på rent egoistiska maneer att vi börjar med Barbados. Då lovar jag även att skriva hans artikel här ;-) mvh Adville (diskussion) 21 juni 2015 kl. 01.09 (CEST)
- Även jag stöder tanken med att börja i ett litet land. Andorra låter som ett utmärkt förslag. Tostarpadius (diskussion) 20 juni 2015 kl. 23.57 (CEST)
- Jag har inte kommit till skott med att få ner alla mina tankar kring det här, men jag tänkte ändå att för rullorna och diskussionen lägga till min åsikt (och några synpunkter) i korthet, så det är gjort innan diskussionen har passerat förbi. Jag tycker de här projekten är spännande och intressanta, och samtidigt ställer jag mig nog svagt skeptisk, i alla fall delvis på grund av ett par problem jag ser i arbetet med robotartiklarna. Åtminstone kan jag säga att jag nog är emot en bred/obegränsad körning. Om projektet genomförs, så är jag för samma begränsningar som Grillo och LA2 nämner: fokusera på större orter till att börja med, i områden där vi kan känna oss rimligt säkra på att datan är tillförlitlig/har hög kvalitet. På det sättet får vi högkvalitativa artiklar, täcker in det relevantaste, och får mindre eventuellt putsbehov (bilder och liknande).
- När det gäller arbetet med robotartiklar tycker jag att det finns två problem. Dels tycker jag att det finns en otydlighet med vart man kan vända sig till med/notera småfel, eller detaljfel, som kan behöva lösas i många artiklar när de kommer ur något stadie av robotgenereringen. Sedan undrar jag om vi verkligen behöver robot-mallen, i alla fall i det formatet den har idag – det är som ett putsarbete som tillkommer i många tusen artiklar som egentligen inte borde behövas. (Man kan t ex notera i källhänvisningar/kommentarer att artikeln är automatgenererad, och sedan bör det inte vara något mer märkvärdigt med en sådan artikel än kanske språkliga lustigheter. Att sålla bland bilder borde kunna lösas på andra sätt än via åtgärdsmall – kanske lägga in på diskussionssidan och ha en projektsida där man listar artiklar där bilder kan infogas, infoga riktigt säkra bilder (hur?), eller lösa på något annat smart sätt.) Jag såg häromdagen att det första problemet i detta fallet har lösts med Användare:Lsjbot/Projekt alla platser/Åtgärdslista, det är förstås bra, och en typ av funktion som kanske kunde behövas permanent (och för de andra robotgenererade artiklarna. flinga 15 juli 2015 kl. 22.20 (CEST)
- Tack för synpunkter, flinga. Vad GeoNames beträffar har jag ägnat ganska mycket tid den senaste månaden åt att kontrollera kvaliteten i den, och jämföra med Wikidata (med hjälp från ffa Innocent bystander). Den jämförelsen har fått fram många fler fel i Wikidata än i GeoNames, men har också visat att vissa typer av objekt på GeoNames bör undvikas, bl.a. det som kallas "regioner", som är en ren slaskkategori för allt möjligt. Har också laddat ner höjddata för hela världen för att kunna dubbelkolla alla höjduppgifter för berg och annat, liksom arean för öar och sjöar. Har lagt in i programmet också en minimistorlek för orter. Beträffande de problem du tar upp:
- Vart kan man vända sig? Båda artprojektet och detta projektet har projektsidor som borde vara stället att vända sig till: Användardiskussion:Lsjbot/Projekt alla arter och Användardiskussion:Lsjbot/Projekt alla platser. Är det något robotmallen borde användas till så är det att ge en länk dit. Nu länkar den till wp:Robothjälp istället. I praktiken vänder sig många till min diskussionssida, vilket också fungerar.
- Behövs verkligen mallen
{{robotskapad}}
? Jag skulle gärna slippa den, eller ha en diskretare utformning. Den kan också lätt misstolkas som stridande mot Wikipedia:Ägarskap av artiklar. Att artiklarna automatkategoriseras under Kategori:Robotskapade artiklar är dock värdefullt, jag använder de kategorierna för underhåll och fixande med botartiklarna. Man skulle kunna tänka sig att utforma botmallen som en stubmall längst ner, eller helt enkelt nöja sig med{{Robotskapad stub om djur}}
(etc.) i artiklarna. - Bilder. Kan vara klokt att inte lägga bilder i själva artikeln, utan istället lägga bildförslag i diskussionssidan. Tekniskt är det lika enkelt. "Riktigt säkra bilder" är bilder som används i faktarutan i motsvarande artiklar på andra språk, när sådana finns. Men i de flesta fall finns det inte.
- Lsj (diskussion) 16 juli 2015 kl. 10.31 (CEST)
- Tack för synpunkter, flinga. Vad GeoNames beträffar har jag ägnat ganska mycket tid den senaste månaden åt att kontrollera kvaliteten i den, och jämföra med Wikidata (med hjälp från ffa Innocent bystander). Den jämförelsen har fått fram många fler fel i Wikidata än i GeoNames, men har också visat att vissa typer av objekt på GeoNames bör undvikas, bl.a. det som kallas "regioner", som är en ren slaskkategori för allt möjligt. Har också laddat ner höjddata för hela världen för att kunna dubbelkolla alla höjduppgifter för berg och annat, liksom arean för öar och sjöar. Har lagt in i programmet också en minimistorlek för orter. Beträffande de problem du tar upp:
- Jag tycker förstås att det är bra att det kvalitetsarbetet och avgränsningarna görs (utan att för den skull byta min "åsiktslinje" :)), och bra också med uppdatering om arbetsgången.
- Jag tror då absolut det kunde vara bra att ha med de länkarna i mallen (eller en ersättande mall, om vi skulle komma fram till ett sådant beslut) på ett smidigt sätt – länken till robothjälp är mitt verk, efter att jag vid ett tillfälle försökte efterlysa bra lösningar (se malldiskussion:robotskapad, jag tror jag fick tipset om att länka till robothjälp i någon annan diskussionstråd, och valde det eftersom det var mest generellt). Man kan ändra nuvarande till t ex “Misstänkta systematiska fel i artartiklar kan anmälas här, och i platsartiklar [kan anmälas] här”, och eventuellt något motsvarande för vattenartiklarna (kanske robothjälp i de fallen?).
- Bildfrågan kom jag förresten in på för att jag tänkte att "märkligt val av bilder" är en av de mest konkreta saker som mallen påpekar, som är mest konkret arbete. Så kanske kan man tänka sig en annan arbetsgång på den punkten – det kan vara så att här finns många som skulle tycka att det var en okej arbetsuppgift att manuellt lägga in bilder från diskussionssidan, ett likadant projekt är väl redan på gång. Kan tänkas finnas fler goda lösningar, det känns som en diskussionsfråga i sig.
- Jag vet att det är en del av oss som är lite skeptiska eller kritiska till mallen (och för min del är det något jag ganska nyss funderat på). Jag tänker att det blir lite kaka på tårta, som att mallen med formuleringen "tas bort när har åtgärdat x och y" blir en extra arbetsuppgift som.. kunde lösas på ett annat sätt. Alla artiklar kan ha språkfel, på massa olika sätt, de måste kanske inte mallas (vi testkör väl ändå robotartiklar såpass mycket att lustigheter minimeras..)? Riskerar förresten engelska termer att råka komma med (typ "North Galapagos")? Bilderna tänker jag är ett annat fall, därav tanken om den ovan. Även denna fråga känns som en fråga för en ny diskussion i sig, och är väl mindre brådskande än den om själva projektets genomförande eller ej, det är inte något nytt fenomen och kan efter eventuell diskussion ändras med robotar, tänker jag. (Detsamma gäller väl i viss mån bilderna, även om det eventuellt kunde vara bra med nya modeller, om vi kommer på någon bra, för de nya artiklarna och deras eventuella bilder.) Att ha kategori tycker jag också låter bra, och istället för den nuvarande utformningen någon form av notis/kommentar, även i framtiden med hjälpsamma länkar för att lämna eventuell feedback. flinga 16 juli 2015 kl. 14.53 (CEST)
- "North Galapagos" var ett problem med utbredningsområdet för djur och växter. Det problemet finns inte på samma sätt här. Visst kan det finnas namn på regioner/län med "north" i, men det är en annan sak än beskrivningar av områden. Att översätta region/länsnamn är inget vi bör överlåta till en robot, utan det bör göras med urskiljnig. Se tex Kategori:Orter i Botswana där det finns regioner med namn som "Northwest" och "Southern". Det är inte självklart att sådant ska översättas till "Nordvästra" etc, även om det kan diskuteras. Vi översätter ju inte Nya Jork eller Mald köttbit. -- Innocent bystander (diskussion) 16 juli 2015 kl. 18.26 (CEST)
- I bot-texten kommer också att dyka upp uttryck som "X ligger i provinsen Northwest Province". Jag anger alltid den svenska benämningen (t.ex. "provins") på saker och ting, och ibland är antingen en inhemsk eller engelsk benämning inkluderad i själva provinsnamnet på GeoNames. Däremot blir det helsvenskt i beskrivningar: "X ligger i nordvästra delen av landet."
- Håller med om att bilderna bör bli föremål för en egen diskussion. Men bilderna är sista steget i processen, en helt separat botkörning, så det är ingen brådska. Lsj (diskussion) 16 juli 2015 kl. 18.45 (CEST)
- Har skapat en ny version av botmallen som lägger varningstexten i en not istället. Se
{{robotskapadnot}}
och Användare:Lsjbot/geotest/Zarghūn Shahr (samhälle). Har inte ändrat i själva texten, men det är förstås enkelt att göra. Är det något sådant du efterlyser, flinga?
- "North Galapagos" var ett problem med utbredningsområdet för djur och växter. Det problemet finns inte på samma sätt här. Visst kan det finnas namn på regioner/län med "north" i, men det är en annan sak än beskrivningar av områden. Att översätta region/länsnamn är inget vi bör överlåta till en robot, utan det bör göras med urskiljnig. Se tex Kategori:Orter i Botswana där det finns regioner med namn som "Northwest" och "Southern". Det är inte självklart att sådant ska översättas till "Nordvästra" etc, även om det kan diskuteras. Vi översätter ju inte Nya Jork eller Mald köttbit. -- Innocent bystander (diskussion) 16 juli 2015 kl. 18.26 (CEST)
- Okej, det är vettigt när det gäller region/läns/ortnamn, jag håller helt med er (i vissa fall är den svenska benämningen densamma engelska/andra inhemska benämningar, förutom New York t ex North Dakota ojmr, och Uttar Pradesh, och då är de ju egentligen också svenska namn emm, i andra fall finns orten knappt omnämnd i svenska texter och då har vi ju också just bara den inhemska benämningen att falla tillbaka på). Så det låter vettigt, likadant bra angående bilderna. En till, mindre, fråga som dök upp för mig nu (och kanske är det redan diskuterat om) är om engelskspråkiga namn.. är det så att de inhemska prioriteras före de engelskspråkiga? (I flera fall är väl inhemska namn också "på engelska", hur man nu drar den gränsen för vad som är på ett språk eller ett annat (är "Berlin" svenska eller tyska? :) både och emm), men om det förekommer fall med både inhemska och engelskspråkiga benämningar.) Språket i exempel-artikeln tycker jag ser oklanderligt ut, och även de andra test-ortsartiklarna jag sett tror jag har sett lika bra ut.
- Notisen/mallen ser bra ut men borde kanske ligga fristående under käll-rubriken? Eftersom den kommenterar hela artikeln, så att säga, tänker jag. Säkert lär många ha synpunkter på frågan om robotmallen. Har lite ont om tid nu men återkommer! flinga 17 juli 2015 kl. 12.20 (CEST)
- Noten tål förvisso att funderas på och diskuteras. Vad är bästa platsen för en sådan diskussion? Malldiskussion:Robotskapad rimligen, men hur många bevakar den?
- När det gäller namn på olika språk har GeoNames dels en "grundform" av namnet för varje plats, och dels ett antal alternativa namn. Många (men inte alla) av alternativformerna är märkta med vilket språk de är på. Grundformen är ofta det lokala namnet (transkriberat till latinska alfabetet), men ibland är det på engelska. Namn på olika språk ges med respektive språks skriftsystem. Jag använder de olika namnformerna så här:
- Som artikelnamn används en svenskmarkerad namnform om sådan finnes. Annars används grundformen.
- I artikeln nämns alla namnformer på språk som talas i landet (om de inte sammanfaller med artikelnamnet).
- Omdirigeringar från alternativa namnformer skapas enligt Wikipediadiskussion:Omdirigeringar#Konsensus saknas?.
- Lsj (diskussion) 17 juli 2015 kl. 14.20 (CEST)
- Det låter som en bra genomtänkt arbetsgång när det gäller namnen, bra att det finns en genomtänkt metodik för det. Fundering: kan det då vara så att i enstaka fall så listas en benämning på engelska istället för det lokala? I så fall kan det ju vara något som man kan ha som ett mindre projekt, kontrollera "misstänkta" fall av engelska namn? Det låter som att det har mer än 90%-ig tillförlitlighet, om man utgår från att vi normalt förutom svenskspråkiga namn vill ha lokala namn.
- Jo, det borde ju vara en passande plats egentligen, fast få ser den där.. man kan i så fall lägga en notis på Bybrunnen som man gör ibland, för att dirigera om diskussionen, kanske? Jag tänker att huvudargumentet är att dagens modell på notis (vi kan ju beroende på folks tyckande antingen ändra den gamla modellen, eller införa en ny parallellt för denna körningar, om det saknas konsensus för ersättande.. om gemenskapen kommer fram till att de är okej med det.) Jag kan för min del inte lova att jag kan vara särskilt aktiv i diskussioner det närmaste, för min del tyvärr, det är risk att jag inte har tiden till det riktigt. flinga 18 juli 2015 kl. 15.03 (CEST)
- Har inte läst hela diskussionen, men jag vill uttala mitt något senkomna stöd till projektet.--ボスニア (diskussion) 30 juli 2015 kl. 15.10 (CEST)
Vitsen med denna typ av artiklar
[redigera wikitext]Bara för att vara lite jobbig: 1) Finns det någon efterfrågan bland läsarna på den här typen av artiklar? Går det att utläsa någonting från det tidigare projektet med livsformer? Används den informationen? 2) Kan man tänka sig att artiklarna genereras som undersidor till en projektsida och därefter lyfts manuellt in i artikelrymden vid behov (så får vi en manuell kvalitetskontroll och kan slippa den där tråkiga varningsskylten)? (Ursäkta om detta har vevats förut, jag hänger inte med i allt som skrivs här.) Bästa hälsningar, eder förtrogne Marfuas (diskussion) 20 juni 2015 kl. 20.31 (CEST)
- Ja det är en god efterfrågan på både artiklar om livsformer och om geografiska entititer. Att vi hade dessa artiklar var avgörande för att några universitet i sin kurser gav studenter i uppgifter skriva artiklar om dessa småkryp, som sedan blev excellenta artiklar. Absolut inte undersidor, hela frågan (som besvarats med ja) är om att skapa artiklar i artikelrymden.Yger (diskussion) 20 juni 2015 kl. 20.36 (CEST)
- Sjöartiklarna ser jag som alldeles utmärkta botgenererade artiklar, som dessutom är mycket användbara. Orter tycker jag personligen är till nytta och något som "alla" kan ta till sig.--Historiker (diskussion) 20 juni 2015 kl. 20.39 (CEST)
- Jag har kört Slumpartikel en stund nu och tittat på sidvisningsstatistiken för de botartiklar som dykt upp där. En typisk botartikel har 5-10 sidvisningar per månad. Det är låter inte speciellt mycket -- men med över en miljon botskapade artiklar betyder det att det totalt sett läses någon botskapad artikel på svwp 3 gånger i sekunden! Av totala antalet sidvisningar på svwp står de botskapade artiklarna för knappt 10%. Efterfrågan från läsarna är inte helt försumbar. Lsj (diskussion) 20 juni 2015 kl. 22.41 (CEST)
- Vi ägnar oss inte åt något kommersiellt. Alltså är frågan om efterfrågan totalt irrelevant. Den får mig att se rött, det erkänner jag villigt. Tostarpadius (diskussion) 20 juni 2015 kl. 23.42 (CEST)
- Jag menade absolut inte efterfrågan som i kommersiell efterfrågan, utan mer: Är det någon påvisad nytta med de här artiklarna? Och det är det ju, så då torde den här delen av frågan vara avgjord. Marfuas (diskussion) 21 juni 2015 kl. 09.58 (CEST)
- För mig är även behovet av påvisad nytta tveksamt. Kunskap har ett värde i sig. Jag ser dock ingen anledning att tvista om detta här och nu. Tostarpadius (diskussion) 21 juni 2015 kl. 10.05 (CEST)
- Kunskap har egenvärde, absolut. Men inte är väl en Wikipedia-artikel kunskap? Marfuas (diskussion) 21 juni 2015 kl. 10.28 (CEST)
- @Marfuas: Naturligtvis är wikipedia-artiklar kunskap. Hur tänker du annars?--LittleGun (diskussion) 21 juni 2015 kl. 10.32 (CEST)
- (Långt utanför ämnet, men i alla fall.) Kunskap är väl "sann berättigad tro", och inte kan en Wikipedia-artikel tro någonting? Jag tillhör dem som menar att kunskap har egenvärde. Även kunskap om tortyr och att begå bedrägerier har egenvärde. Men det kan ju inte rimligen finnas ett egenvärde i att det finns Wikipedia-artiklar helt frikopplat från att någon läser dem (t.ex. om det fanns hårddiskar med Wikipedia-artiklar på havets botten). Marfuas (diskussion) 21 juni 2015 kl. 15.39 (CEST)
- Jag ser det nog lite annorlunda. Jag har skapat (manuellt) artiklar om alla gamla landskommuner som funnits i Sverige. De är mycket få som tittar på dem, närmast färre per artikel än de som läser om lsjbots arter. Och jag ser ändå de tillför stort värde för läsaren. Först då det går länka till dem i andra artiklar, och även om folk inte klickar på länken så ger den större kvalitet och kunskap till den artikeln det länkas från. Man vet begreppet finns och är dokumenterat. Viktigare dock ser jag att en läsare vet att "alla" landskommuner finns här dvs om man söker på ett landskommunnamn och får "ej finns" så får man vet det verkligen inte funnits någon sådan kommun, och inte bara att begreppet kanske finns men det saknas en artikel om den på Wikipedia.Yger (diskussion) 21 juni 2015 kl. 15.52 (CEST)
- Jag håller med Yger här. Kanske ingen läser en av min artiklar på ett halvår, men sedan snubblar någon in där pga en länk för att den hade intresse att lära sig mer. Hade inte artikeln funnits så hade inte denna personen lärt sig det utan gått vidare i ovisshet. Min [första skapade artikel, Parral har de senaste 90 dagarna haft 52 views, inte mycket att hänga i granen, men den är läst. Vem vet, snart kanske det kommer en jordbävning där och alla undrar var i Chile det ligger. Då finns det där. Samma med detta botprojektet, det kan vara naturkatastrofer, mord, kändisbröllop eller krig... att kunna länka till platsen med en karta och lite information kan vara väldigt viktigt och bra för media. Jag ser oftare och oftare hur ex aftonbladet och DN länkar till artiklar, ofta på svwp, men när det saknas blir det till enwp. Varför inte göra det lättare för dem med? Adville (diskussion) 21 juni 2015 kl. 20.56 (CEST)
- Jag menade inte så. Det var en filosofisk reflektion om att värdet av en wp-artikel måste ju uppstå när någon läser den eller åtminstone att det finns en möjlighet att någon läser den. även om detta kanske händer långt in i framtiden. Marfuas (diskussion) 22 juni 2015 kl. 07.38 (CEST)
- och jag kontrade med att värde uppstår även om en person inte läser den, det räcker med vetskapen om att den finns för att ge värde.Yger (diskussion) 22 juni 2015 kl. 08.11 (CEST)
- Ett viktigt värde kommer också med att "skapa eller utöka" artikeln. Just det värdet blir rejält devalverat här. Jag lärde mig mycket om Botswana när jag gjorde det jobbet, men jag undrar om Lsj kommer att märka någon skillnad i värde räknat mellan att skapa 10 000 eller 100 000 artiklar i Andorra. -- Innocent bystander (diskussion) 22 juni 2015 kl. 08.30 (CEST)
- och jag kontrade med att värde uppstår även om en person inte läser den, det räcker med vetskapen om att den finns för att ge värde.Yger (diskussion) 22 juni 2015 kl. 08.11 (CEST)
- Jag menade inte så. Det var en filosofisk reflektion om att värdet av en wp-artikel måste ju uppstå när någon läser den eller åtminstone att det finns en möjlighet att någon läser den. även om detta kanske händer långt in i framtiden. Marfuas (diskussion) 22 juni 2015 kl. 07.38 (CEST)
- Jag håller med Yger här. Kanske ingen läser en av min artiklar på ett halvår, men sedan snubblar någon in där pga en länk för att den hade intresse att lära sig mer. Hade inte artikeln funnits så hade inte denna personen lärt sig det utan gått vidare i ovisshet. Min [första skapade artikel, Parral har de senaste 90 dagarna haft 52 views, inte mycket att hänga i granen, men den är läst. Vem vet, snart kanske det kommer en jordbävning där och alla undrar var i Chile det ligger. Då finns det där. Samma med detta botprojektet, det kan vara naturkatastrofer, mord, kändisbröllop eller krig... att kunna länka till platsen med en karta och lite information kan vara väldigt viktigt och bra för media. Jag ser oftare och oftare hur ex aftonbladet och DN länkar till artiklar, ofta på svwp, men när det saknas blir det till enwp. Varför inte göra det lättare för dem med? Adville (diskussion) 21 juni 2015 kl. 20.56 (CEST)
- Jag ser det nog lite annorlunda. Jag har skapat (manuellt) artiklar om alla gamla landskommuner som funnits i Sverige. De är mycket få som tittar på dem, närmast färre per artikel än de som läser om lsjbots arter. Och jag ser ändå de tillför stort värde för läsaren. Först då det går länka till dem i andra artiklar, och även om folk inte klickar på länken så ger den större kvalitet och kunskap till den artikeln det länkas från. Man vet begreppet finns och är dokumenterat. Viktigare dock ser jag att en läsare vet att "alla" landskommuner finns här dvs om man söker på ett landskommunnamn och får "ej finns" så får man vet det verkligen inte funnits någon sådan kommun, och inte bara att begreppet kanske finns men det saknas en artikel om den på Wikipedia.Yger (diskussion) 21 juni 2015 kl. 15.52 (CEST)
- (Långt utanför ämnet, men i alla fall.) Kunskap är väl "sann berättigad tro", och inte kan en Wikipedia-artikel tro någonting? Jag tillhör dem som menar att kunskap har egenvärde. Även kunskap om tortyr och att begå bedrägerier har egenvärde. Men det kan ju inte rimligen finnas ett egenvärde i att det finns Wikipedia-artiklar helt frikopplat från att någon läser dem (t.ex. om det fanns hårddiskar med Wikipedia-artiklar på havets botten). Marfuas (diskussion) 21 juni 2015 kl. 15.39 (CEST)
- @Marfuas: Naturligtvis är wikipedia-artiklar kunskap. Hur tänker du annars?--LittleGun (diskussion) 21 juni 2015 kl. 10.32 (CEST)
- Kunskap har egenvärde, absolut. Men inte är väl en Wikipedia-artikel kunskap? Marfuas (diskussion) 21 juni 2015 kl. 10.28 (CEST)
- För mig är även behovet av påvisad nytta tveksamt. Kunskap har ett värde i sig. Jag ser dock ingen anledning att tvista om detta här och nu. Tostarpadius (diskussion) 21 juni 2015 kl. 10.05 (CEST)
- Jag menade absolut inte efterfrågan som i kommersiell efterfrågan, utan mer: Är det någon påvisad nytta med de här artiklarna? Och det är det ju, så då torde den här delen av frågan vara avgjord. Marfuas (diskussion) 21 juni 2015 kl. 09.58 (CEST)
- Vi ägnar oss inte åt något kommersiellt. Alltså är frågan om efterfrågan totalt irrelevant. Den får mig att se rött, det erkänner jag villigt. Tostarpadius (diskussion) 20 juni 2015 kl. 23.42 (CEST)
- Jag har kört Slumpartikel en stund nu och tittat på sidvisningsstatistiken för de botartiklar som dykt upp där. En typisk botartikel har 5-10 sidvisningar per månad. Det är låter inte speciellt mycket -- men med över en miljon botskapade artiklar betyder det att det totalt sett läses någon botskapad artikel på svwp 3 gånger i sekunden! Av totala antalet sidvisningar på svwp står de botskapade artiklarna för knappt 10%. Efterfrågan från läsarna är inte helt försumbar. Lsj (diskussion) 20 juni 2015 kl. 22.41 (CEST)
- Sjöartiklarna ser jag som alldeles utmärkta botgenererade artiklar, som dessutom är mycket användbara. Orter tycker jag personligen är till nytta och något som "alla" kan ta till sig.--Historiker (diskussion) 20 juni 2015 kl. 20.39 (CEST)
- (Yger, Adville och andra berörda/intresserade): Marfuas pratar alltså som jag förstår det om frågan ifall information i sig har ett värde, eller om den har ett värde först när det finns möjlighet att människor använder den. Om vi tänker oss att vi kunde skapa ett uppslagsverk med mänsklighetens samlade vetskap, som skulle uppstå på dvärgplaneten Pluto och som vi visste skulle självförstöras
om en tänkande/kännande varelse (t ex en människa) kom inom en radie på 100 kilometers avståndvid den blotta händelsen att något levande subjekt som kunde förstå dess innehåll på något sätt försökte få ut kunskapen ur uppslagsverket. Hade vetskapen om det uppslagsverkets existens gett ett värde? Hade uppslagsverket i sig haft ett värde? Jag har i alla fall svårt att se nyttan. - ”så ger den större kvalitet och kunskap till den artikeln det länkas från. Man vet begreppet finns och är dokumenterat.” – här menar jag att det är det att en annan artikels existens ger mer information i något en potentiell läsare läser om (instrumentellt/extrinsikalt värde). Inte att existensen av informationen i sig har ett värde (intrinsikalt värde). (Detta inlägg är alltså inte riktat som en kommentar till botprojektet, utan till frågan om värdet av information som kom upp här.) flinga 23 juni 2015 kl. 12.12 (CEST)
- Liknelsen med bibliotek på Pluto är inte relevant i denna filosofiska diskussion. det handlar om värdet av att ha en "möjlighet" slå upp ett fakta även fast man sedan inte gör det. En databs på Pluta finns det ingen möjlighet accessa.Yger (diskussion) 23 juni 2015 kl. 17.23 (CEST)
- Yger: javisst, men då är frågan en annan än den om informationens värde i sig. Om värdet vilar på att informationen går att använda, så är det strikt talat inte frågan om att informationen har ett värde i sig. Det var vad Marfuas var inne på såvitt jag vet, och vad jag försökte klargöra. (I den filosofiska frågan som Marfuas tog upp är alltså liknelsen helt central, men inte för den filosofiska värdediskussionen om den praktiska nyttan av information här. Att (relevant, som vi säger) information som sällan efterfrågas, men kan efterfrågas, har ett nytto-värde tycker jag också.) flinga 1 juli 2015 kl. 19.42 (CEST)
- Liknelsen med bibliotek på Pluto är inte relevant i denna filosofiska diskussion. det handlar om värdet av att ha en "möjlighet" slå upp ett fakta även fast man sedan inte gör det. En databs på Pluta finns det ingen möjlighet accessa.Yger (diskussion) 23 juni 2015 kl. 17.23 (CEST)
- (Yger, Adville och andra berörda/intresserade): Marfuas pratar alltså som jag förstår det om frågan ifall information i sig har ett värde, eller om den har ett värde först när det finns möjlighet att människor använder den. Om vi tänker oss att vi kunde skapa ett uppslagsverk med mänsklighetens samlade vetskap, som skulle uppstå på dvärgplaneten Pluto och som vi visste skulle självförstöras
- Att genomföra ett sådant här projekt är mycket lärorikt. Jag lärde mig massor om arter och taxonomi genom artprojektet. Geografiprojektet så här långt har framförallt gett mig insikter i mångfalden av administrativa system bland världens länder, men jag räknar med att lära mig åtskilligt om varje land efter hand som jag kör enskilda länder. Sedan spelar det exakta antalet artiklar i varje land förstås mindre roll. Jag tycker dock inte "devalverat" är rätt ord, snarare finns det en avtagande marginalnytta för skaparen när antalet artiklar blir mycket stort. Men för både skapare och läsare finns ett egenvärde i att en samling artiklar blir komplett. Lsj (diskussion) 22 juni 2015 kl. 08.43 (CEST)
@Lsj: Vet vi hur ofta Google och andra maskiner tittar på varje sida? Alltså, har vi någon aning om huruvuda det är 5-10 sidvisningar av människor eller robotar? (Jag frågar av ren nyfikenhet, det är inget argument mot projektet.) Marfuas (diskussion) 21 juni 2015 kl. 10.28 (CEST)
- Sökmotorerna borde inte generera någon trafik som fastnar i räknaren. Vad gäller andra läsande robotar, så varierar det. Räknaren borde inte kunna se skillnad på en vanlig kolbaserad läsare och en robotbaserad, om de läser html-versionen av sidan. Men nu läser robotar vanligen inte html-versionen, utan en json eller xml-version, som inte ska fastna i statistiken. Robotar som redigerar i artiklarna, fastnar dock ofta i statistiken. -- Innocent bystander (diskussion) 21 juni 2015 kl. 11.13 (CEST)
- OK, tackar, Marfuas (diskussion) 21 juni 2015 kl. 15.39 (CEST)
- Marfuas har poänger. Det handlar om kvalitet. Artiklar med litet läsintresse anses inte encyklopediskt relevanta därför att få bevakar och få uppdaterar dem. Vem bevakar att inte felaktigheter läggs in avsiktligt eller av misstag vid manuellt efterhandsredigerade av bot-genererade artiklar? Kan någon prenumera på samtliga ändringar? Går Lsjbot och Nasko.bot igenom dem igen efter en tid för att uppdatera dem?
- Orter ställer högre krav på bevakning än djurarter därför att uppgifterna är mer föränderliga. Faktarutan är inga problem att en bot skriver över efter några år, men hur uppdaterar botten löpande text för en befintlig artikel som någon har redigerat manuellt?
- När Nasko.bot redigerar en befintlig sjöartikel verkar det mesta av den gamla texten lämnas kvar, endast ingressen, faktarutan och källförteckning ersätts, och dessutom verkar user:Nasko ofta redigera dem manuellt direkt efteråt. Förmodar att Lsjbot gör likadant, men vem gör den manuella efterhandsredigeringen? Kan man begränsa Lsjbots hastighet så att någon faktiskt hinner gå igenom alla artiklar manuellt, åtminstone alla befintliga (manuellt skapade men robotredigerade) artiklar? Finns det en grupp personer som genomför det arbetet, och hur fördelas arbetet dem emellan?Mange01 (diskussion) 22 juni 2015 kl. 17.01 (CEST)
- Det är lite därför jag vill ha en ny Geobox, som enklare tillåter att Wikidata kopplas in. Det ger en större användarbas som kan uppdatera artiklarna. -- Innocent bystander (diskussion) 22 juni 2015 kl. 18.02 (CEST)
- Även med nuvarande Geobox går det att lägga in hänvisningar till Wikidata, och jag har redan lagt in i botkoden att sådana länkar skapas när relevant info finns på Wikidata (vilket tyvärr är alltför sällan). Håller med Innocent bystander om att på sikt ska så mycket som möjligt läggas på wikidata. Jag ser framför mig massiva botprojekt om något år eller två som tröskar igenom alla geoboxar och taxoboxar och överför innehållet till Wikidata. Vad brödtexten beträffar så kan den uppdateras med bot bara så länge de aktuella formuleringarna fortfarande är identiska; Lsjbot har efterhandsfixat en del småsaker i brödtexten till art-artiklarna men det är inte helt enkelt. Lsj (diskussion) 22 juni 2015 kl. 18.19 (CEST)
- All min datalogiska intuition säger: Detta är ingen bra idé. Vi borde avvakta med alltihop, och i stället göra det på riktigt med hjälp av Wikidata när tiden är mogen. Det är inte bråttom att skapa artiklar om alla vadställen i Frankrike, det kan gott vänta något år. Felet är att vi sprider ut en massa ostrukturerade data på statiska webbsidor, all tillgänglig empiri (om databaser och slikt) säger att det är ogenomtänkt. Åtgärden är irreversibel och bevarar inte informationens struktur. Om vi dessutom ändå tänker oss att skrapa upp uppgifterna igen om något år är det ju (ursäkta min franska) ren idioti att sprida ut den nu. Det räcker ju med att någon har flyttat ett kommatecken för att det inte ska gå att återskapa informationen från artikeln. Det finns ingen som helst möjlighet att hålla koll på det vi skapar, det går inte att verifiera uppgifterna eller skydda artiklarna mot smart klotter. Inte bra, inte bra. Dixit, Marfuas (diskussion) 22 juni 2015 kl. 23.10 (CEST)
- Jag stöder det Marfuas skriver om att göra på rätt sätt. Målet måste vara att ta fram bra mallar (eller moduler) för diverse "faktarutor" där man kan lägga ansträngningen på att få den resulterande rutan/sidan att se så bra ut som möjligt på alla möjliga plattformar, från 30-tumsskärmar till små smartphone-skärmar och diverse läsplattor. Data till dessa mallar/moduler bör uteslutande hämtas från Wikidata. Det är viktigt att källgranska och fylla på data i WikiData, men det är något som inte behöver göras för varje språkutgåva. Även mallar/moduler för ingressen till vissa typer av artiklar bör övervägas, även om sådana kanske inte lika lätt kan göras språkoberoende. En robotskapad artikel bör då endast lägga ut anropen av mallar/moduler och sedan är det artikelnamnet som i kombination med mallen/modulen ser till att sidan fylls med rätt data och termer, allt hämtat från WikiData. Sådana "ingressmallar" finns, såvitt jag förstår, inte idag utan formuleringarna är inbyggda i koden för de robotar som skapat artiklarna, vilket gör det väldigt svårt för någon annan än robotägaren att ändra på till exempel en formulering i ingressen så att det slår igenom på samtliga artiklar av den aktuella typen. En artikel om en svamp skulle alltså enligt detta scenario börja med ett anrop till mallen (eller modulen)
{{Taxobox_utan_parametrar}}
och ett annat anrop till mallen/modulen{{svampartikelingress}}
. Inget av dessa mall/modulanrop ska i normalfallet behöva ha några parameter eftersom dessa mallar/moduler med hjälp av namnet på artikeln de finns i, {{PAGENAME}}, hämtar allt de behöver från WikiData. Detta är min vision som nu bara väntar på att krossas. --Larske (diskussion) 23 juni 2015 kl. 00.09 (CEST)
- Jag stöder det Marfuas skriver om att göra på rätt sätt. Målet måste vara att ta fram bra mallar (eller moduler) för diverse "faktarutor" där man kan lägga ansträngningen på att få den resulterande rutan/sidan att se så bra ut som möjligt på alla möjliga plattformar, från 30-tumsskärmar till små smartphone-skärmar och diverse läsplattor. Data till dessa mallar/moduler bör uteslutande hämtas från Wikidata. Det är viktigt att källgranska och fylla på data i WikiData, men det är något som inte behöver göras för varje språkutgåva. Även mallar/moduler för ingressen till vissa typer av artiklar bör övervägas, även om sådana kanske inte lika lätt kan göras språkoberoende. En robotskapad artikel bör då endast lägga ut anropen av mallar/moduler och sedan är det artikelnamnet som i kombination med mallen/modulen ser till att sidan fylls med rätt data och termer, allt hämtat från WikiData. Sådana "ingressmallar" finns, såvitt jag förstår, inte idag utan formuleringarna är inbyggda i koden för de robotar som skapat artiklarna, vilket gör det väldigt svårt för någon annan än robotägaren att ändra på till exempel en formulering i ingressen så att det slår igenom på samtliga artiklar av den aktuella typen. En artikel om en svamp skulle alltså enligt detta scenario börja med ett anrop till mallen (eller modulen)
- All min datalogiska intuition säger: Detta är ingen bra idé. Vi borde avvakta med alltihop, och i stället göra det på riktigt med hjälp av Wikidata när tiden är mogen. Det är inte bråttom att skapa artiklar om alla vadställen i Frankrike, det kan gott vänta något år. Felet är att vi sprider ut en massa ostrukturerade data på statiska webbsidor, all tillgänglig empiri (om databaser och slikt) säger att det är ogenomtänkt. Åtgärden är irreversibel och bevarar inte informationens struktur. Om vi dessutom ändå tänker oss att skrapa upp uppgifterna igen om något år är det ju (ursäkta min franska) ren idioti att sprida ut den nu. Det räcker ju med att någon har flyttat ett kommatecken för att det inte ska gå att återskapa informationen från artikeln. Det finns ingen som helst möjlighet att hålla koll på det vi skapar, det går inte att verifiera uppgifterna eller skydda artiklarna mot smart klotter. Inte bra, inte bra. Dixit, Marfuas (diskussion) 22 juni 2015 kl. 23.10 (CEST)
- Även med nuvarande Geobox går det att lägga in hänvisningar till Wikidata, och jag har redan lagt in i botkoden att sådana länkar skapas när relevant info finns på Wikidata (vilket tyvärr är alltför sällan). Håller med Innocent bystander om att på sikt ska så mycket som möjligt läggas på wikidata. Jag ser framför mig massiva botprojekt om något år eller två som tröskar igenom alla geoboxar och taxoboxar och överför innehållet till Wikidata. Vad brödtexten beträffar så kan den uppdateras med bot bara så länge de aktuella formuleringarna fortfarande är identiska; Lsjbot har efterhandsfixat en del småsaker i brödtexten till art-artiklarna men det är inte helt enkelt. Lsj (diskussion) 22 juni 2015 kl. 18.19 (CEST)
- Det är lite därför jag vill ha en ny Geobox, som enklare tillåter att Wikidata kopplas in. Det ger en större användarbas som kan uppdatera artiklarna. -- Innocent bystander (diskussion) 22 juni 2015 kl. 18.02 (CEST)
- OK, tackar, Marfuas (diskussion) 21 juni 2015 kl. 15.39 (CEST)
- Jag har full förståelse för det principiella resonemanget som Marfuas och Larske framför, åtminstone vad gäller infoboxar. Men jag är rädd att ni låter det bästa bli det godas fiende här.
- För infoboxar finns framtiden i wikidatakopplingar, där är vi överens. Men att lägga data på vanligt sätt i en infobox är en reversibel process, informationen förblir strukturerad, och i princip allt som lämpar sig som wd-egenskaper ligger i infoboxen och kan läsas ut igen. Om man är bekymrad över klotter i infoboxen, så kan man till nöds gå tillbaka i historiken när man läser av. Därför är "vanligt" botskapande inte en så destruktiv irreversibel process som Marfuas hävdar.
- "Ingressmallar" för att skapa hela artikelns brödtext från Wikidata tror jag däremot inte alls på, av flera skäl:
- Artiklarna blir omöjliga att redigera för den som inte är expert på modulkod, vilket helt strider mot Wikipedia grundidé.
- Det är långt ifrån allt i brödtexten som lämpar sig som wd-egenskaper. Om vi tittar på Användare:Lsjbot/geotest/Thākurgaon, så är hela andra stycket i brödtexten olämpligt att försöka mall-generera, liksom den del av första stycket som lyder: "i den nordvästra delen av landet, 300 km nordväst om huvudstaden Dacca."
- En mall/modul för brödtext skulle bli extremt komplex, med en mängd olika alternativ i koden beroende bland annat på vilken info som finns och inte finns för varje artikel, och vilken platstyp artikeln handlar om, och skulle i sig bli svår att underhålla. Det skulle heller inte vara lätt att porta den mellan språk, särskilt om språken har olika struktur. Jag tror ni underskattar komplexiteten bakom botartiklarnas brödtext.
- Mallgenererad brödtext skulle bli mycket torftig, ännu sämre än vanliga botartiklar, och skulle inte heller kunna förbättras av vanliga användare. Därför är det ett sämre alternativ. Däremot bör infoboxar på sikt genereras från wikidata, men jag håller inte med om att vi i väntan på det ska avstå från att skapa artiklar. Lsj (diskussion) 23 juni 2015 kl. 08.43 (CEST)
- "Ingressmallar" för att skapa hela artikelns brödtext från Wikidata tror jag däremot inte alls på, av flera skäl:
- @Lsj: När jag skrev om "ingresser" ovan så avsåg jag inte hela brödtexten i en omfattande artikel utan endast den allra första delen, 1-2 meningar. Resten måste givet skrivas på annat sätt. För att illustrera vad jag menade har jag gjort en testmodul på nlwp, se exempel här. En klar fördel som jag ser med detta sätt är att man inte måste (robot)redigera om tusentals artiklar bara för att man upptäcker att det blivit något stavfel, extra blanktecken eller felplacerat kommatecken i den robotskapade inledningsmeningen. Man ändrar bara i modulen och sedan generar wikipediaservern om berörda sidor "på ledig tid". Och vill man ändra så att Basidiesvampar stavas med gement b så ändrar man det förstås i WikiData. Även om det är en tröskel att gå in och ändra i moduler så är det betydligt fler som kan lära sig att göra det och det kan blir snabbare gjort än när det är en enda robothusse/matte som måste ta sig tid att göra sådana rättningar. Jag upptäckte medan jag skrev detta inlägg att jag hade missat kursiveringen av artikelnamnet, det första ordet i ingressen. Det tog inte många sekunder att rätta till detta, men om jag släppt lös en robot att generera en ziljon artiklar så hade det inte gått lika snabbt. --Larske (diskussion) 24 juni 2015 kl. 01.03 (CEST)
- Att botskripten är komplexa har jag full förståelse för, och absolut att mallarna skulle bli nästan obegripligt komplexa om alla uppgifter hämtades från Wikidata. Men just det är väl inget argument? Går det inte att generera mallarna med skript? Eller yacc eller nåt i den stilen? Mallarna kan väl se ut hursomhelst, bara artiklarna blir bra. Ett annat spår: Om vi menar allvar med att generera miljontals artiklar på det här sättet så kanske det är bättre att påverka hela gemenskapen så att verktygen anpassas efter ändamålet, i stället för att envisas med att försöka skruva i en skruv med en hammmare. Allltså, att vi jobbar för att förändra eller utöka wikimedia-tekniken så att det blir enklare att generera parametriserad brödtext som kan uppdateras dynamiskt från Wikidata (eller andra källor). Mallarna är (uppfattar jag det som) egentligen inte tänkta att användas på det sätt som vi faktiskt använder dem. De är tänkta att göra enkla substitutioner av textbitar, eller hur? Annat, också rätt ambitiöst spår: Jag har själv i tjänsten hållt på en del med (eller kanske rättare utsatts för) natural language generation, det är ju ett helt forskningsområde där det finns en del resultat som vi kunde kolla upp. Konventionella "one-off" botskript passar inte, det är ganska uppenbart. (Jag bara spånar lite.) Marfuas (diskussion) 24 juni 2015 kl. 10.50 (CEST)
- Samtidigt som det kan vara frestande med en
{{Taxobox_utan_parametrar}}
så kan det vara nyttigt att tillåta parametrar, för att "köra över" den data som hämtas från Wikidata. Det kan tex vara nyttigt i de fall där det förekommer redigeringskrig om Taipei ligger i Taiwan eller Republiken Kina. Vi har nyligen haft en ny lång diskussion på Wikidata om saken. Det här är inte bara ett problem med omstridda länder. Det kan finnas samma problem när det gäller länder som Storbrittanien, Nederländerna och Danmark. Vi på Wikipedia brukar lägga Nuuk i Grönland, medan vissa Wikidatianer tycker det ska stå Danmark där. Lika självklart ligger London i England enligt vissa. -- Innocent bystander (diskussion) 24 juni 2015 kl. 06.29 (CEST)- @Marfuas Jag kan hålla med om det mesta du skriver. Det går att skissa på mer optimala upplägg. Men å andra sidan måste man börja någonstans, och alla bidrag som förstärker Wikipedia bör uppmuntras, även om de inte är perfekta (men är något av våra manuella alster perfekta?)Yger (diskussion) 24 juni 2015 kl. 11.10 (CEST)
- Om det handlar om manuellt ihopknåpade artikel som det finns möjlighet att någon annan användare en dag förbättrar håller jag helt med. Där är alla bidrag positiva, även om det blir fel i början. Det är den normala gången, det är det som är Wikipedias "själ" (i brist på bättre term). Den processen har sina för- och nackdelar, men det fungerar ju uppenbarligen i merparten av fallen. Att skapa ett par miljoner artiklar i ett enda svep är någonting annat. (Hur många namngivna platser finns det öht? Hundratals miljoner?) Wikipedia är inte rätt system för det, anser jag, av många olika skäl. Ett bättre gränssnitt till publikt tillgängliga data är ingen dum idé, men statiska Wikipedia-sidor är helt fel verktyg. Och det brinner väl inte i knutarna? Finns det risker med att avvakta? Om vi har klarat oss sedan 2002 utan det här borde vi stå ut ett tag till, till exempel tills att tekniken har hunnit i fatt idén. Det tenderar ju att gå ganska fort på internet... Marfuas (diskussion) 25 juni 2015 kl. 08.59 (CEST)
- Och här har jag inte samma uppfattning. manuellt kommer vi aldrig på svwp orka manuellt skapa artiklar om alla orter i Mali, med botskapade blir dock kategorin komplett och med länkar till andra språkversioner. Detta är inte ett nytt gränssnitt utan precis detsamma vi har. Och om vi inte gör något kommer snart svwp bli irrelevant, alla sökningar går då till enwp, som är komplett, och där det snart erbjuds ett översättningsinterface. Så frågan är tidsmässigt akut. Bot är en teknik som finns nu, det går tänka sig ännu bättre lösningar men det går att bygga på de botskapade artiklarna. Med Lsj blir vi en del av teknikens framkant, om vi som du föreslår skall införa den bland de sista, har vi nog tyvärr redan blivit "omkörda" och inte bara missar vi artiklar om malis orten utan även tappar vi de läsare som på svenska vill läsa de artiklar vi manuellt skapat här men inte längre hittar hit.Yger (diskussion) 25 juni 2015 kl. 09.33 (CEST)
- Manuellt mass-skapande av artiklar, är något vi tyvärr inte har så goda erfarenheter av. -- Innocent bystander (diskussion) 25 juni 2015 kl. 09.51 (CEST)
- Och här har jag inte samma uppfattning. manuellt kommer vi aldrig på svwp orka manuellt skapa artiklar om alla orter i Mali, med botskapade blir dock kategorin komplett och med länkar till andra språkversioner. Detta är inte ett nytt gränssnitt utan precis detsamma vi har. Och om vi inte gör något kommer snart svwp bli irrelevant, alla sökningar går då till enwp, som är komplett, och där det snart erbjuds ett översättningsinterface. Så frågan är tidsmässigt akut. Bot är en teknik som finns nu, det går tänka sig ännu bättre lösningar men det går att bygga på de botskapade artiklarna. Med Lsj blir vi en del av teknikens framkant, om vi som du föreslår skall införa den bland de sista, har vi nog tyvärr redan blivit "omkörda" och inte bara missar vi artiklar om malis orten utan även tappar vi de läsare som på svenska vill läsa de artiklar vi manuellt skapat här men inte längre hittar hit.Yger (diskussion) 25 juni 2015 kl. 09.33 (CEST)
- Om det handlar om manuellt ihopknåpade artikel som det finns möjlighet att någon annan användare en dag förbättrar håller jag helt med. Där är alla bidrag positiva, även om det blir fel i början. Det är den normala gången, det är det som är Wikipedias "själ" (i brist på bättre term). Den processen har sina för- och nackdelar, men det fungerar ju uppenbarligen i merparten av fallen. Att skapa ett par miljoner artiklar i ett enda svep är någonting annat. (Hur många namngivna platser finns det öht? Hundratals miljoner?) Wikipedia är inte rätt system för det, anser jag, av många olika skäl. Ett bättre gränssnitt till publikt tillgängliga data är ingen dum idé, men statiska Wikipedia-sidor är helt fel verktyg. Och det brinner väl inte i knutarna? Finns det risker med att avvakta? Om vi har klarat oss sedan 2002 utan det här borde vi stå ut ett tag till, till exempel tills att tekniken har hunnit i fatt idén. Det tenderar ju att gå ganska fort på internet... Marfuas (diskussion) 25 juni 2015 kl. 08.59 (CEST)
- @Marfuas Jag kan hålla med om det mesta du skriver. Det går att skissa på mer optimala upplägg. Men å andra sidan måste man börja någonstans, och alla bidrag som förstärker Wikipedia bör uppmuntras, även om de inte är perfekta (men är något av våra manuella alster perfekta?)Yger (diskussion) 24 juni 2015 kl. 11.10 (CEST)
- @Lsj: När jag skrev om "ingresser" ovan så avsåg jag inte hela brödtexten i en omfattande artikel utan endast den allra första delen, 1-2 meningar. Resten måste givet skrivas på annat sätt. För att illustrera vad jag menade har jag gjort en testmodul på nlwp, se exempel här. En klar fördel som jag ser med detta sätt är att man inte måste (robot)redigera om tusentals artiklar bara för att man upptäcker att det blivit något stavfel, extra blanktecken eller felplacerat kommatecken i den robotskapade inledningsmeningen. Man ändrar bara i modulen och sedan generar wikipediaservern om berörda sidor "på ledig tid". Och vill man ändra så att Basidiesvampar stavas med gement b så ändrar man det förstås i WikiData. Även om det är en tröskel att gå in och ändra i moduler så är det betydligt fler som kan lära sig att göra det och det kan blir snabbare gjort än när det är en enda robothusse/matte som måste ta sig tid att göra sådana rättningar. Jag upptäckte medan jag skrev detta inlägg att jag hade missat kursiveringen av artikelnamnet, det första ordet i ingressen. Det tog inte många sekunder att rätta till detta, men om jag släppt lös en robot att generera en ziljon artiklar så hade det inte gått lika snabbt. --Larske (diskussion) 24 juni 2015 kl. 01.03 (CEST)
- Scenariot att enwp skulle konkurrera ut svwp tycker jag inte är ett gott skäl i sig. Om de gör det, så får vi hoppas att de har bättre information, och då är det inget problem om de har ett bra fungerande översättningsinterface, då kan vi kanske engagera oss i att få det projektet att bli bättre. Jag är tveksam till att det händer, men om enwp blir bättre än svwp även för de som inte talar engelska så har väl svwp i så fall mer eller mindre spelat ut sin roll. Att svwp är ett populärt projekt har inget värde i sig, det som har värde är att informationen finns tillgänglig. De artiklar som definitivt är bättre på svwp borde fortfarande ha läsare. Oavsett argumenten för botkörning i övrigt, så tycker jag alltså inte att vi ska vidta någon slags åtgärder i hast eller desperation för att det finns ett upplevt konkurrens-hot från enwp. (Rent tekniskt var det här ny info för mig.) flinga 3 juli 2015 kl. 12.29 (CEST)
- Sedan kunde det kännas tråkigt om det bleve så, även om vi ponerar att det inte spelade någon roll för informationstillgängligheten. Men jag tror i vilket fall inte riktigt/är tveksam till om att försöka matcha i någon mån i kvantitet är ett bra sätt att undkomma det, och lite omvänt (själv lite oklar över hur jag fick ihop det omvända förhållandet förut, något med skäl att..) tror jag inte att det att undkomma att bli irrelevant är ett bra skäl som argument för en botkörning (övriga skäl oaktade). Jag tror det är bättre om vi ser att det tillför nytta i sig för att sprida fri information. flinga 3 juli 2015 kl. 13.33 (CEST)
- Jag tycker nog du överförenklar så mycket att du missar poängen. Ta mina sockenartiklar. De går aldrig göra bra på enwp, och jag är mån folk kommer till dem. Men om svwp bara besår av in socknar, innebär det att när man säker efter en ort hamnar man på enwp, som då+ saknar länk till socknen, så folk "hittar" då inte längre till "mina" artiklar. Så utan kringartiklar undermineras basen och existensberättigandet av hela svwp, även de unikt bra.~Att ha många kringartiklar är i sin tur aldrig ett problem eftersom den då har länkar till andra språk. För mig är det inte centralt om dessa kringartiklar är korta eller enbart placeholders, de är oerhört viktiga ändå för svwp att vara sammanhanggande Yger (diskussion) 3 juli 2015 kl. 13.50 (CEST)
- Jag får tänka lite på det här, om jag har något att tillägga. Min tanke lite kortare var att jag tänker att yttre hot inte är någon bra utgångspunkt, eller som ensamt skäl kring hur vi ska utforma det här projektet – den tanken kan vara rätt eller fel. Alla läsare kommer inte internt från andra Wikipedia-artiklar, men de som gör det, jovisst, där vore det ett problem. Jag har svårt att bedöma hotets allvar, och hur mycket situationen skulle skilja sig från idag, enwp överträffar på många sätt ofta svwp idag tänker jag, och jag vet inte i vilken mån geografiartiklar i främmande länder hjälper kringliggande artiklar, s a s.. jag tänker att du menar att vi halkar efter i täckning. Som sagt, ska tänka och återkommer kanske. Jag tänker att vi i första hand bör utgå ifrån vad som gör svwp bäst som resurs för fri information, eller annorlunda formulerat kanske vad som bäst servar målet med fri uppslagsverksinformation. Och att det i första hand är på den grunden vi bör ta ställning till om en viss grupp av artiklar bör skapas eller ej (säger alltså inte att de inte bör det, jag har lite tankar apropå det med, men det får jag ta en annan gång om det blir av). Men jo, jag förstår vad du menar annars. Tror jag ju i varje fall :) flinga 3 juli 2015 kl. 21.29 (CEST)
- Scenariot att enwp skulle konkurrera ut svwp tycker jag inte är ett gott skäl i sig. Om de gör det, så får vi hoppas att de har bättre information, och då är det inget problem om de har ett bra fungerande översättningsinterface, då kan vi kanske engagera oss i att få det projektet att bli bättre. Jag är tveksam till att det händer, men om enwp blir bättre än svwp även för de som inte talar engelska så har väl svwp i så fall mer eller mindre spelat ut sin roll. Att svwp är ett populärt projekt har inget värde i sig, det som har värde är att informationen finns tillgänglig. De artiklar som definitivt är bättre på svwp borde fortfarande ha läsare. Oavsett argumenten för botkörning i övrigt, så tycker jag alltså inte att vi ska vidta någon slags åtgärder i hast eller desperation för att det finns ett upplevt konkurrens-hot från enwp. (Rent tekniskt var det här ny info för mig.) flinga 3 juli 2015 kl. 12.29 (CEST)
Skriver mitt inlägg här längst ner då jag inte vet var i diskussionen det hör hemma.
Min fråga är rätt enkel: Var finns relevansen i artiklar om platser i till exempel Samoa eller Afghanistan? Borde inte vår högsta prioritet kanske vara att fylla i röda länkar där geografiska platser länkas mest, som i födelse- och dödsplatser? Borde vi inte i så fall göra så vi har alla relevanta orter i till exempel USA, som vi på svwp kanske har en tydligare koppling till. En känsla säger mig att de allra flesta biografier på svwp, som inte rör svenska personer, rör personer från USA. Så borde det inte nödvändigtvis vara viktigast att göra så att alla dessa personers födelse-/dödsplatser görs till artiklar? Bara en fundering. |-DaftClub-|(diskussion) 25 juni 2015 kl. 02.40 (CEST)
- WP:Globalt perspektiv är en stor del av svaret -- om vi tycker byar i Sverige är relevanta, så är även byar i Samoa relevanta. Och USA täcks redan hyggligt med manuella insatser -- det är just i länder som många bryr sig mindre om som botkörning behövs. Men det är ju inte heller så att jag tänker negligera USA, det är bara inte rätt ställe att provköra på. Lsj (diskussion) 25 juni 2015 kl. 07.01 (CEST)
- @DaftClub: Relevansbegreppet har ju satts lite ur spel i och med de här botkörningarna. Det enda kriteriet för t.ex. artiklarna om livsformer är att uppgifterna är hämtade från en vederhäftig källa. Jag har uppfattat det som att villkoren för en artikels vara eller inte vara mer och mer handlar om verifiability än om notability även på andra språkversioner (vilket väl egentligen är bra, det gör spelreglerna lite enklare). Det här med att det ska finnas allmänintresse, "betydenhet" och reell möjlighet att korrigera fel osv (som det fortfarande står i WP:Relevans) gäller i princip bara nu levande personer och populärkultur. Egentligen kan man fråga sig varför. Varför raderar vi egentligen artiklar om rockband som inte har skivkontrakt med ett större musikförlag? Varför får en högstadieelev inte skriva en artikel om sin e-sportsklan? (Under förutsättning att uppgifterna finns i en tillgänglig och tillförlitlig databas.) Marfuas (diskussion) 25 juni 2015 kl. 09.09 (CEST)
- Jag håller inte med Marfuas om att relevansbegreppet har satts ur spel genom botkörningarna. Snarare tvärt om. De botsatsningar som har gjorts bygger på ett ämnesmässigt urval och tydligt definierade områden som passar bra för en heltäckande beskrivning - fasta geografiska och biologiska entiteter av etablerad och bestående karaktär, där varje enskild enhet sätts in i ett större sammanhang. Det är enligt min åsikt typexempel på encyklopediskt relevant information som i en generell mening passar alldeles utmärkt i ett uppslagsverk, även om man naturligtvis kan ifrågasätta det enskilda ämnet om man ser det isolerat från den samlade helheten. Jag kan tänka mig många andra ämnesområden där man skulle kunna göra likadant - historiska statschefer, vinnare av Tour de France, katolska kyrkans helgon, arkeologiska utgrävningar i Turkiet o s v. Listan kan göras oändlig, under förutsättning att det finns säkra och användbara källor. Men om någon skulle få för sig att köra bot som hämtar information ur databaser som innehåller uppgifter om världens alla garageband, division 6-spelare i bandy, läkarsekreterare eller platspåsetillverkare skulle i alla fall jag motsätta mig detta, just av relevansskäl. Den typen av enheter och begrepp har sällan en sådan generell och bestående karaktär eller noterbarhet att det är motiverat att frångå principen att varje ämne ska värderas individuellt. Däremot kan man med fog tycka att det stödsystem som vi använder för att fastställa relevansen - kriterierna - på sätt och vis har satts ur funktion. Inte mig emot, i och för sig... Men det är inte i första hand ett relevansproblem, utan mer ett problem som får konsekvenser för den praktiska hanteringen av relevansbedömningarna och urvalsprocessen. Så svaret på den övergripande frågan, om "vitsen med dessa artiklar", är ganska enkelt: De ger presumtiva läsare en god möjlighet att ta del av information som är väl lämpad för att beskrivas i ett uppslagsverk. Med det, Lsj, sällar jag mig till skaran som tillstyrker projektet, så länge som kvalitetsfrågorna kan hanteras på ett tillfredsställande sätt. Lindansaren (diskussion) 25 juni 2015 kl. 10.32 (CEST)
- Jag menar att det är helt ok att det gamla relevansbegreppet (betydenhet, reell möjlighet till kvalitetssäkring, allmänintresse) inte riktigt gäller längre, och att det är verifierbarhet som är det primära. Det gör det hela lite mindre godtyckligt. Den här frågan börjar spreta ut i många olika underfrågor, det är lite olyckligt. Marfuas (diskussion) 25 juni 2015 kl. 10.35 (CEST)
- Jag kan inte alls se det. Jag tycker absolut inte att världens arter ligger eller ett vadställe i Frankrike (kanske något tveksamt beroende på vad det är) är mindre relevant än ett garageband, tvärtom är det fortfarande manuellt skapade artiklar som ligger i botten på vad som kan ses som relevant. Kan inte heller se varför det skulle finnas mindre intresse av att utöka och förbättra en botartikel jämfört med en manuellt skapad. En djurart på borneo har garanterat funnits där i hundratusentals år om den hunnit utvecklas till en egen art. Om den inte utrotas kommer den om 500 år finnas kvar och fortfarande möta intresse från biologer och personer som bor eller besöker området där den förekommer. Även om den dör ut kommer troligen dess utdöende att intressera biologer och hur de påverkar livet i området. Ett vadställe är kanske tveksamt, men återigen är det väl tveksamt om vadställen kommer med, men floderna i vilken vadstället förekommer har i Frankrike troligen huvudsakligen funnits där sedan senaste istiden. Om vi antar att man baserar sig på kartor och vedertagna namn kommer de av att människor passerat över vadstället och gett det ett gemensamt namn, som kommit att markeras på kartor. Om floden finns kvar och inte ändrar sitt lopp kommer troligen vadstället att finnas kvar och intressera de som bor i eller besöker trakten. Ett garageband eller e-sportklan kommer att intressera de som är med i den. När de slutar kommer de kanske att minnas sin tid i bandet, men knappast kommer någon annan att göra det. När de är döda är intresset obefintligt. Då krävs det att e-sportsklanen eller garagebandet satt någon form av avtryck som gör att det finns ett intresse även utanför den närmast sörjande gruppen som gör att någon fortfarande intresserar sig.FBQ (diskussion) 27 juni 2015 kl. 12.41 (CEST)
- Jag tycker visst det är viktigt att artiklar har utsikter att kunna bli lästa, men jag är väldigt tveksam till om sidvisningar är något bra mått på allmänintresse. Ofta saknas interwikilänkar till artiklar liksom bra sökvägar. Vissa artiklar har stoppats in som länkar i årtalsartiklar och diverse översikter och mallar utan att riktigt förtjäna sin plats och hamnar högt på söklistor och får mer trafik än de förtjänar. Det är ju sådant som man på sikt kan försöka korrigera.--FBQ (diskussion) 27 juni 2015 kl. 12.55 (CEST)
- Jag kan inte alls se det. Jag tycker absolut inte att världens arter ligger eller ett vadställe i Frankrike (kanske något tveksamt beroende på vad det är) är mindre relevant än ett garageband, tvärtom är det fortfarande manuellt skapade artiklar som ligger i botten på vad som kan ses som relevant. Kan inte heller se varför det skulle finnas mindre intresse av att utöka och förbättra en botartikel jämfört med en manuellt skapad. En djurart på borneo har garanterat funnits där i hundratusentals år om den hunnit utvecklas till en egen art. Om den inte utrotas kommer den om 500 år finnas kvar och fortfarande möta intresse från biologer och personer som bor eller besöker området där den förekommer. Även om den dör ut kommer troligen dess utdöende att intressera biologer och hur de påverkar livet i området. Ett vadställe är kanske tveksamt, men återigen är det väl tveksamt om vadställen kommer med, men floderna i vilken vadstället förekommer har i Frankrike troligen huvudsakligen funnits där sedan senaste istiden. Om vi antar att man baserar sig på kartor och vedertagna namn kommer de av att människor passerat över vadstället och gett det ett gemensamt namn, som kommit att markeras på kartor. Om floden finns kvar och inte ändrar sitt lopp kommer troligen vadstället att finnas kvar och intressera de som bor i eller besöker trakten. Ett garageband eller e-sportklan kommer att intressera de som är med i den. När de slutar kommer de kanske att minnas sin tid i bandet, men knappast kommer någon annan att göra det. När de är döda är intresset obefintligt. Då krävs det att e-sportsklanen eller garagebandet satt någon form av avtryck som gör att det finns ett intresse även utanför den närmast sörjande gruppen som gör att någon fortfarande intresserar sig.FBQ (diskussion) 27 juni 2015 kl. 12.41 (CEST)
- Jag menar att det är helt ok att det gamla relevansbegreppet (betydenhet, reell möjlighet till kvalitetssäkring, allmänintresse) inte riktigt gäller längre, och att det är verifierbarhet som är det primära. Det gör det hela lite mindre godtyckligt. Den här frågan börjar spreta ut i många olika underfrågor, det är lite olyckligt. Marfuas (diskussion) 25 juni 2015 kl. 10.35 (CEST)
- Jag håller inte med Marfuas om att relevansbegreppet har satts ur spel genom botkörningarna. Snarare tvärt om. De botsatsningar som har gjorts bygger på ett ämnesmässigt urval och tydligt definierade områden som passar bra för en heltäckande beskrivning - fasta geografiska och biologiska entiteter av etablerad och bestående karaktär, där varje enskild enhet sätts in i ett större sammanhang. Det är enligt min åsikt typexempel på encyklopediskt relevant information som i en generell mening passar alldeles utmärkt i ett uppslagsverk, även om man naturligtvis kan ifrågasätta det enskilda ämnet om man ser det isolerat från den samlade helheten. Jag kan tänka mig många andra ämnesområden där man skulle kunna göra likadant - historiska statschefer, vinnare av Tour de France, katolska kyrkans helgon, arkeologiska utgrävningar i Turkiet o s v. Listan kan göras oändlig, under förutsättning att det finns säkra och användbara källor. Men om någon skulle få för sig att köra bot som hämtar information ur databaser som innehåller uppgifter om världens alla garageband, division 6-spelare i bandy, läkarsekreterare eller platspåsetillverkare skulle i alla fall jag motsätta mig detta, just av relevansskäl. Den typen av enheter och begrepp har sällan en sådan generell och bestående karaktär eller noterbarhet att det är motiverat att frångå principen att varje ämne ska värderas individuellt. Däremot kan man med fog tycka att det stödsystem som vi använder för att fastställa relevansen - kriterierna - på sätt och vis har satts ur funktion. Inte mig emot, i och för sig... Men det är inte i första hand ett relevansproblem, utan mer ett problem som får konsekvenser för den praktiska hanteringen av relevansbedömningarna och urvalsprocessen. Så svaret på den övergripande frågan, om "vitsen med dessa artiklar", är ganska enkelt: De ger presumtiva läsare en god möjlighet att ta del av information som är väl lämpad för att beskrivas i ett uppslagsverk. Med det, Lsj, sällar jag mig till skaran som tillstyrker projektet, så länge som kvalitetsfrågorna kan hanteras på ett tillfredsställande sätt. Lindansaren (diskussion) 25 juni 2015 kl. 10.32 (CEST)
- @DaftClub: Relevansbegreppet har ju satts lite ur spel i och med de här botkörningarna. Det enda kriteriet för t.ex. artiklarna om livsformer är att uppgifterna är hämtade från en vederhäftig källa. Jag har uppfattat det som att villkoren för en artikels vara eller inte vara mer och mer handlar om verifiability än om notability även på andra språkversioner (vilket väl egentligen är bra, det gör spelreglerna lite enklare). Det här med att det ska finnas allmänintresse, "betydenhet" och reell möjlighet att korrigera fel osv (som det fortfarande står i WP:Relevans) gäller i princip bara nu levande personer och populärkultur. Egentligen kan man fråga sig varför. Varför raderar vi egentligen artiklar om rockband som inte har skivkontrakt med ett större musikförlag? Varför får en högstadieelev inte skriva en artikel om sin e-sportsklan? (Under förutsättning att uppgifterna finns i en tillgänglig och tillförlitlig databas.) Marfuas (diskussion) 25 juni 2015 kl. 09.09 (CEST)
GeoNames
[redigera wikitext]@Lsj, Yger: mfl, jag har nu lagt in länkar till GeoNames i {{Ortsfakta Sverige}}
för en liten utvärdering av källan. Anropet är inte möjligt att (idag) styra annat än från Wikidata. Man skulle kunna lägga det direkt i Geoboxen också, så inte bara svenska orter kan använda det. -- Innocent bystander (diskussion) 28 juni 2015 kl. 12.50 (CEST)
- De fåtal kontakter jag haft på WD med denna property, är inte till det bättre. Jag hittade för några dagar sedan, att en artikel om en sportanläggning på enwp kopplats till en halvö på GeoNames. Nu igår hittade jag en artikel om en småort, som hade en kyrka på GeoNames kopplad till sig. I ett annat fall, har jag plockat bort en länk till en "gård" som var kopplad till en artikel om en ort. Det här säger nog iofs mer om hur GeoNames missbrukats på en.wikipedia, än hur bra källan är... -- Innocent bystander (diskussion) 29 juni 2015 kl. 05.17 (CEST)
- Ja jag tittade på några som du fått länk till Alsike länkar till församlingen inte orten, och underligt Alingsås inte hade en länk. I övrigt ganska OK, men siffror från 2005.Yger (diskussion) 29 juni 2015 kl. 10.10 (CEST)
- (Flyttat den länken till församlingsartikeln iställt)
- Jag har nu för övrigt lagt in den här länken i alla Geobox-baserade mallar, för att se mer av det globala genomslaget. Var inte rädd att återställa Geoboxen, om ni ser något konstigt. -- Innocent bystander (diskussion) 29 juni 2015 kl. 10.39 (CEST)
- Ja jag tittade på några som du fått länk till Alsike länkar till församlingen inte orten, och underligt Alingsås inte hade en länk. I övrigt ganska OK, men siffror från 2005.Yger (diskussion) 29 juni 2015 kl. 10.10 (CEST)
Jag har nyss kört igenom alla orter i Geonames och skapat en lista med wikidata-kopplingar. Har använt både Geonames-ID-propertyn på wikidata och lite andra knep och knåp för att identifiera kopplingar. Ska köra lite statistik på den listan och se hur väl det matchar globalt. Lämpligt att kolla är väl både att positionen är rätt, att instance-of är något vettigt, och att det inte blivit dubletter (samma wd-post kopplad till två gn-poster). Något mer? Lsj (diskussion) 29 juni 2015 kl. 10.49 (CEST)
- När du inte har något Wikidata-objekt eller när P1566 saknas, så lägg gärna in geonames=whatever. Det gör det lätt att sedan flytta datan till Wikidata. Sedan kan vi ta bort parametern när datat är överfört. Observera att en tom geonames-parameter gör att den kommer saknas i Geoboxen, även om det finns data på Wikidata. -- Innocent bystander (diskussion) 29 juni 2015 kl. 10.58 (CEST)
- I Geobox-mallen menar du? Jovisst, det ska jag göra. Lsj (diskussion) 29 juni 2015 kl. 11.01 (CEST)
- Tyvärr hittar jag ganska många fel i P1566 på Wikidata. Bland annat har åtskilliga franska kommuners Wikidatapost en P1566 som pekar på Geonames-posten för kommunhuvudorten. Lsj (diskussion) 1 juli 2015 kl. 22.43 (CEST)
- En del av problemen med länen som Innocent bystander tar upp nedan verkar bero på sådana fel i P1566 på Wikidata. I flera fall är både länets och landskapets Wikidataposter P1566-länkade till länets Geonames-post. Jämför t.ex. Blekinge län och Blekinge landskap. Sådant kommer att göra det knepigt att korrekt koppla Geonames-baserade artiklar till rätt Wikidata-post, vilket påverkar även Interwiki. Lsj (diskussion) 2 juli 2015 kl. 09.13 (CEST)
- Tyvärr hittar jag ganska många fel i P1566 på Wikidata. Bland annat har åtskilliga franska kommuners Wikidatapost en P1566 som pekar på Geonames-posten för kommunhuvudorten. Lsj (diskussion) 1 juli 2015 kl. 22.43 (CEST)
- I Geobox-mallen menar du? Jovisst, det ska jag göra. Lsj (diskussion) 29 juni 2015 kl. 11.01 (CEST)
- En liten utvärdering efter att ha gått igenom alla svenska län som fanns i databasen. Namnen är inte helt tillförlitliga. De shapefiler som syns i länken är inte heller att helt lita på. Att gränsen mellan Uppsala och Västmanlands län inte var uppdaterad, må så vara. Men Skåne län såg ut att vara det minsta länet i landet. Samma sak med Älvsborg och Skaraborgs län. -- Innocent bystander (diskussion) 1 juli 2015 kl. 12.02 (CEST)
- Hittat helt förväntade sammanblandningar av Härjedalens kommun med landskapet, Norrbottens och Västerbottens län med landskapet och liknande saker. En bebodd ort med namnet Haninge med 75000 invånare, någon? -- Innocent bystander (diskussion) 1 juli 2015 kl. 16.26 (CEST)
- De engelska namnen på länen varierar i om de inkluderar ordet "län" eller inte, men jag kan inte se att de är otillförlitliga på andra sätt. De svenska namnen på länen (finns under fliken "alternate names") är såvitt jag kan se korrekta. Geonames har separata poster för Härjedalens kommun och landskapet Härjedalen: [4], liksom för Norrbottens och Västerbottens län och landskap. Shapefilerna och kartvyn där de syns ingår inte i den nedladdningsbara Geonames-databasen och jag använder dem inte, så eventuella fel där spelar mindre roll. Norrbottens och Västerbottens län är dock inte alls hopblandade med landskapen där, utan visas såvitt jag kan se korrekt, inkluderande varsin halva av Lappland: [5][6]. Älvsborg och Skaraborg är korrekt klassificerade som historiska entiteter. Skåne län saknar tydligen shapefil och visas som en punktmarkering på kartan -- är det det du menar med att Skåne är litet? Haninge verkar dock vara ett genuint misstag, där kommunen även blivit tätort: [7]. Lsj (diskussion) 1 juli 2015 kl. 22.43 (CEST)
- Nja, jag har inte hittat några direkta fel i databasen, däremot hur den har använts på Wikidata. De felen är i sin tur hämtade från enwp. I min nedladdning har jag tyvärr inte fått med icke-ascii-tecknen på ett bra sätt. Jag får lära mig tolka krumelurerna där. Något som kanske inte är fel, men däremot lite knasigt, är att socknarna räknas som fjärde administrativa nivån. En annan rörig sak är att det kan vara svårt att veta vad uppslagen "Ydre", "Njudung" mfl avser. Är det häradet eller vad? "Småland" verkar inte vara klassificerad som andra landskap. Men det här med landskap är udda fåglar för icke-svenskar.
- En fundering jag fick inatt, är hur du bedömer vad som är huvudort för vilken administrativa enhet? Jag vet från mitt arbete med Polen, att det är vanligt där, att om en kommun saknar större ort, att administrationen ligger i grannkommunen. Något liknande hade vi ju här när Stockholm stad låg utanför Stockholms län. Något bra exempel har jag inte i min nedladdning, då jag bara laddat ner den för Sverige. -- Innocent bystander (diskussion) 2 juli 2015 kl. 09.40 (CEST)
- Det finns särskilda kategorier i GeoNames för huvudorter (PPLA,PPLA2 etc.) och dessa är sedan länkade till en kommun (motsvarande). Jag utgår från den länkningen. När jag kollar på ett gäng svenska kommuner så verkar det stämma, inklusive lustigheter som att både Skillingaryd och Vaggeryd står som huvudort för Vaggeryds kommun. Det blir också korrekt för Cebu City, som är huvudort för provinsen Cebu utan att ligga i provinsen. (Provinsen omfattar hela ön Cebu utom just Cebu City, vars kommun är självständig på provinsnivå.) - det borde vara ett parallellfall till de polska kommunerna.
- De engelska namnen på länen varierar i om de inkluderar ordet "län" eller inte, men jag kan inte se att de är otillförlitliga på andra sätt. De svenska namnen på länen (finns under fliken "alternate names") är såvitt jag kan se korrekta. Geonames har separata poster för Härjedalens kommun och landskapet Härjedalen: [4], liksom för Norrbottens och Västerbottens län och landskap. Shapefilerna och kartvyn där de syns ingår inte i den nedladdningsbara Geonames-databasen och jag använder dem inte, så eventuella fel där spelar mindre roll. Norrbottens och Västerbottens län är dock inte alls hopblandade med landskapen där, utan visas såvitt jag kan se korrekt, inkluderande varsin halva av Lappland: [5][6]. Älvsborg och Skaraborg är korrekt klassificerade som historiska entiteter. Skåne län saknar tydligen shapefil och visas som en punktmarkering på kartan -- är det det du menar med att Skåne är litet? Haninge verkar dock vara ett genuint misstag, där kommunen även blivit tätort: [7]. Lsj (diskussion) 1 juli 2015 kl. 22.43 (CEST)
- Hittat helt förväntade sammanblandningar av Härjedalens kommun med landskapet, Norrbottens och Västerbottens län med landskapet och liknande saker. En bebodd ort med namnet Haninge med 75000 invånare, någon? -- Innocent bystander (diskussion) 1 juli 2015 kl. 16.26 (CEST)
- Ja, det är konstigt att socknarna finns som "levande" administrativ enhet. Kategorin "region" (RGN) verkar bunta ihop både landskap och alla möjliga andra traditionella namn för landområden, t.ex. Bergslagen, Roslagen, Svealand, Pite Lappmark... Tveksamt om det är lämpligt att göra artiklar av dessa. Vad menar du med att Småland hanteras annorlunda? I min lista står Småland klassificerat tillsammans med de andra landskapen i RGN-kategorin. Enda skillnaden är att de landskap som helt ligger i ett län har en länskod, vilket t.ex. Småland och Lappland saknar. Lsj (diskussion) 2 juli 2015 kl. 14.43 (CEST)
- Socknarna är förstås inte levande som administrativ enhet, men kan väl jämföras med de nyligen införda distrikten, som dock inte har någon egen administration utan bara är en ren indelning av riket. De kan förstås också jämföras med Svenska kyrkans församlingar, som de har en gemensam historia med. Dammråtta (diskussion) 5 juli 2015 kl. 12.52 (CEST)
Hello, and sorry for writing in english. This map/geonames data is from 2011, at the time geonames had ~8 million entries, now ~10 million. I see that Lsj made a recent geonames world map, and i wonder if the distribution of features (colored H, P, T etc) has changed a lot? (i can read swedish via google translate) --Atlasowa (diskussion) 10 juli 2015 kl. 14.17 (CEST)
- Interesting map. An updated version can be done, but will require some rewriting of my mapmaking code to color by feature type. Lsj (diskussion) 13 juli 2015 kl. 09.25 (CEST)
Teränngen runt är platt/kuperad
[redigera wikitext]En av mycket få synpunkter jag har är att jag tycker det vore bra om det angavs hur det avgjordes om terrängen är platt eller kuperad. Som det är nu står det endast "Uppgiften baseras på variansen i alla höjduppgifter i GeoNames inom 30 km radie runt platsen.". Då undrar jag vilka varianser som anses som kuperade respektive platta. Kan man istället skriva "Uppgiften baseras på variansen i alla höjduppgifter i GeoNames inom 30 km radie runt platsen är mindre än x m." eller något annat? --افيراتير (diskussion) 13 juni 2015 kl. 19.51 (CEST)
- En global terrängmodell som är fri att använda är ASTER Global Digital Elevation Model. Jag tänkte använda den till sjöarna, men avstod. Thākurgaon är i ASTER GDEM 55 m ö.h. och Zarghūn Shahr 2122 m ö.h. Det går med andra ord komplettera med höjduppgifter om de saknas eller göra en korsreferens om man misstänker att datan håller dålig kvalitet. Nasko (diskussion) 13 juni 2015 kl. 20.08 (CEST)
- @Averater: Variansen avser vanlig statistisk varians uträknad för samtliga tillgängliga höjduppgifter inom 30 km. Sedan har jag satt tröskelvärden "för hand" genom att titta på variansen för några kända platser, och variansfördelningen i några kända länder (Holland ska bli nästan bara platt, och Schweiz till stor del bergigt). Så här ser koden ut:
elevationmean = elevationsum / nelev; elevationvar = elevationsquare / nelev - elevationmean * elevationmean; if (elevationvar < 10000.0) { terrain_type = "flat"; if (elevationmean > 1000) terrain_type += " high"; } else if (elevationvar < 80000.0) { terrain_type = "hilly"; if (elevationmean > 1000) terrain_type += " high"; } else if (elevationvar < 150000.0) terrain_type = "low-mountains"; else if (elevationvar < 250000.0) terrain_type = "medium-mountains"; else terrain_type = "high-mountains";
- Tar gärna emot förslag på hur detta kan uttryckas tydligare utan att tynga artiklarna med alltför omfattande noter.
- @Nasko: Tack för tipset om ASTER! Jag hade tittat på några andra höjdmodeller, men de var antingen ofria eller klumpiga att använda. Lsj (diskussion) 14 juni 2015 kl. 11.24 (CEST)
- ASTER har i värsta fall en felmarginal som är större än vad som anges på en halvhyfsad karta. Bergig terräng och atmosfären påverkar en del. Dessutom använder olika länder olika modeller för jordens krökning.
- Angående formuleringen om terrängen är platt eller kuperad anser jag att mening(en/arna) ska vara raka och enkla. Exakt hur man kommit fram till att en trakt är kuperad eller platt anges bäst som en not eller källnot. Om man nödvändigtvis måste redovisa exakt hur uppgiften kommit till (formler och programkod) anges det bäst på en projektsida som det länkas till ifrån artikeln på lämpligt sätt. Nasko (diskussion) 14 juni 2015 kl. 11.49 (CEST)
- Jag tänker också att det är i noten det ska förklaras. Kanske kan man skriva: "Uppgiften baseras på att standardavvikelsen för alla höjduppgifter i GeoNames inom 30 km radie runt platsen är (mindre än 100 m, mer än 100 m, mer än 300 m, mer än 400 m eller mer än 500 m)."? Jag avrundade och använde standardavvikelse istället för varians för att få vanliga enheter. --افيراتير (diskussion) 14 juni 2015 kl. 13.13 (CEST)
- @Nasko: Tack för tipset om ASTER! Jag hade tittat på några andra höjdmodeller, men de var antingen ofria eller klumpiga att använda. Lsj (diskussion) 14 juni 2015 kl. 11.24 (CEST)
Rubriker m.m.
[redigera wikitext]I dina provkörningar av boten använder du rubriken "Noter" till någon annat än vad rubriken "Noter" används till i nästa alla andra artiklar. Jag tycker det skulle vara bättre om rubriken är t.ex. "Kommentarnoter" eller "Kommentarer" (eller möjligen "Anmärkningar" eller "Fotnoter"). I stort sett vilken rubrik som helst är bättre än "Noter" eftersom den rubriken redan används till något annat. Kartbilden har också hamnat på fel ställe i provkörningsartiklarna, men det antar jag att du tänkt justera. Svensson1 (diskussion) 14 juni 2015 kl. 12.21 (CEST)
- Fixat rubriken. Var tycker du kartan placeras bäst? Nere till höger? Lsj (diskussion) 14 juni 2015 kl. 12.58 (CEST)
- Jag tänkte också på bildens placering. Jag ogillar bilder till vänster om det inte finns goda skäl att ha de där. Eftersom det endast är en bild tänker jag att man kan ha den i infoboxen eller nere till höger. --افيراتير (diskussion) 14 juni 2015 kl. 13.17 (CEST)
- Någonstans till höger. I faktarutan eller nedanför den. Svensson1 (diskussion) 14 juni 2015 kl. 17.47 (CEST)
- Eller bygga in den i infoboxen? -- Innocent bystander (diskussion) 15 juni 2015 kl. 15.03 (CEST)
- Någonstans till höger. I faktarutan eller nedanför den. Svensson1 (diskussion) 14 juni 2015 kl. 17.47 (CEST)
identifierare
[redigera wikitext]Finns det någon typ av stabil identifierare för varje post i källan? Om så, kanske det är värt mödan att skapa en WD-property för den och kanske använda den i källanvisningen! -- Innocent bystander (diskussion) 15 juni 2015 kl. 15.03 (CEST)
- Finns redan: wikidata:Property:P1566, dock inte inlagt överallt. Jag använder den nu för att identifiera rätt wd-objekt. Hur använder man den snyggt i källhänvisningen? Lsj (diskussion) 15 juni 2015 kl. 21.50 (CEST)
- Grejt, men det ser ut som att hur den används på Wikidata, måste styras upp.
- Upptäckte att den användes i Bosön för några dagar sedan. Det fanns där en felaktig interwiki mellan en:Bosön som handlar om en idrottsanläggning och vår småortsartikel. Jag tycker det framgår av länken att P1566 egentligen avser en "land-tied island" och varken idrottsanläggningen eller småorten. Se d:Q784441.
- Nu finns länkar till http://www.geonames.org/about.html, den kanske går att byta ut mot hur den används på Wikidata istället? -- Innocent bystander (diskussion) 19 juni 2015 kl. 13.46 (CEST)
- @Innocent bystander: Jag har nu gått igenom samtliga P1566 i en nedladdad Wikidata-dump och stämt av mot GeoNames. Jag har 1) jämfört koordinater, 2) kollat så att inte två Wikidataobjekt pekar på samma GeoNames-objekt, och 3) kollat så att det är samma sorts objekt (InstanceOf på Wikidata ska vara kompatibel med feature code i GeoNames). Ungefär en tredjedel av dem (150 000+) var felaktiga på ett eller annat sätt. I projektet kommer jag bara att använda de korrekta. Men nu sitter jag med en mycket lång lista med fel i Wikidata -- vad gör jag lämpligen med den? Lsj (diskussion) 13 juli 2015 kl. 16.37 (CEST)
- Vissa fel finns redan rapporterade se d:Wikidata:Database reports/Constraint violations/P1566. Men lägg den på en (eller flera) undersid(a|or) till min användarsida på Wikidata så får jag kika på den. -- Innocent bystander (diskussion) 13 juli 2015 kl. 17.43 (CEST)
- På Wikidata får jag felmeddelande varje gång jag försöker spara, även om jag bryter ner filen i bitar under 2Mb-gränsen. Har sparat den på svwiki istället: Användare:Lsjbot/Bad P1566 in Wikidata. Lsj (diskussion) 13 juli 2015 kl. 20.14 (CEST)
- d:Q288 var en falsk positiv. P1376 svarar mot PPLA2. -- Innocent bystander (diskussion) 13 juli 2015 kl. 22.10 (CEST)
- Jag går efter "instance of" (P31) för att avgöra vad som är vad. d:Q288 är kommunen Tours (Instance Of "commune of France"), vilket borde vara länkat till 6454060 på GeoNames (ADM4). Dess P1566 2972191 är tätorten Tours (PPLA2) på GeoNames. Den sortens sammanblandning av tätort och kommun är en vanlig felkälla på Wikidata, och har också högst tveksamt givit Q288 egenskapen P1376. Då har jag ändå accepterat Wikidata-objekt som är InstanceOf både tätort och kommun (vanligt!) som länkade antingen till tätort eller kommun på GeoNames. Lsj (diskussion) 14 juli 2015 kl. 08.12 (CEST)
- Aha, jag visste inte att man skilde på det i France! -- Innocent bystander (diskussion) 14 juli 2015 kl. 09.04 (CEST)
- Och Lille hade samma problem, suck. Ser ut som det inte går att skilja ADM4 från PPL i Frankrike, så länge man använder kommunartiklarna som chef-lieu. -- Innocent bystander (diskussion) 14 juli 2015 kl. 09.10 (CEST)
- Geonames skiljer på dem, och anger olika befolkningssiffror för kommunen Tours och tätorten Tours. Något högre för tätorten, vilket är rimligt eftersom tätorten sträcker sig in i andra kommuner. Det är heller inte alls ovanligt i Frankrike, liksom i Sverige, att en kommun innehåller flera tätorter. T.ex. finns i kommunen Chamonix både tätorten Chamonix och tätorten Argentière. Lsj (diskussion) 14 juli 2015 kl. 09.25 (CEST)
- Och Lille hade samma problem, suck. Ser ut som det inte går att skilja ADM4 från PPL i Frankrike, så länge man använder kommunartiklarna som chef-lieu. -- Innocent bystander (diskussion) 14 juli 2015 kl. 09.10 (CEST)
- Aha, jag visste inte att man skilde på det i France! -- Innocent bystander (diskussion) 14 juli 2015 kl. 09.04 (CEST)
- Jag går efter "instance of" (P31) för att avgöra vad som är vad. d:Q288 är kommunen Tours (Instance Of "commune of France"), vilket borde vara länkat till 6454060 på GeoNames (ADM4). Dess P1566 2972191 är tätorten Tours (PPLA2) på GeoNames. Den sortens sammanblandning av tätort och kommun är en vanlig felkälla på Wikidata, och har också högst tveksamt givit Q288 egenskapen P1376. Då har jag ändå accepterat Wikidata-objekt som är InstanceOf både tätort och kommun (vanligt!) som länkade antingen till tätort eller kommun på GeoNames. Lsj (diskussion) 14 juli 2015 kl. 08.12 (CEST)
- d:Q288 var en falsk positiv. P1376 svarar mot PPLA2. -- Innocent bystander (diskussion) 13 juli 2015 kl. 22.10 (CEST)
- På Wikidata får jag felmeddelande varje gång jag försöker spara, även om jag bryter ner filen i bitar under 2Mb-gränsen. Har sparat den på svwiki istället: Användare:Lsjbot/Bad P1566 in Wikidata. Lsj (diskussion) 13 juli 2015 kl. 20.14 (CEST)
- Vissa fel finns redan rapporterade se d:Wikidata:Database reports/Constraint violations/P1566. Men lägg den på en (eller flera) undersid(a|or) till min användarsida på Wikidata så får jag kika på den. -- Innocent bystander (diskussion) 13 juli 2015 kl. 17.43 (CEST)
- @Innocent bystander: Jag har nu gått igenom samtliga P1566 i en nedladdad Wikidata-dump och stämt av mot GeoNames. Jag har 1) jämfört koordinater, 2) kollat så att inte två Wikidataobjekt pekar på samma GeoNames-objekt, och 3) kollat så att det är samma sorts objekt (InstanceOf på Wikidata ska vara kompatibel med feature code i GeoNames). Ungefär en tredjedel av dem (150 000+) var felaktiga på ett eller annat sätt. I projektet kommer jag bara att använda de korrekta. Men nu sitter jag med en mycket lång lista med fel i Wikidata -- vad gör jag lämpligen med den? Lsj (diskussion) 13 juli 2015 kl. 16.37 (CEST)
- d:Q1251 måste jag fråga om. 3023403 är MTS och Q1251 är "mountain system/bergskedja". -- Innocent bystander (diskussion) 14 juli 2015 kl. 09.17 (CEST)
- Detta är nog tyvärr en bugg i min klassificering -- jag utgick från att allting bergigt skulle finnas i en subclass till d:Q8502 Mountain, men det gör förvisso inte bergskedjor, de har en separat klasshierarki under Landforms. Lsj (diskussion) 14 juli 2015 kl. 09.30 (CEST)
- Jag gör om dumpkörningen nu, med bergskedjorna fixade. Återkommer när det är klart. Lsj (diskussion) 16 juli 2015 kl. 17.15 (CEST)
- Ok, nästan 2000 bergskedjor har fått sin matchning nu. Ska lägga upp en uppdaterad fellista imorgon. Lsj (diskussion) 17 juli 2015 kl. 00.08 (CEST)
- Jag gör om dumpkörningen nu, med bergskedjorna fixade. Återkommer när det är klart. Lsj (diskussion) 16 juli 2015 kl. 17.15 (CEST)
- Detta är nog tyvärr en bugg i min klassificering -- jag utgick från att allting bergigt skulle finnas i en subclass till d:Q8502 Mountain, men det gör förvisso inte bergskedjor, de har en separat klasshierarki under Landforms. Lsj (diskussion) 14 juli 2015 kl. 09.30 (CEST)
Var börjar vi?
[redigera wikitext]Relevanta platser: Bebodda platser (städer och byar) anser jag är relevanta om de har ≥200 invånare. I Sverige motsvarar detta en tätort. Havsvikar är relevanta. Sverige har 300 st (så som de är definierade av hydrologer), hälften av dem har artikel som det är nu. Berg och sjöar är relevanta och i högsta grad bestående. Glaciärer håller på att smälta bort, men är relevanta. En glaciär är ≥40 m tjock ismassa som har en stor inverka på landskapet. Spåren av en glaciär går att se en mycket lång tid efter det att den försvunnit.
Testartiklar: Mitt förslag är att vi börjar med vårt grannland Norge och genomför en testkörning där. De flesta kan förstå sig på norska och har någon gång varit där. Det är nog inga problem att läsa vad som står i en norsk Wikipediaartikel eller hos en norsk myndighet och jämföra med ett gäng testkörda artiklar. Om försöket faller väl ut kan vi alltid testa något land i Asien som är någorlunda utvecklat och se hur artiklarna blir där. Nasko (diskussion) 15 juni 2015 kl. 22.46 (CEST)
Sortering
[redigera wikitext]Platserna tycks för närvarande vara osorterade på förgreningssidor. Se t.ex. Eva (olika betydelser). De borde kanske sorteras på land i alfabetisk ordning? Svensson1 (diskussion) 25 juni 2015 kl. 18.16 (CEST)
- Länderna är sorterade, men jag råkade visst använda ISO-koden snarare än det svenska landsnamnet som sorteringsnyckel. För de flesta länder gör det ingen skillnad, men Samoa har ISO-kod "WS" och då blir det fel. Själva platserna är knappast meningsfullt att sortera just på en grensida -- de heter ju i princip likadant. Lsj (diskussion) 25 juni 2015 kl. 18.57 (CEST)
- En annan sak angående förgreningssidorna. Se t.ex. Eva (olika betydelser). Delar av det som hör till t.ex. platsen i Sverige, mer exakt kartan, ligger över rubriken Sverige i redigeringsläge och delar ligger under rubriken Sverige. Jag vet inte om det kanske gjorts avsiktligt för att i vissa fall placera kartan pyttelite bättre i artikeln. Men jag tror det blir svårhanterligt och kommer resultera i åtskilliga fel när användare ska redigera dessa sidor. Allt som hör till Sverige bör nog läggas under rubriken Sverige även om det i vissa fall placerar kartan pyttelite sämre. Svensson1 (diskussion) 4 juli 2015 kl. 14.09 (CEST)
- Ok, jag ser vad du menar. Hade inte tänkt på det. Fixat i botkoden nu. Lsj (diskussion) 4 juli 2015 kl. 15.50 (CEST)
- En annan sak angående förgreningssidorna. Se t.ex. Eva (olika betydelser). Delar av det som hör till t.ex. platsen i Sverige, mer exakt kartan, ligger över rubriken Sverige i redigeringsläge och delar ligger under rubriken Sverige. Jag vet inte om det kanske gjorts avsiktligt för att i vissa fall placera kartan pyttelite bättre i artikeln. Men jag tror det blir svårhanterligt och kommer resultera i åtskilliga fel när användare ska redigera dessa sidor. Allt som hör till Sverige bör nog läggas under rubriken Sverige även om det i vissa fall placerar kartan pyttelite sämre. Svensson1 (diskussion) 4 juli 2015 kl. 14.09 (CEST)
Åtgärdslista
[redigera wikitext]Jag har skapat Användare:Lsjbot/Projekt alla platser/Åtgärdslista, för att samla alla förbättringsförslag och buggrapporter på ett ställe. Den sidan är inte avsedd för diskussion, som helst hålls här istället, utan jag kopierar dit diskussionsinlägg för åtgärdande. Lsj (diskussion) 13 juli 2015 kl. 16.59 (CEST)
Geonames...
[redigera wikitext]Det känns smått bekymmersamt att trots de invändningar som lyfts fram i bybrunnsdiskussionen om Geonames trovärdighet står den ändå angiven som huvudkälla här. Hur har resonemanget egentligen gått där? Finns det ingen bättre källa kanske man bör överväga att inte genomföra projektet på det sätt som det tänkts. Ett alternativ hade varit att fokusera på ett land i taget och försökt hitta en bra källa per land istället för en global källa som håller högst tveksam kvalité. Finns ingen bra källa för ett visst land är det ett bra argument för att inte skapa robotartiklar om orter i det landet... /Grillo (diskussion) 15 juli 2015 kl. 09.22 (CEST)
- Det har väl snarare visat sig att källan är ganska hyfsad, så länge man sorterar bort vissa kategorier som visat sig ofta innehålla fel. Vissa uppgifter kan vara några år gamla, men det är de nästan alltid annars också. Jag håller nu tex på att lägga in folkmängd i småorter, som publicerades 1997, men som gällde 1990. Ett välordnat organisation som SCB kan alltså ha samma problem den här källan. En annan invändning har varit att andra projekt har använt denna källa på ett inte alltför genomtänkt sätt, blandat koncept som tätort med kommun rätt friskt tex. Bland det senaste Lsj gjort, är att indentifiera just de fall där sådana misstag förekommer och sorterar bort dem från sin körning. -- Innocent bystander (diskussion) 15 juli 2015 kl. 09.32 (CEST)
Karup
[redigera wikitext]Boten skapade Karup (ort) som en omdirigering (som jag har bett att få raderad) till den tidigare kommunen Karups kommun. Troligen för att geoname i wikidata för kommunen var vad geonames hade som geoname för orten. Inte mycket boten kan göra med felaktigt data. Maundwiki (diskussion) 15 april 2016 kl. 02.53 (CEST)
- Tack. Samma problem har jag sett på fler ställen, där wikidata rör ihop kommun och ort. Jag har ändrat i wikidata nu. Lsj (diskussion) 15 april 2016 kl. 07.51 (CEST)
Пра́вда
[redigera wikitext]Hur ser arbetsgången ut för områden med det kyrilliska alfabetet? - Innocent bystander (diskussion) 19 juli 2015 kl. 08.51 (CEST)
- I grunden hade jag tänkt mig samma arbetsgång som i andra områden med icke-latinsk skrift. Artikelnamn med latinsk transkribering, lokalt namn med lokal skrift givet i artikeltexten, se mitt svar till Flinga här. Det som komplicerar det kyrilliska livet här är väl olika sorters transkribering. GeoNames tillhandahåller en grundform, som ser ut att vara engelsk transkribering, plus ett varierande antal alternativa former. T.ex. för Желява i Bulgarien är Zhelyava grundform, och dessutom finns Sheljawa och Zheljava. I bästa fall är någon av dem markerad som svensk namnform, och i så fall använder jag den. Annars tänkte jag använda grundformen, men finns det något bättre alternativ? Finns rutiner för maskinell transkribering som är tillräckligt bra? Lsj (diskussion) 19 juli 2015 kl. 10.14 (CEST)
- Finns ett svensk namn, så kör på det, inga problem.
- När det inte finns det?
- Senast jag kollade Ryska alfabetet så tolkade jag det som att det inte fanns en tillräckligt entydig algoritm för att kunna transkribera med robot. Men när jag tittar nu, så ser det ut som det är fullt möjligt att göra detta för såväl ryska, ukrainska och vitryska.
- -- Innocent bystander (diskussion) 19 juli 2015 kl. 10.32 (CEST)
- Ser någorlunda rättframt ut att göra. Men blir en del pyssel, om man ska täcka in alla länder där kyrillisk skrift används i olika varianter, på ett dussin olika språk. Lsj (diskussion) 19 juli 2015 kl. 11.01 (CEST)
- Kanske räcker med Ryska, Ukrainska och Bulgariska. Övriga språk är ganska marginella. Serbiska borde det finnas latinska versioner av... -- Innocent bystander (diskussion) 19 juli 2015 kl. 13.03 (CEST)
- Translittereringen fungerar i huvudsak bra, se tex Användare:Lsj/sandlåda/translitBY för det vitryska resultatet -- ser det korrekt ut? Dock får jag problem i Kazakstan, som använder en rad bokstäver som jag inte vet hur de ska translittereras: үұҚғқңє. Har du några idéer, eller ska jag hoppa över kazakiska? Lsj (diskussion) 19 juli 2015 kl. 17.44 (CEST)
- Jag känner inte till kazakiska alls. Rimligtvis borde det oftast finnas ryska namn på platserna att jämföra med...
- Det har funnits lite delade meningar om just Vitryssland, det syns tex i sidflyttarna här. Jag har ingen stark åsikt i frågan. -- Innocent bystander (diskussion) 19 juli 2015 kl. 17.55 (CEST)
- Då hoppar jag över kazakiska, och använder eventuella ryska namnformer där. För Vitryssland använder jag de former som GeoNames betecknar som vitryska, och motsvarande för Ukraina. Lsj (diskussion) 19 juli 2015 kl. 18.26 (CEST)
- Jag är tveksam till att använda ryska namnformer i Kazakstan. De ryska formerna kan anges parallellt med de kazakiska (båda är officiella språk), men av oss genom translitterering införda svenska former borde rimligen basera sig på det kazakiska, åtminstone i de fall namnen skiljer sig väsentligt. Vi behöver inte ha Kazakstan bland de första länderna i projektet och har kanske då möjlighet att få hjälp av någon expert innan landet blir aktuellt. --LPfi (diskussion) 20 juli 2015 kl. 09.52 (CEST)
- Jag missade att problemet verkar ha lösts nedan. Bra. --LPfi (diskussion) 20 juli 2015 kl. 09.55 (CEST)
- Jag är tveksam till att använda ryska namnformer i Kazakstan. De ryska formerna kan anges parallellt med de kazakiska (båda är officiella språk), men av oss genom translitterering införda svenska former borde rimligen basera sig på det kazakiska, åtminstone i de fall namnen skiljer sig väsentligt. Vi behöver inte ha Kazakstan bland de första länderna i projektet och har kanske då möjlighet att få hjälp av någon expert innan landet blir aktuellt. --LPfi (diskussion) 20 juli 2015 kl. 09.52 (CEST)
- Då hoppar jag över kazakiska, och använder eventuella ryska namnformer där. För Vitryssland använder jag de former som GeoNames betecknar som vitryska, och motsvarande för Ukraina. Lsj (diskussion) 19 juli 2015 kl. 18.26 (CEST)
- Translittereringen fungerar i huvudsak bra, se tex Användare:Lsj/sandlåda/translitBY för det vitryska resultatet -- ser det korrekt ut? Dock får jag problem i Kazakstan, som använder en rad bokstäver som jag inte vet hur de ska translittereras: үұҚғқңє. Har du några idéer, eller ska jag hoppa över kazakiska? Lsj (diskussion) 19 juli 2015 kl. 17.44 (CEST)
- Kanske räcker med Ryska, Ukrainska och Bulgariska. Övriga språk är ganska marginella. Serbiska borde det finnas latinska versioner av... -- Innocent bystander (diskussion) 19 juli 2015 kl. 13.03 (CEST)
- Ser någorlunda rättframt ut att göra. Men blir en del pyssel, om man ska täcka in alla länder där kyrillisk skrift används i olika varianter, på ett dussin olika språk. Lsj (diskussion) 19 juli 2015 kl. 11.01 (CEST)
- Jag förutsatte att det skulle finnas latinska former för allt i Serbien, men tji. Ja, jag har hittat sådana exempel. Men redan Belgrad saknar en latinsk form för serbiska. -- Innocent bystander (diskussion) 19 juli 2015 kl. 19.25 (CEST)
- Jag har kört Serbien också. Inte jättemånga namn som behövde translitereras där, men en del kända platser. Lsj (diskussion) 19 juli 2015 kl. 22.55 (CEST)
- Här står det om Kazakisk translitterering till svenska: http://ec.europa.eu/translation/swedish/guidelines/documents/transliteration_alt_geogr_names_sv.pdf s.26. Är det användbart? Taxelson (diskussion) 20 juli 2015 kl. 00.11 (CEST)
- Grejt Taxelson!
- Här står det om Kazakisk translitterering till svenska: http://ec.europa.eu/translation/swedish/guidelines/documents/transliteration_alt_geogr_names_sv.pdf s.26. Är det användbart? Taxelson (diskussion) 20 juli 2015 kl. 00.11 (CEST)
- Jag har kört Serbien också. Inte jättemånga namn som behövde translitereras där, men en del kända platser. Lsj (diskussion) 19 juli 2015 kl. 22.55 (CEST)
Kazakiska: Ғ ғ > gh Ə ə > ä İ і > i Қ қ > q Ң ң > ng Ө ө > ö Ү ү > ü Ұ ұ > u Һ һ > h
Kirgiziska:
Ң ң > ng Ө ө > ö Ү ү > ü
Tadzjikiska
Ғ ғ > gh Ӣ ӣ > y Қ қ > q Ӯ ӯ > ö Ҳ ҳ > h Ҷ ҷ > dzj
Mongoliska: Följande avviker från ryska:
ж > j з > dz ий > ii ы > ij
dessutom tillkommer:
Ө ө > ö Ү ү > ü
Har kört igenom de kyrilliska länderna igen nu, i ljuset av Taxelsons källa. För forna sovjetrepubliker använde jag i första hand namnformer på lokalt språk där sådana fanns, annars ryska. Så här blev det för Kazakstan: Användare:Lsj/sandlåda/translitKZ. Lsj (diskussion) 20 juli 2015 kl. 11.45 (CEST)
- 607847 ser lite märklig ut, en bugg i källan där kanske? -- Innocent bystander (diskussion) 20 juli 2015 kl. 12.16 (CEST)
- Du menar det som ser ut som ett citattecken i slutet? Ja, det är från källan. Boten tar inte bort sådant, inte lätt att veta när det faktiskt ska vara med. Lsj (diskussion) 20 juli 2015 kl. 12.20 (CEST)
- Det var "citattecknet" som fick mig att uppmärksamma just det objektet, men hela sista ordet ser lite knas ut i jämförelse med andra oblast. Nu finns det en avslutande apostrof även i det ryska namnet, så det kanske är rätt ändå... -- Innocent bystander (diskussion) 20 juli 2015 kl. 12.41 (CEST)
- Motsvarande artikel på kazakiska wp heter kk:Батыс Қазақстан облысы, med samma namnform men utan citattecken. Verkar som oblast faktiskt heter облысы på kazakiska, även om jag också undrade över formen. Lsj (diskussion) 20 juli 2015 kl. 12.55 (CEST)
- ... och på kirgisiska heter oblast Облусу. Lsj (diskussion) 20 juli 2015 kl. 13.03 (CEST)
- Västkazakstan är väl de facto ryskspråkig? Det ska väl inte spela någon roll för oss här, men det kan kanske förklara anomalier... -- Innocent bystander (diskussion) 20 juli 2015 kl. 13.08 (CEST)
- Jo, det kan det göra. Jag märkte också en del sammanblandningar i GeoNames där namn som var märkta som ryska använde kazakiska bokstäver. Sådana transkriberade jag som om de vore kazakiska. Lsj (diskussion) 20 juli 2015 kl. 13.25 (CEST)
- Det är samma regler för dessa språk, så det är fritt fram att använda kazakiska/tadjikiska/kirgiziska regler på ryska namn. Det är det omvända som i vissa fall ger problem. -- Innocent bystander (diskussion) 20 juli 2015 kl. 15.03 (CEST)
- Apropå translitteringen/transkriptionen som länkades till i Wikipediafrågor… Ska det se ut så här?…
- cyrillic.Addchar('Ю', "*", true);
- cyrillic.Addchar('ю', "*", true);
- cyrillic.Addchar('Я', "*", true);
- cyrillic.Addchar('я', "*", true);
- … dvs vad fyller * för funktioner för tecken som brukar transkriberas 'ju' resp. 'ja'?--Paracel63 (diskussion) 22 juli 2015 kl. 01.38 (CEST)
- Ja, det ska se ut så. Jag använder asterisk för att markera att transkriberingen av dessa tecken är kontextberoende och kräver specialbehandling. Lsj (diskussion) 24 juli 2015 kl. 11.38 (CEST)
- Det är samma regler för dessa språk, så det är fritt fram att använda kazakiska/tadjikiska/kirgiziska regler på ryska namn. Det är det omvända som i vissa fall ger problem. -- Innocent bystander (diskussion) 20 juli 2015 kl. 15.03 (CEST)
- Jo, det kan det göra. Jag märkte också en del sammanblandningar i GeoNames där namn som var märkta som ryska använde kazakiska bokstäver. Sådana transkriberade jag som om de vore kazakiska. Lsj (diskussion) 20 juli 2015 kl. 13.25 (CEST)
- Västkazakstan är väl de facto ryskspråkig? Det ska väl inte spela någon roll för oss här, men det kan kanske förklara anomalier... -- Innocent bystander (diskussion) 20 juli 2015 kl. 13.08 (CEST)
- Det var "citattecknet" som fick mig att uppmärksamma just det objektet, men hela sista ordet ser lite knas ut i jämförelse med andra oblast. Nu finns det en avslutande apostrof även i det ryska namnet, så det kanske är rätt ändå... -- Innocent bystander (diskussion) 20 juli 2015 kl. 12.41 (CEST)
- Du menar det som ser ut som ett citattecken i slutet? Ja, det är från källan. Boten tar inte bort sådant, inte lätt att veta när det faktiskt ska vara med. Lsj (diskussion) 20 juli 2015 kl. 12.20 (CEST)
Rumänska
[redigera wikitext]En annan fråga: Rumänska har en del diakritiska tecken som är extra svåra att skriva ut, tillochmed för rumänerna själv. Där bör man kanske vara extra genrös med omdirigeringar. -- Innocent bystander (diskussion) 20 juli 2015 kl. 15.03 (CEST)
- Boten skapar alltid en omdirigering från ren ASCII, om namnet innehåller diakriter eller liknande. Om GeoNames tillhandahåller stavningsvarianter blir de också omdirigeringar. Behövs det mer? Lsj (diskussion) 20 juli 2015 kl. 15.37 (CEST)
- Låter bra! -- Innocent bystander (diskussion) 20 juli 2015 kl. 15.39 (CEST)
- Är det cedilj/svans/komma-problematiken? Om rumänerna själva ofta använder ett annat tecken som inte är ASCII borde vi nog ha omdirigering också från det, dels med tanke på folk som kan rumänska, dels med tanke på sådana som klistrar in namnet i sökrutan. Jag kan tänka mig att det felaktiga tecknet inte förekommer som stavningsvariant. --LPfi (diskussion) 21 juli 2015 kl. 10.11 (CEST)
- Låter betydligt svårare for boten att åstadkomma. Vilka tecken/varianter rör det sig om? Lsj (diskussion) 21 juli 2015 kl. 10.39 (CEST)
- Vad jag förstått användes cedilj istället för komma (eller något liknande) för att det senare var svårt att få fram på tangentbordet (eller överhuvudtaget inte fanns i äldre teckenuppsättningar). Om jag kommer rätt ihåg är det helt enkelt att betrakta det ena tecknet som en sämre men ekvivalent variant av det andra (som att använda "—" istället för "–" i svenska). Om det är så borde det vara trivialt att åstadkomma omdirigeringarna. --LPfi (diskussion) 21 juli 2015 kl. 15.15 (CEST)
- Menar du dessa tecken i rumänska alfabetet: ş ţ? Är de inte cediljer? Båda omdirigerar till cedilj. Eller hur skriver rumänerna dem istället? Hmm... artikeln cedilj nämner att det finns dessa tecken också: ș och ț. Men i så fall står det fel i Rumänska#Rumänska alfabetet. Hur som helst, att skapa omdirigeringar mellan dessa snarlika tecken (och från vanliga s/t förstås) är förvisso inte så svårt. Finns det andra krumelurer i andra språk som vi borde göra likadant med? Lsj (diskussion) 21 juli 2015 kl. 15.55 (CEST)
- Vad jag förstått användes cedilj istället för komma (eller något liknande) för att det senare var svårt att få fram på tangentbordet (eller överhuvudtaget inte fanns i äldre teckenuppsättningar). Om jag kommer rätt ihåg är det helt enkelt att betrakta det ena tecknet som en sämre men ekvivalent variant av det andra (som att använda "—" istället för "–" i svenska). Om det är så borde det vara trivialt att åstadkomma omdirigeringarna. --LPfi (diskussion) 21 juli 2015 kl. 15.15 (CEST)
- Det här och det här känns bekant. De engelska (och rumänska) artiklarna om samma sak bekräftar Unicode-problematiken.--Paracel63 (diskussion) 22 juli 2015 kl. 01.49 (CEST)
Ok, nu funkar det med omdirigering mellan cedilj och nästan-cedilj-- se t.ex. Al Maqța‘. Tydligen används de även i translitterering av arabiska. Lsj (diskussion) 13 augusti 2015 kl. 23.12 (CEST)
Kategorisering av omdirigeringar?
[redigera wikitext]Lsjbot kommer ju att skapa ett stort antal geografiska omdirigeringar. I artprojektet blev alla omdirigeringarna kategoriserade på olika sätt -- rena alternativa namn i Kategori:Djursynonymer etc. Bör geografiska omdirigeringar kategoriseras, och i så fall hur? Jag kan se två möjliga lösningar:
- Kategorisera omdirigeringen på samma sätt som själva artikeln. Fördelen med det är att man får alla namnvarianter av en ort i samma kategori, och kan hitta rätt även via alternativa namn. Nackdelen är att kategorierna kan bli överbefolkade med snarlika namn.
- Skapa specialkategorier för omdirigeringarna, liknande Kategori:Djursynonymer. Fördelen är att man har dem samlade, och att de inte "stör" huvudkategorin, nackdelen att de ligger undanskymt där ingen normalt letar.
Tankar om detta? Lsj (diskussion) 21 juli 2015 kl. 11.38 (CEST)
- Tillägg: Enligt önskemål tänker jag märka omdirigeringar från olika språks namnformer med
{{Omdirigering på annat språk}}
. Man skulle kunna tänka sig att samtidigt kategorisera omdirigeringarna efter språk, så att vi får Kategori:Omdirigeringar på swahili etc. Är det en god idé? Lsj (diskussion) 21 juli 2015 kl. 12.06 (CEST)- Djursynonymerna tycker jag har ett tydligare syfte än dessa.
- Kategorisera både Bruxelles och Bryssel i samma kategori? Ytterst, ytterst tveksamt! Leningrad/Petrograd/Sankt Petersburg respektive oslo/Kristiania i samma kategori kan däremot kännas befogat.
- Märkningen med mall har jag inget specifikt att invända emot, men kategorisera efter språk? Det låter som rena mardrömmen att se kategoriseringsnördarna ta efter det beteendet. Alternativet kanske kan vara att skapa "dolda länkar" som går att följa med Special:Whatlinkshere.
- -- Innocent bystander (diskussion) 21 juli 2015 kl. 12.34 (CEST)
- Skulle kunna gå efter om omdirigiering och målartikel har samma begynnelsebokstav, och kategorisera omdirigeringen om de inte har det? Det löser Bryssel/Bruxelles vs. Oslo/Kristiania. Enklaste sättet att skapa "dolda länkar" för språken är väl att helt enkelt öppet länka språknamnet som mallen genererar i omdirigiringen, då dyker det upp i Special:Whatlinkshere när man söker på språknamnet. Lsj (diskussion) 21 juli 2015 kl. 12.53 (CEST)
- Skillnaden mellan Oslo och (K|Ch)ristiania, är att det är två svenska namn på samma plats, där skillnaden är att namnen har använts vid lite olika tidpunkter. Men det blir jag väldigt imponerad av om roboten klarar att skilja på.
- Länkarna måste förstås inte vara dolda. :)
- Det jag syftade på var kod likt denna: <div style="display:none;">[[{{#language:tr|sv}}]]</div> som gör länken osynlig, om man inte vill visa den i sidan. Men det spelar kanske ingen roll, när det ligger i omdirigeringssidor, där normalt ingen befinner sig. Länkarna kan göras mer unika för dessa sidor om man vill: Språkomdirigering:Turkiska. -- Innocent bystander (diskussion) 21 juli 2015 kl. 15.43 (CEST)
- Skulle kunna gå efter om omdirigiering och målartikel har samma begynnelsebokstav, och kategorisera omdirigeringen om de inte har det? Det löser Bryssel/Bruxelles vs. Oslo/Kristiania. Enklaste sättet att skapa "dolda länkar" för språken är väl att helt enkelt öppet länka språknamnet som mallen genererar i omdirigiringen, då dyker det upp i Special:Whatlinkshere när man söker på språknamnet. Lsj (diskussion) 21 juli 2015 kl. 12.53 (CEST)
Kvalitetskontroll höjduppgifter
[redigera wikitext]Har kört igenom alla platser i GeoNames och jämfört höjduppgifterna i GeoNames med den höjd jag får för platsens position från en Digital Elevation Model (från Viewfinder Panoramas). Resultatet finns i diagrammet här bredvid (inkluderar halva körningen, länder från M till Z i alfabetet). Toppen ligger vid noll skillnad, positiva värden innebär att GeoNames ger en högre höjd. Skulle kalla det klart godkänt, särskilt med tanke på att det finns ett par legitima källor till skillnader i en sådan här jämförelse:
- Höjden för ett berg i GeoNames borde vara toppens höjd, medan en DEM ger medelhöjden i en 90x90 meter stor ruta. Det ger en systematiskt lägre höjd i DEM än i GeoNames. Fördelningen är också asymmetrisk på det hållet, även om det knapps syns i diagrammet.
- Där terrängen är brant blir det allmänt en skillnad i höjd pga dessa rutor.
- Inte självklart att höjdangivelsen i GeoNames kommer från exakt den punkt som anges i latitud/longitud, särskilt inte för platstyper med utbredning. För t.ex. en kommun eller en flod är vare sig höjd eller position väldefinierade storheter.
Lsj (diskussion) 23 juli 2015 kl. 17.13 (CEST)
- Vilka kategorier tänker du ange höjd för? -- Innocent bystander (diskussion) 23 juli 2015 kl. 17.30 (CEST)
- Alla som har en någorlunda väldefinierad position, och som varken är för stora eller för små jämfört med DEM-upplösningen. Inte administrativa enheter, om inte GeoNames ger en höjd. Inte t.ex. floder och andra utsträckta saker. Inte alltför små kobbar och skär, för de kommer bort i DEM och får havsytans nivå. Lsj (diskussion) 23 juli 2015 kl. 18.22 (CEST)
Ovanligt många slätter och kanaler? En tanke om ortnamnstypsfrekvens som grund för landskapskaraktäristik.
[redigera wikitext]I testartikeln Användare:Lsjbot/geotest/Zarghūn Shahr (samhälle) finns uttrycket "Ovanligt många slätter och kanaler". Jag är inte säker på att jag hänger med på den slutsatsen. Tittar på Googlemaps satelitbild, och ser att platsen verkar ligga på en ganska brant bergsslutning, och inte minst i grannbyn verkar det finnas konstbevattnade terrass(?)odlingar, men inget jag kanske skulle benämna "slätter". Kan det vara så att varje sådan terrass kanske heter slätt. Eller är det något annat som benämns slätt, t.ex varje plats som har något för trakten så ganska ovanligt som någorlunda horisontell markyta? Kanalerna är säkert viktiga, och därför namngivna, men kanske ändå inte vanliga - eller är det de många wadis som syns efter berget som kallas kanaler? Det vanliga - bergåsar och rasbranter och ökensnår har nog inte namngivits. Kort sagt, namn återspeglar oftast vad som är värdefullt eller ovanligt - något särskiljande som man behöver kunna benämna, snarare än vad som är vanligt, och därför är det kanske vanskligt att karaktärisera landskapet efter vilken typ av ortnamn som finns i det? Taxelson (diskussion) 23 juli 2015 kl. 17.48 (CEST)
- Jag ser vad du menar. Kanske det skulle hjälpa att lägga till det lilla ordet "namngivna" -- "i trakten finns ovanligt många namngivna slätter och kanaler." Vad kanalerna beträffar tror jag det är namngivna bevattningskanaler -- jordbruket runt Zarghun Shahr ser förvisso väldigt konstbevattnat ut på en satellitbild. Wadis har en egen kategori i GeoNames och skulle inte kallas kanaler. Sedan tycker jag föralldel att trakten ser ut att ha en del genuina slätter på den här bilden, som är den vy i Google som kommer närmast att visa Zarghun Shahr, och som definitivt visar en del av den trakt som täcks in av botens skrivning om "ovanligt många".
- För att någonting ska klassas som ovanligt vanligt så kräver programmet att det dels ska vara tre gånger vanligare inom 30 km radie runt orten än i genomsnitt på jordytan, och dels att det absoluta antalet inom samma radie ska vara minst 5. Skulle gå att sätta striktare kriterier om man vill. Men jag tycker det vore synd att skippa något som ändå kan ge lite mer än bara basfakta om orten. Lsj (diskussion) 23 juli 2015 kl. 18.38 (CEST)
- Det står Ghazni på den bild du länkar till. Det ser ut att finnas några landskapsbilder från Zarghūn Shahr utöver kartorna vid sökning med Google bland bildresultaten, [8]. Höstblomma (diskussion) 23 juli 2015 kl. 18.53 (CEST)
- Googles positionsangivelse för bilden är mycket närmare Zarghun Shahr än Ghazni (som hur som helst bara är några mil bort). Lsj (diskussion) 23 juli 2015 kl. 20.16 (CEST)
- "Namngivna" skulle definitivt hjälpa! Källan speglar ju just om namnskicket, inte terrängen i sig. Jag har tyvärr inte satt mig in i databasen, men det kunde vara intressant som jämförelse att se hur några orter i utpräglade slättbygder skulle bli karaktäriserade, t.ex Vara eller Ferrara, eller Mirabad 30°25′48″N 61°49′58″Ö / 30.4299°N 61.8327°Ö för att hålla oss i Afghanistan. Finns det också där många ortnamn som kategoriserats som "slätter" i databasen, eller saknas de därför att slätt i dessa områden är det normala? Taxelson (diskussion) 23 juli 2015 kl. 19.12 (CEST)
- Jag testade en del när jag utvecklade funktionen, och oftast gav den vettiga resultat. Ska testa lite mer och fixa statistik. Lsj (diskussion) 23 juli 2015 kl. 21.32 (CEST)
- En förutsättning är förstås att databasen är representativ. Vi såg i en av de färgade kartorna som beskriver poster efter typ, att tex Kanada har många poster om vatten. Det betyder ju inte nödvändigtvis att Kanada har mer vatten än Norden/Ryssland. Det betyder snarare att det finns ett stort register över vatten som kopierats över. Länder som var nedisade under senaste istiden har mer vatten än de som ligger längre söderut, men Ryssland är likväl inte blå, utan röd, vilket kanske snarare antyder avsaknad av andra typer av data. -- Innocent bystander (diskussion) 24 juli 2015 kl. 07.24 (CEST)
- Sant. Men boten säger aldrig att det finns ovanligt lite av någonting, så luckor i täckningen har främst effekten att ingenting alls sägs i artiklarna. Men det tycker jag vi kan stå ut med, så länge inte felaktig info skrivs ut. Att vi inte har underlag för att skriva att Ryssland har gott om sjöar är inte tillräckligt skäl att avstå från att skriva att Kanada har gott om sjöar. Lsj (diskussion) 24 juli 2015 kl. 11.36 (CEST)
- Jag provkörde tidigare en del artiklar om Sverige på cebwp. Orter i Västmanland mest (ceb:Kategoriya:Mga lungsod sa Västmanlands Län). De som ligger nära Mälaren, t.ex. Västerås, har ovanligt många öar och vikar i trakten, medan de som ligger i inlandet har sjöar och våtmarker. Låter vettigt så långt. Ska göra mer systematiska provkörningar. Lsj (diskussion) 24 juli 2015 kl. 19.45 (CEST)
- Noterar att ceb:Västerfärnebo säger att Sandviken är närmaste större stad, belägen 15 km öster om Västerfärnebo. Det borde nog ha varit Sala. Är de båda städerna förväxlade i databasen, eller har boten tagit nästa post i en alfabetisk lista, e.d? Taxelson (diskussion) 24 juli 2015 kl. 20.23 (CEST)
- Koordinaterna för Sandviken är rätt i databasen. -- Innocent bystander (diskussion) 25 juli 2015 kl. 08.13 (CEST) (åtminstone i den version från 1 juli jag har)
- Sandviken är en bugg som beror de tidigare problemen med wikidata-kopplingar, nu åtgärdade. Det finns verkligen en by som heter Sandviken där, men fel befolkningssiffra plockades upp från Wikidata. Lsj (diskussion) 25 juli 2015 kl. 09.38 (CEST)
- Koordinaterna för Sandviken är rätt i databasen. -- Innocent bystander (diskussion) 25 juli 2015 kl. 08.13 (CEST) (åtminstone i den version från 1 juli jag har)
- Jag håller med om att informationen att det finns många namngivna öar och vikar runt Västerås är relevant. Ännu bättre hade kanske varit om boten kunnat lista ut att den ligger vid sjön Mälaren - som ju är orsaken till att det finns många öar och vikar - men jag förmodar att detta är mycket svårare, då i detta fall Mälarens utsträckning inte är tillgänglig i databasen? Kanske den typ av puts som bör överlämnas åt mänskliga användare. Taxelson (diskussion) 24 juli 2015 kl. 22.22 (CEST)
- Jag filar på en algoritm för att identifiera sjöar med hjälp av DEM, men det är som du säger inte helt enkelt. Har fått det att funka för öar i hav, så att boten korrekt identifierar att en ort ligger på t.ex. Gotland eller Lidingö. Lsj (diskussion) 25 juli 2015 kl. 09.38 (CEST)
- d:Property:P206 kan beskriva det, men den är nog inte särskilt väl använd. Se tex d:Q84#P206. -- Innocent bystander (diskussion) 25 juli 2015 kl. 09.39 (CEST)
- Skulle gå att använda P206, men jag tvivlar på att den finns för någon större andel av världens platser. Förutsätter också att både orten och sjön har en korrekt koppling mellan Wikidata och Geonames. Hittar f.ö. ingen plats i Geobox för att ange detta - vet någon vilken parameter det skulle vara? Lsj (diskussion) 25 juli 2015 kl. 10.01 (CEST)
- lake och river är två parametrar som finns. -- Innocent bystander (diskussion) 25 juli 2015 kl. 10.10 (CEST)
- Skulle gå att använda P206, men jag tvivlar på att den finns för någon större andel av världens platser. Förutsätter också att både orten och sjön har en korrekt koppling mellan Wikidata och Geonames. Hittar f.ö. ingen plats i Geobox för att ange detta - vet någon vilken parameter det skulle vara? Lsj (diskussion) 25 juli 2015 kl. 10.01 (CEST)
- d:Property:P206 kan beskriva det, men den är nog inte särskilt väl använd. Se tex d:Q84#P206. -- Innocent bystander (diskussion) 25 juli 2015 kl. 09.39 (CEST)
- Jag filar på en algoritm för att identifiera sjöar med hjälp av DEM, men det är som du säger inte helt enkelt. Har fått det att funka för öar i hav, så att boten korrekt identifierar att en ort ligger på t.ex. Gotland eller Lidingö. Lsj (diskussion) 25 juli 2015 kl. 09.38 (CEST)
- Noterar att ceb:Västerfärnebo säger att Sandviken är närmaste större stad, belägen 15 km öster om Västerfärnebo. Det borde nog ha varit Sala. Är de båda städerna förväxlade i databasen, eller har boten tagit nästa post i en alfabetisk lista, e.d? Taxelson (diskussion) 24 juli 2015 kl. 20.23 (CEST)
- Jag provkörde tidigare en del artiklar om Sverige på cebwp. Orter i Västmanland mest (ceb:Kategoriya:Mga lungsod sa Västmanlands Län). De som ligger nära Mälaren, t.ex. Västerås, har ovanligt många öar och vikar i trakten, medan de som ligger i inlandet har sjöar och våtmarker. Låter vettigt så långt. Ska göra mer systematiska provkörningar. Lsj (diskussion) 24 juli 2015 kl. 19.45 (CEST)
- Sant. Men boten säger aldrig att det finns ovanligt lite av någonting, så luckor i täckningen har främst effekten att ingenting alls sägs i artiklarna. Men det tycker jag vi kan stå ut med, så länge inte felaktig info skrivs ut. Att vi inte har underlag för att skriva att Ryssland har gott om sjöar är inte tillräckligt skäl att avstå från att skriva att Kanada har gott om sjöar. Lsj (diskussion) 24 juli 2015 kl. 11.36 (CEST)
- En förutsättning är förstås att databasen är representativ. Vi såg i en av de färgade kartorna som beskriver poster efter typ, att tex Kanada har många poster om vatten. Det betyder ju inte nödvändigtvis att Kanada har mer vatten än Norden/Ryssland. Det betyder snarare att det finns ett stort register över vatten som kopierats över. Länder som var nedisade under senaste istiden har mer vatten än de som ligger längre söderut, men Ryssland är likväl inte blå, utan röd, vilket kanske snarare antyder avsaknad av andra typer av data. -- Innocent bystander (diskussion) 24 juli 2015 kl. 07.24 (CEST)
- Jag testade en del när jag utvecklade funktionen, och oftast gav den vettiga resultat. Ska testa lite mer och fixa statistik. Lsj (diskussion) 23 juli 2015 kl. 21.32 (CEST)
- Det står Ghazni på den bild du länkar till. Det ser ut att finnas några landskapsbilder från Zarghūn Shahr utöver kartorna vid sökning med Google bland bildresultaten, [8]. Höstblomma (diskussion) 23 juli 2015 kl. 18.53 (CEST)
- Har fått sjöarna att fungera nu. Kom på en algoritm som fungerar för alla sjöar där sjöytan "sitter ihop" inom DEM-upplösningen (sund smalare än 1 pixel (3") kan den missa; Mälaren klipps av vid Kvicksund). Boten kan identifiera vilka platser som ligger inom ca 2 km från en sjö, liksom öar i sjön. Lsj (diskussion) 25 juli 2015 kl. 19.42 (CEST)
- Har justerat lite så att det bara är för stora sjöar som 2 km avstånd räknas som "vid" sjön. För småsjöar kör jag med kortare avstånd, ner till 400 meter för små tjärnar. Lsj (diskussion) 25 juli 2015 kl. 20.32 (CEST)
Provkörningar av "ovanligt vanligt"
[redigera wikitext]Har provkört några länder för att se vad som markeras som ovanligt vanliga saker där:
- Andorra: klippformationer, skogar, grottor och dalar.
- Samoa: uddar, kullar, vikar, berg och öar.
- Moldavien: på enstaka ställen kullar och dalar, på de flesta ställen ingenting
- Lettland: sjöar och öar, samt på enstaka ställen våtmarker, vattendrag och naturresurser.
- Danmark: öar, uddar, platser på havsbottnen (d.v.s. grund m.m.), sjöfartsrelaterade platser, skogar, kanaler, och enstaka andra.
- Förenade arabemiraten: Öknar, källor (d.v.s. oaser), dalar, berg, öar.
- Laos: Berg, vattendrag, klippformationer, kullar, och en handfull öar och stränder. Stränderna förvånade mig lite, men GeoNames klassar visst även badstränder vid floder och sjöar som "beach".
Lsj (diskussion) 25 juli 2015 kl. 12.41 (CEST)
- Sverige: Öar, sjöar, klippformationer, havsbotten, rev, kullar, uddar, sund, vikar, berg, våtmarker, sjöfart och kanaler. För att få en uppfattning om frekvensen, så är det ungefär 15% av Sveriges platser som har ovanligt många sjöar i trakten, och lika många har öar, ner till 0,1% med kanaler. Lsj (diskussion) 25 juli 2015 kl. 12.58 (CEST)
- Botswana: på enstaka ställen kullar och dalar, på de flesta ställen ingenting.
- Afghanistan: Berg, berg, berg... och några kanaler, kullar, källor, slätter, och dalar. Enstaka öknar, klippformationer, sjöar och vattendrag.
Lsj (diskussion) 25 juli 2015 kl. 13.10 (CEST)
- "Stränder" kanske kräver kanske någon vaksamhet. Strand är på svenska betydligt vidare än en:beach, kanske motsvarar en:shore? Om det alltid handlar om badstränder (eller sandstränder) så kanske det är vad som ska skrivas, men kanske avses även stränder som inte är lämpliga för bad eller är sandiga? (jag har dålig känsla för de engeska orden) I så fall blir det kanske knepigare att hitta ett lämpligt svenskt ord. En sökning på kso ger vid handen många terrängnamn som slutar på -strand eller -stranden, av vilka endast få torde kunna kallas en:beach. Taxelson (diskussion) 25 juli 2015 kl. 13.37 (CEST)
- Min kategori "stränder" är just så bred som du vill ha den, och inkluderar allt det som Geonames callar coast, beach, shore m.m. Men just i Laos råkade det vara ett antal "beach" som triggade. Lsj (diskussion) 25 juli 2015 kl. 13.48 (CEST)
Imponerad och en fråga
[redigera wikitext]Hej,
Jag måste säga att jag är imponerad av det här projektet, på två sätt:
- vad långt ni har kommit
- vad många saker det är som måste utredas (och därmed vilket tålamod ni har)
Stort beröm! Jag ser fram emot resultatet.
En fråga dock. Det känns som att några av de här sakerna borde vara lösta någon annanstans. Jag kan förstå om de inte är det för svenska förhållanden, och som amatör inom området är jag ytterligt okvalificerad att fråga, men jag tycker att det borde finnas några kartografer eller kartintresserade språkforskare som har genomfört någonting liknande. Om det inte är det är det här ett ypperligt tillfälle att sprida kunskapen, så att den går att återanvända på andra språkversioner och inom forskningsvärlden. Jag tror att ni har tänkt på det, men det står inte jättemycket om det på den här sidan - och jag kan förstå att saker och ting i projektet behöver lösas först, men det vore nog bra med en guide för oss vanliga mugglare :-) Den guiden skulle sedan kunna användas för att göra omvärlden uppmärksammad på det här coola projektet.//Hannibal (diskussion) 25 juli 2015 kl. 11.19 (CEST)
- Offtopic Just det som youtube handlade om där, är något som WD-utvecklarna knådar sina små grå med nu. Datamodellen och gränssnittet har varit dåligt synkat. Sedan har vi trollaktiga användare som krånglar till det ytterligare. -- Innocent bystander (diskussion) 25 juli 2015 kl. 12.08 (CEST)
Olika betydelser 2
[redigera wikitext]Mount Pleasant (olika betydelser) (olika betydelser 2) blev kanske kaka på kaka? Mount Pleasant (olika betydelser 2) borde kanske vara tillräckligt. -- Innocent bystander (diskussion) 29 juli 2015 kl. 21.11 (CEST)
- Jo, jag såg också det. Fixat. Lsj (diskussion) 29 juli 2015 kl. 21.41 (CEST)
DNWB-buggen
[redigera wikitext]DNWB-buggen [9] är inte fixad än. -- Innocent bystander (diskussion) 29 juli 2015 kl. 21.13 (CEST)
- Men vaf...? Nu lägger boten explicit in "{{Geobox|1=Region...", och det hjälper ändå inte? Lsj (diskussion) 29 juli 2015 kl. 21.42 (CEST)
- Inte kört på länge. Men vill minnas att jag använde de funktioner som redigerade mallar, och då vill jag minnas att det funkade bra. -- Innocent bystander (diskussion) 29 juli 2015 kl. 21.47 (CEST)
- Har kollat nu. Ettan tas bort direkt av första anropet till SetTemplateParameter (för en annan parameter). Enklaste är nog att lägga tillbaka den explicit i slutet. Lsj (diskussion) 29 juli 2015 kl. 22.15 (CEST)
- Ok, det fungerar: Yepton Peak. Lsj (diskussion) 29 juli 2015 kl. 22.28 (CEST)
- Har kollat nu. Ettan tas bort direkt av första anropet till SetTemplateParameter (för en annan parameter). Enklaste är nog att lägga tillbaka den explicit i slutet. Lsj (diskussion) 29 juli 2015 kl. 22.15 (CEST)
- Inte kört på länge. Men vill minnas att jag använde de funktioner som redigerade mallar, och då vill jag minnas att det funkade bra. -- Innocent bystander (diskussion) 29 juli 2015 kl. 21.47 (CEST)
Redigeringskommentarer
[redigera wikitext]Får man be om lite tydligare redigeringskommentarer? "Robotskapar grensida"/"Robotskapar Samoa-artikel" är fullt tillräckligt. -- Innocent bystander (diskussion) 29 juli 2015 kl. 21.26 (CEST)
- Fixat. Lsj (diskussion) 29 juli 2015 kl. 21.48 (CEST)
Två Freetown i Sierra Leone
[redigera wikitext]Freetown (olika betydelser) (olika betydelser 2)Freetown (olika betydelser 2) listar tre Freetown i Sierra Leone. Två av dem länkar samma artikel. Kikade om WD länkade två Geonames-id, (vilket hade förklarat saken) men det ser inte så ut. 2409306 är huvudstaden. 9180331 är adm3. -- Innocent bystander (diskussion) 29 juli 2015 kl. 21.38 (CEST)
- Det här beror på botens algoritm för att avgöra om en befintlig artikel matchar ett Geonames-objekt. Finns det en befintlig artikel med rätt namn, så försöker boten hitta koordinater i alla mallar i artikeln. Om koordinaterna matchar (inom några km) latitud/longitud i GeoNames antar boten att artikeln handlar om samma plats. Och här har två Geonames-objekt båda fått träff på samma befintliga artikel Freetown. Tror detta är svårt att göra något åt utan att vi riskerar att boten skapar mängder med dubletter. Lsj (diskussion) 29 juli 2015 kl. 21.52 (CEST)
- Ja. Och utan att veta så mycket om adm3 i Sierra Leone, så är det småsvårt att fixa för hand också... -- Innocent bystander (diskussion) 30 juli 2015 kl. 09.58 (CEST)
- Samma sak finns i Falmouth (olika betydelser). Lsj (diskussion) 30 juli 2015 kl. 19.05 (CEST)
- Ja. Och utan att veta så mycket om adm3 i Sierra Leone, så är det småsvårt att fixa för hand också... -- Innocent bystander (diskussion) 30 juli 2015 kl. 09.58 (CEST)
Fel i särskiljning
[redigera wikitext]Har hittat ett fel i särskiljningsalgoritmen, se t.ex. Old Road. Fixat i koden, men tar någon vecka att köra om alla särskiljningar. Lsj (diskussion) 29 juli 2015 kl. 22.08 (CEST)
- Har också hittat länkar till grensidor i vissa artiklar. Känns inte som det är mycket att göra åt, förrän du är "färdig" med din körning. -- Innocent bystander (diskussion) 30 juli 2015 kl. 09.56 (CEST)
- Länkarna till grensidor är samma bugg som Old Road - i ett visst specialfall tilldelades en artikel samma namn som en grensida. Omkörning pågår, och jag tror också jag har hittat ett sätt att snabba upp processen. Lsj (diskussion) 30 juli 2015 kl. 10.30 (CEST)
- Ok, nu verkar det bli rätt -- se ny version av Old Road. Lsj (diskussion) 30 juli 2015 kl. 18.56 (CEST)
- Länkarna till grensidor är samma bugg som Old Road - i ett visst specialfall tilldelades en artikel samma namn som en grensida. Omkörning pågår, och jag tror också jag har hittat ett sätt att snabba upp processen. Lsj (diskussion) 30 juli 2015 kl. 10.30 (CEST)
Brome (olika betydelser) har Brome (kommun) för Kanada och Tyskland. Eftersom det var Kanada ändrade jag Tyskland. Maundwiki (diskussion) 13 april 2016 kl. 22.22 (CEST)
- Ser ut att vara samma bugg som i #Homonymen Bourscheid. Trodde jag hade fixat den redan. Lsj (diskussion) 13 april 2016 kl. 23.37 (CEST)
Carolina
[redigera wikitext]Något gick fel med särskiljning för Carolina i Puerto Rico. Maundwiki (diskussion) 24 januari 2016 kl. 15.45 (CET)
- Märkligt fel. På något sätt måste det hänga ihop med den befintliga artikeln Carolina, Puerto Rico, men jag förstår inte riktigt hur det gått till. Har du sett något annat liknande? Lsj (diskussion) 24 januari 2016 kl. 17.59 (CET)
- Nej men har gjort väldigt få men kanske East Mount Magnet. Maundwiki (diskussion) 24 januari 2016 kl. 19.38 (CET)
East Mount Magnet
[redigera wikitext]East Mount Magnet omdirigerar till Carron. Kolla även i Mount Magnet (region) som jag antar ska vara East Mount Magnet för Carron. Maundwiki (diskussion) 24 januari 2016 kl. 19.38 (CET)
Lilli
[redigera wikitext]Är detta samma problem? [10] Maundwiki (diskussion) 24 april 2016 kl. 17.05 (CEST)
Acre
[redigera wikitext]Du kanske har kört allt men delstaten i Brasilien är "Acre (delstat)" inte Acre. Fixade vad som fanns och på förgreningssidan när jag infogade. Maundwiki (diskussion) 3 maj 2016 kl. 16.25 (CEST)
- Går att botfixa i artiklarna. Tack för att du såg det. Lsj (diskussion) 3 maj 2016 kl. 22.14 (CEST)
St Anne
[redigera wikitext]St Anne är en omdirigering till en förgrening. St Anne, Guernsey är artikeln som det borde länka till (jag flyttade till ärikelrymedn. Boten använde omdirigeringen som länk för artiklarna "ligger nära St Anne, Guernsey". Du har kanske redan fixat detta i koden. Wikilänkarna fixade. Maundwiki (diskussion) 20 oktober 2016 kl. 01.08 (CEST)
Havsbotten
[redigera wikitext]Kul du kommit igång! Jag har i två artiklar sett texten finns ovanligt många namngivna halvöar, öar, bukter och havsbotten. Det sista ordet känns lite konstigt. Om det är ovanligt många namngivna havsbottnar, bör väl ordet stå i plural.Yger (diskussion) 30 juli 2015 kl. 22.10 (CEST)
- Ja, den benämningen blev konstig. Det var mitt försök att skapa ett kategorinamn för "landformer" på havets botten (grund, rev, m.m.). Kunde man kalla det "undervattensformer" istället? Eller har du något bättre förslag? Lsj (diskussion) 30 juli 2015 kl. 23.49 (CEST)
- Jag tycker nog landformer på havet botten är mes korrekt.Yger (disk.) 31 juli 2015 kl. 04.26 (CEST)
tidszon
[redigera wikitext]På Potworks Dam (reservoar) anges tidzonen till AST (UTC-4.0), och på förgreningssidan finns en Afghanistan Standard Time, vilket blir något förvirrande... Borde kanske räcka att länka UTC, och ta bort decimalen, eller ändra tecknet till komma ","? Sedan var det lite tjatigt med "Potworks Dam" upprepat 6 gånger på 2 1/2 rader, men det är kanske svårare att ändra på med automatiken? Taxelson (diskussion) 30 juli 2015 kl. 22.41 (CEST)
- Potworks Dam (damm) är en dubblett - lite utförligare än föregående, men dubblett likväl. Taxelson (diskussion) 30 juli 2015 kl. 22.51 (CEST)
- AST står för en:Atlantic Standard Time, vilket väl borde läggas till på grensidan. Man kunde skippa tidszonsnamnen, men det vore lite synd. Formateringen ska jag fixa. Upprepningarna är förvisso svåra att komma åt, eftersom olika artiklar har olika kombinationer av de 6 olika meningarna, och alla kombinationer måste fungera. Jag har tänkt en del på det, men inte hittat någon riktigt bra lösning. Att ersätta namnet med pronomen är heller inte helt enkelt, eftersom boten då måste "veta" om det ska vara "den" eller "det" eller "de". Potworks Dam (reservoar) och Potworks Dam (damm) är faktiskt inte dubletter, tekniskt sett. GeoNames har två separata objekt för fördämningen och den vattenreservoar som den bildar, och dessa ger upphov till de två artiklarna. Samma sak i princip som att vi har separata artiklar för Porjus kraftverk och Stora Lulevatten, men medger att det blir lite fånigt när det är så smått som Potworks. Dock svårt för boten att avgöra var fånighetsnivån ligger. Lsj (diskussion) 30 juli 2015 kl. 23.47 (CEST)
Platstypers benämning
[redigera wikitext]GeoNames innehåller en mängd olika platstyper, och det är inte alltid enkelt att avgöra både vad saker ska heta på svenska, och vilken artikel på svwp som en viss platstyp ska länkas till. Jag tror alla benämningarna behöver gås igenom innan jag kör i större skala. Har idag skapat en lista med tänkta benämningar på geografiska platstyper, och vad de ska länka till: Användare:Lsjbot/linkfeatures. Tacksam för feedback på denna. Ändra gärna direkt i listan. Lsj (diskussion) 30 juli 2015 kl. 23.53 (CEST)
Första ledet vid varje punkt (t.ex. H.BAY) är platstypskoden från GeoNames, andra ledet är hur det blir benämnt och länkat i en artikel ("Xxx är en vik"), och tredje ledet är GeoNames förklaring på engelska. Lsj (diskussion) 31 juli 2015 kl. 10.51 (CEST)
- Har låtit boten uppdatera listan i ljuset av inkomna synpunkter. Lsj (diskussion) 3 augusti 2015 kl. 17.25 (CEST)
- Ny uppdatering, främst undervattensplatserna. Har lagt till "undervattens-" eller "djuphavs-" på många av dem. Lsj (diskussion) 3 augusti 2015 kl. 21.54 (CEST)
Artiklarnas utformning mm
[redigera wikitext]Jag har tittat på några artiklar som körts fram och har några sakker jag skulle vilja förbättrades eller reddes ut. Vi kan ta artiklarna Parish of Saint Peter (församling i Antigua och Barbuda) och Parish of Saint Paul som utgångspunkt. Nasko (diskussion)
Befolkningssiffror och andra föränderliga uppgifter
[redigera wikitext]- Befolkningssiffrorna i artiklarna har importerats från eswiki. Befolkningsuppgifter finns i Geonames. Varför har inte uppgifterna plockats därifrån? Befolkningsuppgifterna på eswiki är källösa.
- I artikeln Parish of Saint Peter (församling i Antigua och Barbuda) petade jag in lite uppgifter i Wikidata. Infoboxen plockar siffrorna därifrån, men inte källan. Ingressen påverkas inte av Wikidata, så där ligger de gamla uppgifterna kvar.
- Det vore lämpligt om även löptexten klarade plocka sådana uppgifter från Wikidata. En mall kan t.ex. se ut något i stil med {{Befolkningssiffror|Befolkning=1234|År=2008|Källa=http:www.statistik.org/12345678}} och t.ex. ge resultatet: 1 234 (2008)[6]. Om någon förser Wikidata med siffror t.ex. 2345 invånare för 2011 skulle resultatet bli: 2 345 (2011)[6].
- Själv tycker jag det är olämplig att skriva ut befolkningsuppgifterna på de orter som finns listade i artiklarna. Dom kommer nog aldrig uppdateras förhand och kommer fort att bli inaktuella.
- Befolkningssiffrorna i GeoNames är oftast bra, men någon gång ibland är de tokfel (tror det är koder eller notnummer som hamnat i fel fält och blir befolkningssiffror). När jag har siffror både från en wiki och från GeoNames väljer jag därför wiki-siffrorna, som sällan är tokfel. Finns befolkning (P1082) i wikidata använder jag den i geoboxen, men det är ganska sällsynt.
- Hur plockar man på ett smidigt sätt källan från Wikidata?
- Se d:User talk:Lsj#Naskos tips.
- Ok. Dem kan vi nog undvara.
- Lsj (diskussion) 31 juli 2015 kl. 16.43 (CEST)
Språk
[redigera wikitext]Artiklarnas språk behöver få mer flyt. Jag har följande förslag till förändringar.
- Försök få in två faktauppgifter i en mening där så är lämpligt. Meningarna "Antalet invånare är 6117.[2] Parish of Saint Paul har en area på 46,00 kvadratkilometer." skulle kunna ändras till "År 2011 hade församlingen 5 307 och en yta på 33,00 kvadratkilometer." eller något i den stilen. Att försöka få in fler än två faktauppgifter förbättrar inte läsningen särskilt mycket och gör arbetet oerhört komplext. Att lägga in två faktauppgifter i en mening leder till fyra möjliga alternativ (tänk fyrfältsdiagram).
- Jag tycker att artikelnamnet upprepas lite för många gånger i artikeltexten. Byt ut namnet mot "församlingen", "berget", "havsviken", "sjön" - eller vad nu artikelsubjektet handlar - om i ett par meningar. Det skulle göra artikeln avsevärt mindre enformig och mer lättläst.
- Listan med platser i slutet av artikeln borde läggas under egen rubrik och rensar från föränderliga uppgifter, t.ex. befolkningsuppgifter, så länge de inte hämtas från Wikidata.
- Använd "formatnum:" när siffror anges så siffrorna formateras med tusendelsavgränsare och decimaltecken enl. rådande standard (som kan ändras i framtiden).
Det var allt för den här gången. Efter lite snidande på koden och artiklarna utformning kommer det här projektet att bli bättre än den genomsnittliga artikeln på svwikipedia. Nasko (diskussion) 31 juli 2015 kl. 15.12 (CEST)
- 1. Ska tänka på det. Men det är redan mycket komplex kod med många alternativ, inte minst därför att olika platstyper ibland kräver egna varianter. Ditt exempel har f.ö. tre faktauppgifter (årtalet också), och kräver därför åtta varianter av meningen.
- Årtalet är inte så viktigt. Meningen går givetvis att omformulera. På utvalda (högfrekventa) faktauppgifter där det att göra frasen som: if faktauppgift1=true && faktauppgift2=true then fras3 else enmeningperfaktauppgiftsrutin. En tanke bara... Nasko (diskussion) 31 juli 2015 kl. 19.04 (CEST)
- 2. Det tycker jag också. Inte helt enkelt dock. Det blir också en hel del kombinatorik (olika kombinationer av meningar finns med i olika artiklar), plus att jag måste för hand skriva in bestämd form för några hundra platstyper om jag gör på det sättet. Ska fundera på vad som går att göra.
- 3. Ok.
- 4.Hmm... nu formaterar jag siffror i botkoden med .NET:s kulturkänsliga formateringsrutiner. Att använda
{{formatnum}}
hade jag inte tänkt på, det är nog smidigare. Tack för tipset. Frågan är om den funkar på andra språkversioner? Lsj (diskussion) 31 juli 2015 kl. 16.53 (CEST) - Lsj (diskussion) 31 juli 2015 kl. 16.53 (CEST)
- Formatnum är inte någon mall utan ingår i installationen som magiskt ord och finns på alla projekt. På projekt som inte är språkspecifika är det ingen vits att använda, men överallt annars ska det funka. Nasko (diskussion) 31 juli 2015 kl. 19.04 (CEST)
- 2: Kanske kan använda mallen i wiktionary som för wikt:Vik ser ut så här: {{sv-subst-n-ar}}, och bygga Vik+e+n utifrån den. (Fast det kanske kan bli marigt att anpassa till andra språk, som kanske har annan grammatik?) Taxelson (diskussion) 31 juli 2015 kl. 17.39 (CEST)
- Fast när det är sammansatta platstyper blir det krångligt, och när det är plural... Taxelson (diskussion) 31 juli 2015 kl. 18.25 (CEST)
- Jo. Och att tolka wiktionary med bot har jag tittat på i ett annat sammanhang. Inte alls enkelt tyvärr. Lsj (diskussion) 31 juli 2015 kl. 18.30 (CEST)
- Fast när det är sammansatta platstyper blir det krångligt, och när det är plural... Taxelson (diskussion) 31 juli 2015 kl. 18.25 (CEST)
- 2: Kanske kan använda mallen i wiktionary som för wikt:Vik ser ut så här: {{sv-subst-n-ar}}, och bygga Vik+e+n utifrån den. (Fast det kanske kan bli marigt att anpassa till andra språk, som kanske har annan grammatik?) Taxelson (diskussion) 31 juli 2015 kl. 17.39 (CEST)
Webblänkar
[redigera wikitext]Testartiklarnas källor innehållet några länkar till GeoNames och Viewfinder Panoramas Digital Elevation Model. Nu ligger länkarna direkt i artiklarna, och kommer att användas i ett mycket stort antal artiklar. Om någon av sidorna skulle flytta blir länkrötan mycket omfattande.
Förslag: Lägg webblänkarna i några mallanrop.
- Ex {{Geonames|3576016|Parish of Saint Peter}} skulle skapa länken [http://www.geonames.org/3576016 Parish of Saint Peter] med resultatet Parish of Saint Peter.
- Ex {{Viewfinder Panoramas Digital Elevation Model}} skulle ge länken [http://www.geonames.org/about.html GeoNames.Org (cc-by)] med resultatet GeoNames.Org (cc-by).
Skulle länkröta inträffa är det förhoppningsvis bara att ändra i någon av mallarna. Nasko (diskussion) 1 augusti 2015 kl. 19.46 (CEST)
- Det var en bra idé. Det blev sådan länkröta i art-projektet för något år sedan, och boten tillbringade mer än en månad med att byta en miljon länkar. Lsj (diskussion) 1 augusti 2015 kl. 20.50 (CEST)
- Ok, har skapat
{{Geonameslänk}}
,{{Geonamesabout}}
och{{Viewfinderlänk}}
och lagt in anrop i botkoden. Lsj (diskussion) 2 augusti 2015 kl. 21.50 (CEST)- Bra! När jag testade Geonames upptäckte jag att det räcker att länka till gnid i länken (http://www.geonames.org/{{gnid}}). Om detta är bra eller dåligt vet jag inte, men antagligen undviks länkröta om posten skulle byta namn. Nasko (✉) 2 augusti 2015 kl. 22.12 (CEST)
- Det är exakt så länken skapas i Geoboxen. -- Innocent bystander 3 augusti 2015 kl. 13.26 (CEST)
- Bra! När jag testade Geonames upptäckte jag att det räcker att länka till gnid i länken (http://www.geonames.org/{{gnid}}). Om detta är bra eller dåligt vet jag inte, men antagligen undviks länkröta om posten skulle byta namn. Nasko (✉) 2 augusti 2015 kl. 22.12 (CEST)
- Ok, har skapat
Vad boten länkar till
[redigera wikitext]Förutom platstyperna är det ett tre andra sorters artiklar som boten länkar till. Jag har skapat listor här för att vi ska kunna kolla så att boten länkar rätt:
- Språk: Användare:Lsjbot/languagelinks
- Länder:Användare:Lsjbot/countrylinks
- Tidszoner: Användare:Lsjbot/timezonelinks
Uppskattar feedback på dessa. Lsj (diskussion) 2 augusti 2015 kl. 11.31 (CEST)
- Vilken typ av kod används för språken? -- Innocent bystander 3 augusti 2015 kl. 13.32 (CEST) (ISO-what?)
- Framförallt de språkkoder som används i altnames-filen i GeoNames för att ange vilket språk ett namn kommer från, förutom att jag struntar i de efterled som anger olika dialekter (en-US etc.). Iso-koder såvitt jag kan se. Lsj (diskussion) 3 augusti 2015 kl. 17.29 (CEST)
- Borde languagelinks vara en tabel i ISO 639 ny sektion ISO 639-2? Maundwiki (diskussion) 3 augusti 2015 kl. 18.41 (CEST)
- Några ISO-standarder finns på Wikidata, se d:Q9027#P218. -- Innocent bystander 3 augusti 2015 kl. 19.52 (CEST)
- Kan boten använda wikidata för att wikilänka till t.ex. "Svenska"? Min tanke var att framtida botprojekt kan använda en redan skapad dataöversättning. Men wikidatasidan var på spanska som jag inte klarar av. Jag har nog aldrig förstått hur wikidata ser ut i text som normalanvändare kan fixa. Maundwiki (diskussion) 3 augusti 2015 kl. 20.32 (CEST)
- Tekniskt sett ja, men lite onödigt. Här tänkte jag snarare att Lsj skulle kunna "mjölka" Wikidata på användandet av ISO-koder i objekt som avser olika språk.
- Byter till svenska gör du längst upp, till vänster om den ikon som föreställer dig! Använd även gärna Babel-parsern i din användarsida! Se tex min användarsida. -- Innocent bystander 3 augusti 2015 kl. 20.39 (CEST)
- Kan boten använda wikidata för att wikilänka till t.ex. "Svenska"? Min tanke var att framtida botprojekt kan använda en redan skapad dataöversättning. Men wikidatasidan var på spanska som jag inte klarar av. Jag har nog aldrig förstått hur wikidata ser ut i text som normalanvändare kan fixa. Maundwiki (diskussion) 3 augusti 2015 kl. 20.32 (CEST)
- Några ISO-standarder finns på Wikidata, se d:Q9027#P218. -- Innocent bystander 3 augusti 2015 kl. 19.52 (CEST)
- Borde languagelinks vara en tabel i ISO 639 ny sektion ISO 639-2? Maundwiki (diskussion) 3 augusti 2015 kl. 18.41 (CEST)
- Framförallt de språkkoder som används i altnames-filen i GeoNames för att ange vilket språk ett namn kommer från, förutom att jag struntar i de efterled som anger olika dialekter (en-US etc.). Iso-koder såvitt jag kan se. Lsj (diskussion) 3 augusti 2015 kl. 17.29 (CEST)
- Vad gäller "timezonelinks", så borde man bygga in det här i Geoboxen istället för att tvinga roboten att hålla reda på saken. Man borde också kunna lägga in de koder som finns i Geonames, i form av "Africa/Abidjan" till "Pacific/Wallis". De används ju tex i MediaWikis programvara och jag vill minnas att jag sett dem på många fler ställen. -- Innocent bystander 3 augusti 2015 kl. 20.45 (CEST)
- Ändra i Geobox ger jag mig inte gärna på. Boten har tillgång till "Africa/Abidjan" etc koderna, men jag har inte kommit på ett bra sätt att använda dem -- förslag på hur? Lsj (diskussion) 4 augusti 2015 kl. 00.15 (CEST)
- Ett sätt skulle kanske vara att låta en mall/modul tolka om alla "Africa/Abidjan"-koder till lämpliga tidszonsartikellänkar utifrån en lista. Då behöver man bara ändra i den listan, ifall det sker några förändringar bland tidszonsartiklarna. ⬤Boⅳⅰᴇ 4 augusti 2015 kl. 13.37 (CEST)
- Det är ungefär det jag gör i botkoden nu. Skulle kunna porta den koden till Lua, kanske? Lsj (diskussion) 4 augusti 2015 kl. 14.10 (CEST)
- Det är ungefär det jag hade tänkt direkt i Geoboxen! :) Innocent bystander 4 augusti 2015 kl. 15.21 (CEST)
- Det är ungefär det jag gör i botkoden nu. Skulle kunna porta den koden till Lua, kanske? Lsj (diskussion) 4 augusti 2015 kl. 14.10 (CEST)
- Ett sätt skulle kanske vara att låta en mall/modul tolka om alla "Africa/Abidjan"-koder till lämpliga tidszonsartikellänkar utifrån en lista. Då behöver man bara ändra i den listan, ifall det sker några förändringar bland tidszonsartiklarna. ⬤Boⅳⅰᴇ 4 augusti 2015 kl. 13.37 (CEST)
- Ändra i Geobox ger jag mig inte gärna på. Boten har tillgång till "Africa/Abidjan" etc koderna, men jag har inte kommit på ett bra sätt att använda dem -- förslag på hur? Lsj (diskussion) 4 augusti 2015 kl. 00.15 (CEST)
Markeringar för framtida underhåll av artiklarna
[redigera wikitext]Idén har kommit upp att på något sätt lägga in markeringar i artiklarna för att underlätta framtida underhåll, antingen manuellt eller med bot. Det kan antingen vara <!--kommentarer i wikikoden--> eller dolda kategorier, eller något annat? Tanken är att man enkelt ska kunna finna olika typer av botskapade artiklar i framtiden, för att kunna bearbeta dem. Redan i djurartiklarna lade jag ett par sådana markörer i form av kommentarer, se t.ex. Xerophaeus ruandanus. Synpunkter på detta? Lsj (diskussion) 2 augusti 2015 kl. 18.22 (CEST)
- En god idé. -- Innocent bystander 3 augusti 2015 kl. 13.25 (CEST)
- Lägger du in "föränderliga uppgifter" såsom folkmängd direkt i brödtexten, så kan det vara en mycket bra idé att stoppa i extra kommentarer runt dessa, för att antingen enkelt byta ut uppgiften mot en Wikidata-baserad mall senare, eller för botuppdateringar. -- Innocent bystander 3 augusti 2015 kl. 13.28 (CEST)
- Om man ska markera föränderliga uppgifter kan en enkel mall/modul vara smidig. Då kan formatering och källa läggas in i mallen och på så vis göra texten mer ren från kod.
- "'''Kvarstad''' har {{Befolkning Geonames|12345}} invånare" skulle resultera i: "Kvarstad har 12 345[1] invånare.
- I ett senare skede skulle mallen/modulen kunna modifieras med anrop till Wikidata om bra källbelagda uppgifter finns där. Kommentarer har säkert sina fördelar, men jag tycker en mall/modul är elegantare. Nasko (✉) 3 augusti 2015 kl. 17.05 (CEST)
- Tror det kan finnas anledning att ha olika markörer för olika syften. Kommentarer kan vara bra för att med bot kunna hitta både en viss typ av artiklar, och kunna hitta i artikeltexten. T.ex. vill jag lägga in platstypskoderna från GeoNames som kommentarer, för att kunna återfinna alla artiklar med samma kod. Att lägga in mallar för föränderliga uppgifter låter i princip klokt -- men blir det inte förvirrande med
{{Befolkning Geonames|12345}}
om den mallen så småningom levererar en helt annan siffra än 12345? Lsj (diskussion) 4 augusti 2015 kl. 00.32 (CEST)- Jag har inga problem med den lösningen heller. Det är ditt projekt. Använd det du tycker är smidigast. Nasko (✉) 4 augusti 2015 kl. 00.44 (CEST)
- Den modell som jag förespråkar, är att om en parameter i en mall saknas, så ska det fungera som en "signal" till mallen att (försöka) använda Wikidata istället. Ett alternativ är att skriva in parametervärdet "wikidata" eller dylikt. Se tex parameter "map" i Mall:Kommunfakta. På samma sätt kan en använd parameter betyda att lokal data ska visas, och en tom parameter att ingen data alls ska visas. Så mitt tips är att när vi i varje artikel är "mogen" att använda Wikidata, så tömmer vi mallen på "12345". Det är tekniskt möjligt att göra med robot. -- Innocent bystander 4 augusti 2015 kl. 08.42 (CEST)
- Fast poängen med en mall skulle ju vara att slippa ändra i miljoner artiklar... Lsj (diskussion) 4 augusti 2015 kl. 10.37 (CEST)
- Ja, men ändringen behöver i princip bara göras en gång per artikel. Och den gången blir när det kommit in användbar data i Wikidata. Risken finns ju att det aldrig kommer att komma sådan data till exempelvis Somalia. För sådana fall är det ingen hjälp alls att koppla in Wikidata i mallen för alla artiklar samtidigt. Vill man inte göra en sådan körning i hela artikelsortimentet, går det att bygga in kategorianrop i mallarna som talar om när det kan vara dags. -- Innocent bystander 4 augusti 2015 kl. 15.27 (CEST)
- Fast poängen med en mall skulle ju vara att slippa ändra i miljoner artiklar... Lsj (diskussion) 4 augusti 2015 kl. 10.37 (CEST)
- Den modell som jag förespråkar, är att om en parameter i en mall saknas, så ska det fungera som en "signal" till mallen att (försöka) använda Wikidata istället. Ett alternativ är att skriva in parametervärdet "wikidata" eller dylikt. Se tex parameter "map" i Mall:Kommunfakta. På samma sätt kan en använd parameter betyda att lokal data ska visas, och en tom parameter att ingen data alls ska visas. Så mitt tips är att när vi i varje artikel är "mogen" att använda Wikidata, så tömmer vi mallen på "12345". Det är tekniskt möjligt att göra med robot. -- Innocent bystander 4 augusti 2015 kl. 08.42 (CEST)
- Jag har inga problem med den lösningen heller. Det är ditt projekt. Använd det du tycker är smidigast. Nasko (✉) 4 augusti 2015 kl. 00.44 (CEST)
- Tror det kan finnas anledning att ha olika markörer för olika syften. Kommentarer kan vara bra för att med bot kunna hitta både en viss typ av artiklar, och kunna hitta i artikeltexten. T.ex. vill jag lägga in platstypskoderna från GeoNames som kommentarer, för att kunna återfinna alla artiklar med samma kod. Att lägga in mallar för föränderliga uppgifter låter i princip klokt -- men blir det inte förvirrande med
- Lägger du in "föränderliga uppgifter" såsom folkmängd direkt i brödtexten, så kan det vara en mycket bra idé att stoppa i extra kommentarer runt dessa, för att antingen enkelt byta ut uppgiften mot en Wikidata-baserad mall senare, eller för botuppdateringar. -- Innocent bystander 3 augusti 2015 kl. 13.28 (CEST)
Vad är ett land?
[redigera wikitext]GeoNames har en "generös" definition av vad som är ett land -- se Maundwikis kommentarer i Användare:Lsjbot/countrylinks. Hur gör vi med dessa pseudoländer? Boten inleder normalt en artikel med "X är en Y i Z-land." Min tanke är att för icke fullt självständiga "länder" sätta dit moderlandet inom parentes: "X är en Y i Amerikanska Samoa (USA)." Blir det bra så? Lite synd att bara säga "X är en Y i USA." för något som faktisk inte ligger i de vanliga 50 staterna. Lsj (diskussion) 2 augusti 2015 kl. 20.21 (CEST)
- Instämmer, min tanke var inte att skriva USA utan området med en förklaring. Maundwiki (diskussion) 2 augusti 2015 kl. 21.10 (CEST)
- Min åsikt är att du nog inte behöver skriva "Amerikanska Samoa (USA)". Amerikanska Samoa är fullt tillräckligt.
- Se tex Luquillo, Puerto Rico. Ok, vi är inte konsekventa alltid här, se tex San Juan, Puerto Rico, men i mer eller mindre självständiga områden så brukar vi använda självstyret som 'land'. Det gäller Grönland, Färöarna och många fler. Vill man veta mer om områdets juridiska status kan man följa länken. Det är nämligen ganska ofta ganska komplicerat. Kategoriträdet får däremot gärna avslutas med tex USA över Amerikanska Samoa.
- Svalbard är här ett känt undantag. Sedan kan man förstås fråga sig i hur stor utsträckning Barentsburg lyder under norsk juridiktion, men det är undantaget som bekräftar regeln.
- Mer eller mindre obebodda områden tror jag inte vi behöver följa de här reglerna för. Jag kan inte minnas att vi har så mycket artiklar här, så vi skapar våra egna prejudikat. Bouvetön, Brittiska territoriet i Indiska oceanen, etc kan nog läggas direkt under Norge/UK etc.
- Frågan är sedan om 'Förenta staternas mindre öar i Oceanien och Västindien' är en särskilt bra val av 'land' över huvud taget?
- Antarktis bör inte läggas under något land. En forskningsstation kan tillhöra ett land, men inte geografin runt det.
- En fråga är om "Mikronesien" verkligen avser det geografiska området och inte landet? Mikronesiens federerade stater saknar jag nämligen i listan.
- -- Innocent bystander 3 augusti 2015 kl. 07.44 (CEST)
- Jag ser helst en lösning som inte innebär alltför många specialfall. Tekniskt vore det inte svårt att lägga in en parameter "moderland" för alla "länder" som vi tycker behöver det, och som genererar moderlandets namn inom parentes. Tycker nog överlag att territorier som ligger långt från moderlandet (och utanför moderlandets positionskarta) inte ska sägas ligga direkt i moderlandet, det leder läsaren fel. Förenta staternas mindre öar i Oceanien och Västindien har vi en artikel om, även om namnet är klumpigt (och positionskartan lika klumpig). "Mikronesien" syftar naturligtvis på landet, inte området. Antarktis får behandlas som om det vore ett eget land. "Svalbard och Jan Mayen" blir krångligt, jag vet inte varför Geonames har valt att slå ihop dem, såvitt jag kan utröna utgör de inte en juridisk eller administrativ enhet på någon nivå. Kategoriträdet på landsnivå finns redan, så det petar inte boten i. Lsj (diskussion) 4 augusti 2015 kl. 00.45 (CEST)
Mikronesien
[redigera wikitext]” | "Mikronesien" syftar naturligtvis på landet, inte området. | „ |
Antarktis
[redigera wikitext]” | Antarktis får behandlas som om det vore ett eget land. | „ |
Förenta staternas mindre öar i Oceanien och Västindien
[redigera wikitext]- RE: "Jan Mayen och Svalbard", så handlar det nog om en ISO-standard som Geonames slaviskt följt. Se d:Q842829.
- RE: "Förenta staternas mindre öar i Oceanien och Västindien", hur mycket material har du för detta "land"?
- -- Innocent bystander 4 augusti 2015 kl. 08.31 (CEST)
- Förenta staternas mindre öar i Oceanien och Västindien har 271 poster i Geonames, varav åtskilliga inte relevanta platstyper. Kan bli ett hundratal artiklar. Låter inte som något vi ska lägga väldigt mycket möda på. Då är Svalbard viktigare att få rätt, både för att det är 20 ggr mer artiklar, och för att fler svensktalande bryr sig. Lsj (diskussion) 4 augusti 2015 kl. 08.39 (CEST)
Jan Mayen och Svalbard
[redigera wikitext]- Jag anar att det inte är särskilt svårt att helt enkelt skriva över "Jan Mayen och Svalbard" med "Norge". Det blir värre att beskriva "Jan Mayen" respektive "Svalbard" som administrativa nivåer i Norge och få till en fungerande Geobox locator mall. -- Innocent bystander 4 augusti 2015 kl. 08.48 (CEST)
- Det skulle nog fungera utan större problem. Bara att ha kvar ISO-koden SJ men ange "Norge" som svenskt namn på den i koden, så bör både locator och annat trilla på plats (jag använder ISO som nyckel till det mesta i koden). I GeoNames är sedan "Svalbard" och Jan Mayen" ADM1-enheter, så de kommer med i artiklarna ändå. Det skulle bli "X är ett berg i Norge. X ligger i området Jan Mayen, i den norra delen av landet..." Lsj (diskussion) 4 augusti 2015 kl. 08.58 (CEST)
- Låter bra, men finns det inte en risk att Bodö hamnar i södra Norge nu? -- Innocent bystander 4 augusti 2015 kl. 09.01 (CEST)
- Det egentliga Norge får behålla sina vanliga koordinater, så Bodö fortsätter att vara nordligt. Lsj (diskussion) 4 augusti 2015 kl. 09.13 (CEST)
- Låter bra, men finns det inte en risk att Bodö hamnar i södra Norge nu? -- Innocent bystander 4 augusti 2015 kl. 09.01 (CEST)
- Det skulle nog fungera utan större problem. Bara att ha kvar ISO-koden SJ men ange "Norge" som svenskt namn på den i koden, så bör både locator och annat trilla på plats (jag använder ISO som nyckel till det mesta i koden). I GeoNames är sedan "Svalbard" och Jan Mayen" ADM1-enheter, så de kommer med i artiklarna ändå. Det skulle bli "X är ett berg i Norge. X ligger i området Jan Mayen, i den norra delen av landet..." Lsj (diskussion) 4 augusti 2015 kl. 08.58 (CEST)
- Jag anar att det inte är särskilt svårt att helt enkelt skriva över "Jan Mayen och Svalbard" med "Norge". Det blir värre att beskriva "Jan Mayen" respektive "Svalbard" som administrativa nivåer i Norge och få till en fungerande Geobox locator mall. -- Innocent bystander 4 augusti 2015 kl. 08.48 (CEST)
- Med den positionsmall du har i grensidan South Point (olika betydelser) nu, hur funkar det att positionera något i Jan Mayen? -- Innocent bystander 6 augusti 2015 kl. 08.51 (CEST)
- Förmodligen inget vidare. Hade inte tänkt på det. Behövs nog två positionskartor. Lsj (diskussion) 6 augusti 2015 kl. 09.15 (CEST)
- Problemet löst, med hjälp från Larske. Lsj (diskussion) 6 augusti 2015 kl. 21.27 (CEST)
- Förmodligen inget vidare. Hade inte tänkt på det. Behövs nog två positionskartor. Lsj (diskussion) 6 augusti 2015 kl. 09.15 (CEST)
Åland
[redigera wikitext]Åland bör nog inte heller betraktas som "territorier som ligger långt från moderlandet". -- Innocent bystander 4 augusti 2015 kl. 09.37 (CEST)
{{Kartposition Finland}}
inkluderar Åland, så det går nog bra att helt inkorporera i Finland. Eller upprör det åländska känslor på svwp? Lsj (diskussion) 4 augusti 2015 kl. 11.23 (CEST)- Vi har haft några redigeringskrig om sådant som Maarianhamina är korrekt att ange i ett område som betraktas som enspråkigt svenskt. Så där kan du kanske få känna på en del "heta känslor" såsmåningom. Bland de mer väletablerade användarna brukar det vara inte riktigt lika starka känslor. @LPfi: mfl?
- Men jag tror inte det är något problem alls med att ha en gemensam kartmall för Åland och Finland. -- Innocent bystander 4 augusti 2015 kl. 12.03 (CEST) (Jag som just settat i en telfonkö på finska i Östra Nyland, hyvvä!!!)
- Har tittat på ett stickprov bland våra artiklar i Kategori:Ålands geografi. Hittar ingen artikel som överhuvudtaget nämner Finland i inledningen, utan saker och ting ligger i Åland, punkt och slut. Är det inte då lämpligt att vi fortsätter den linjen? Lsj (diskussion) 5 augusti 2015 kl. 18.14 (CEST)
- Vi brukar inte nämna Sverige i svenska artiklar heller, så jag har inget att invända alls. -- Innocent bystander 5 augusti 2015 kl. 20.16 (CEST)
- Har tittat på ett stickprov bland våra artiklar i Kategori:Ålands geografi. Hittar ingen artikel som överhuvudtaget nämner Finland i inledningen, utan saker och ting ligger i Åland, punkt och slut. Är det inte då lämpligt att vi fortsätter den linjen? Lsj (diskussion) 5 augusti 2015 kl. 18.14 (CEST)
Cocos Islands
[redigera wikitext]Det finns två kokosöar i världen, de blandas ofta ihop. Vilken avser den här i listan? -- Innocent bystander 4 augusti 2015 kl. 09.42 (CEST)
- Alla koordinater för de här kokosöarna är kring lat -12, long 96, vilket stämmer med svwp:s artikel. Lsj (diskussion) 4 augusti 2015 kl. 09.45 (CEST)
Moderländer
[redigera wikitext]GeoNames har en lista med moderländer här. Kan vi använda den rakt av? Lsj (diskussion) 4 augusti 2015 kl. 09.45 (CEST)
- Utom för Antaktis då. -- Innocent bystander 4 augusti 2015 kl. 09.51 (CEST)
Saint Martin
[redigera wikitext]- Den listan "avslöjar" ju också ett problem med Saint Martin. -- Innocent bystander 4 augusti 2015 kl. 09.51 (CEST)
- I Geonames-filen för Saint Martin (iso MF) är i stort sett alla platsnamn på franska, inga på holländska, så jag skulle tro att bara den franska delen av ön omfattas. Den holländska delen Sint Maarten har egen iso-kod SX, och hanteras separat i GeoNames. Men den verkar vara bortglömd i moderlandslistan. Lsj (diskussion) 4 augusti 2015 kl. 10.42 (CEST)
Sankta Helena
[redigera wikitext]Avser "Sankta Helena" bara Sankta Helena eller hela Sankta Helena, Ascension och Tristan da Cunha?
- Avser hela gruppen. Sedan ligger de olika öarna som ADM1 i filen. Lsj (diskussion) 4 augusti 2015 kl. 10.11 (CEST)
- Grejt! Då bör länken visa hela långa namnet! -- Innocent bystander 4 augusti 2015 kl. 10.22 (CEST)
Danmark och Nederländerna
[redigera wikitext]När Danmark resp Nederländerna ska presenteras som "moderländer" bör kanske artiklarna Kungariket Danmark resp Kungariket Nederländerna länkas istället för du vet vad, eller krånglar jag till det nu? :) -- Innocent bystander 4 augusti 2015 kl. 10.53 (CEST)
- Ja, nu krånglar du till det :) Tekniskt korrekt, men är det verkligen POMMF? Lsj (diskussion) 4 augusti 2015 kl. 11.23 (CEST)
- Gamla kolonier är varken POMMF eller PK! :)
- I UK har du kanske samma problem. Men där är det så rörigt att jag bara tar mig för pannan. -- Innocent bystander 4 augusti 2015 kl. 12.07 (CEST)
- Tror att allt som det länkas till som är korrekt tillför kunskap till läsaren, hur ovanligt det än är. Maundwiki (diskussion) 4 augusti 2015 kl. 13.26 (CEST)
Platser som inte ligger i ett land
[redigera wikitext]GeoNames innehåller en hel del platser som inte ligger i något land, mest havsbottensaker på internationellt vatten. Se t.ex. Middle Reef. Hur gör vi med dem? Lsj (diskussion) 5 augusti 2015 kl. 17.27 (CEST)
- Hur kommer dylika artiklar se ut om de legat i ett land?
- Klarar du beskriva vilket hav de ligger i, och försöka avgöra vilket land de närmaste namngivna områdena tillhör?
- "Middle reaf är ett rev på internationellt vatten i norra Stilla havet. Närmaste land ligger i Alaska, USA."
- "Middle reaf är ett rev på internationellt vatten i västra Stilla havet. Närmaste land ligger i Tawi-Tawi, Filipinerna."
- Kategoriseringen efter landform och hav kanske räcker? -- Innocent bystander 5 augusti 2015 kl. 20.26 (CEST)
- Det kompliceras lite av att kategorin inte bara innehåller havsgrejor. Där finns också saker på land som sträcker sig över flera länder, t.ex. Alperna, EU och Öresundsbron. Märkligt nog finns också ett antal hotell i listan. Men jag tror vi kan skippa de gränsöverskridande sakerna, förmodligen har vi redan artiklar om de flesta som är relevanta. Om vi håller oss till havsgrejorna: Att ta reda på vilken ocean något ligger i är görbart utan enorma problem. Närmaste land är däremot värre. Lsj (diskussion) 5 augusti 2015 kl. 21.15 (CEST)
- Hmmm, i den fil jag har över svenska grejer, så finns det en kolumn för sådana saker som också ligger i Finland/Norge. Alperna borde ju kompletteras med fler länder, inte vara tom på länder. -- Innocent bystander 6 augusti 2015 kl. 08.45 (CEST)
- Så är det med vissa saker, t.ex. Sahara, som har en lång lista med "biländer" i Geonames, men inget "huvudland". Alperna har dock bara Schweiz som "biland". Min plan är för övrigt att låta boten skriva om platser med huvudland X och biland Y att de "ligger på gränsen mellan X och Y." Lsj (diskussion) 6 augusti 2015 kl. 09.12 (CEST)
- Hmmm, i den fil jag har över svenska grejer, så finns det en kolumn för sådana saker som också ligger i Finland/Norge. Alperna borde ju kompletteras med fler länder, inte vara tom på länder. -- Innocent bystander 6 augusti 2015 kl. 08.45 (CEST)
- Det kompliceras lite av att kategorin inte bara innehåller havsgrejor. Där finns också saker på land som sträcker sig över flera länder, t.ex. Alperna, EU och Öresundsbron. Märkligt nog finns också ett antal hotell i listan. Men jag tror vi kan skippa de gränsöverskridande sakerna, förmodligen har vi redan artiklar om de flesta som är relevanta. Om vi håller oss till havsgrejorna: Att ta reda på vilken ocean något ligger i är görbart utan enorma problem. Närmaste land är däremot värre. Lsj (diskussion) 5 augusti 2015 kl. 21.15 (CEST)
Nu blir det åtminstone en positionskarta i grensidorna för de här platserna. {{Kartposition Världen}}
får duga. Lsj (diskussion) 6 augusti 2015 kl. 22.10 (CEST)
Länkning av länder med moderländer
[redigera wikitext]Har skrivit kod nu för att länka länder med hänvisning till respektive moderland. Se bildtexterna i South Point (olika betydelser). Lsj (diskussion) 5 augusti 2015 kl. 21.17 (CEST)
- Ser bra ut, lägg gärna upp några exempelartiklar! -- Innocent bystander 6 augusti 2015 kl. 08.47 (CEST)
- Det blir likadana länkar i artiklarna. Grensidan var ett enkelt sätt att få med många exempel på en gång. Lsj (diskussion) 6 augusti 2015 kl. 09.05 (CEST)
- Vad lägger du i land-parametern i Geoboxen i sådana fall? -- Innocent bystander 6 augusti 2015 kl. 09.18 (CEST)
- I land-parametern lägger jag det "underordnade" landet (Åland, inte Finland, etc.). Boxen klarar väl iofs två länder, men behövs det? Lsj (diskussion) 6 augusti 2015 kl. 09.22 (CEST)
- Två länder är nog inte lämpligt i sådana fall, det är mer för typ Alperna. Men en fråga är om just Åland inte snarare ska vara adm1 än land? Ungefär samma sak med Jan Mayen och Svalbard. Norge bör där vara land och Jan Mayen eller Svalbard vara adm1. -- Innocent bystander 6 augusti 2015 kl. 09.41 (CEST)
- I land-parametern lägger jag det "underordnade" landet (Åland, inte Finland, etc.). Boxen klarar väl iofs två länder, men behövs det? Lsj (diskussion) 6 augusti 2015 kl. 09.22 (CEST)
- Vad lägger du i land-parametern i Geoboxen i sådana fall? -- Innocent bystander 6 augusti 2015 kl. 09.18 (CEST)
- Det blir likadana länkar i artiklarna. Grensidan var ett enkelt sätt att få med många exempel på en gång. Lsj (diskussion) 6 augusti 2015 kl. 09.05 (CEST)
Diverse funderingar
[redigera wikitext]Jag kollade igenom grensidan Middle Reef och upptäckte några grejer som kanske kunde förbättras.
- Ska verkligen alla särskiljningsled innehålla koordinater och landsdel? Borde det inte räcka med land för de som är ensamma i sitt land?
- Bildtexten för kartor med en punkt, "Platser med namnet Middle Reef i Egypten." Skulle det räcka med: "Middle Reef i Egypten."? Eller någon annan variant där 'Platser' inte står i plural?
- Kartan över kontinentala USA känns inte optimal när två av fyra platser är i Alaska. Kan man använda en mer omfattande karta? Eller dela upp det på två kartor?
- På grund av proportionerna blir kartan över Madagaskar tre gånger så stor som kartan över Papua Nya Guinea. Men det kanske är bättre än att göra dem olika breda, jag vet inte.
⬤Boⅳⅰᴇ 6 augusti 2015 kl. 09.39 (CEST)
- Ska kolla hur det går att snäva in användningen av lat/long i särskiljningsleden.
- Lätt att fixa. Vill vi ha det så?
- Det har du rätt i. Hade jag inte tänkt på. Nog bättre att använda
{{Kartposition Nordamerika}}
för USA i grensidorna - se Middle Reef nu. Men Hawaii hamnar fortfarande precis utanför.
{{Kartposition USA2}}
löser problemet bättre. Lsj (diskussion) 6 augusti 2015 kl. 18.50 (CEST)
- Tycker det ser bättre ut om alla har samma bredd, så att man har en jämn kolumn med kartor. Men visst, det blir lite konstigt när Chile finns med i listan.
- Lsj (diskussion) 6 augusti 2015 kl. 11.20 (CEST)
- Har fixat en ny algoritm för särskiljningsleden som ger färre onödiga led. Ska bara köra igenom fem miljoner namn över natten, så fixar jag nya grensidor imorgon kväll. Lsj (diskussion) 6 augusti 2015 kl. 21.29 (CEST)
- Ser ut att fungera nu. Mer lagom så? Lsj (diskussion) 7 augusti 2015 kl. 20.56 (CEST)
- Ja, särskiljningsleden ser bra ut. Gällande bildtexterna var det bara för kartor med en punkt som jag var skeptisk till 'Platser' i plural. Men det kanske funkar att ta bort det på alla. ⬤Boⅳⅰᴇ 7 augusti 2015 kl. 22.33 (CEST)
- Ser ut att fungera nu. Mer lagom så? Lsj (diskussion) 7 augusti 2015 kl. 20.56 (CEST)
- Har fixat en ny algoritm för särskiljningsleden som ger färre onödiga led. Ska bara köra igenom fem miljoner namn över natten, så fixar jag nya grensidor imorgon kväll. Lsj (diskussion) 6 augusti 2015 kl. 21.29 (CEST)
Parish/församling
[redigera wikitext]Jag ser du kallar Parish of Saint Philip för en församling. Det är en mycket tveksam/fel länkning. En församling är i grunden en organisation, och när man i Sverige skriver man är född i en församling, menar man i modern tid man är född inom det område som utgörs av församlingens verksamhetsområde, i äldre tider man blev vid födelsen inskriven i (samfundet/organisationen) XXX. I detta fall avses en administrativ enhet som getts namnet parish (alternativt geografisk indelning). jag tycker därför du antingen skall länka till (församling (adm enhet/geografisk indelning)) eller ännu hellre direkt till administrativ enhet/geografisk indelning.Yger (diskussion) 6 augusti 2015 kl. 10.10 (CEST)
- @Yger: Se East Baton Rouge Parish och Aveiro, vad en Parish är, behöver utredas land för land. I Louisiana och Portugal är dessa rent civila indelningar och sannolikt här också. I fallet Louisiana använder vi det engelska ordet och i fallet med Portugal länkar vi redan församling, tyvärr. -- Innocent bystander 6 augusti 2015 kl. 10.31 (CEST)
- Många länder, särskilt i Brittiska Samväldet, använder Parish som civila enheter. Finns även en hel del andra administrativa enheter i olika länder som det inte är självklart vad de ska länkas till. Har också märkt att GeoNames har i vissa fall gjort egna bedömningar av vad som är ADM1, ADM2, etc. Ska göra en länklista även för administrativa enheter, så kan ni se hur det ser ut. Lsj (diskussion) 6 augusti 2015 kl. 10.57 (CEST)
- Jag gillar skrivningen i East Baton Rouge Parish.Yger (diskussion) 6 augusti 2015 kl. 12.04 (CEST)
- @Yger: I Andorra så beskrivs en "parròqui" som att de har både kyrkliga och civila funktioner. Är det i sådana fall lämpligt att länka församling? -- Innocent bystander 6 augusti 2015 kl. 15.16 (CEST)
- Jag gillar skrivningen i East Baton Rouge Parish.Yger (diskussion) 6 augusti 2015 kl. 12.04 (CEST)
- Många länder, särskilt i Brittiska Samväldet, använder Parish som civila enheter. Finns även en hel del andra administrativa enheter i olika länder som det inte är självklart vad de ska länkas till. Har också märkt att GeoNames har i vissa fall gjort egna bedömningar av vad som är ADM1, ADM2, etc. Ska göra en länklista även för administrativa enheter, så kan ni se hur det ser ut. Lsj (diskussion) 6 augusti 2015 kl. 10.57 (CEST)
Användare:Lsjbot/linkadmin Lsj (diskussion) 6 augusti 2015 kl. 14.44 (CEST) Två frågeställningar kring listan:
- Ska saker och ting heta som de heter?
- Vad ska de länkas till på svwp?
Lsj (diskussion) 6 augusti 2015 kl. 14.54 (CEST)
- För att krångla till det igen!
- Alla adm1 i Ryssland är inte Oblast. Se Rysslands federationssubjekt. Och det finns fler länder med samma typ av problem. -- Innocent bystander 6 augusti 2015 kl. 14.55 (CEST)
- Jo, jag vet att några länder krånglar till det så. Ett par länder där det lätt gick att avgöra ur GeoNames vilken krångel-grupp varje ADM-enhet tillhörde har fått specialbehandling (därför det finns fyra sorters adm-enheter för GB). Kanske värt att göra även för Ryssland. Men så finns det mängder med länder som ger bara något enstaka distrikt (ofta huvudstadens) någon speciell titel, utan att GeoNames innehåller någon ledtråd till vad eller vilka utan det skulle behöva handprogrammeras individuellt, och där någonstans går gränsen för om det är lönt. Att 98% av USA kallar ett county för county, men inte de sista 2%, hör dit. Lsj (diskussion) 6 augusti 2015 kl. 15.39 (CEST)
- Jag tycker som i exemplet jag tyckte var bra, det inhemska namnet (parish, parròqui) används och att det alltid stå~r adminstrativ region och sedan en länk till en artikel på svwp men namnet parish och parròqui.Yger (diskussion) 6 augusti 2015 kl. 15.33 (CEST)
- Jag har i möjligaste mån försökt hitta svenska benämningar på enheterna, där det gått att hitta något vettigt. Menar du att allihop skulle länkas till administrativ enhet? Ja, inte mig emot, det är ju en enkel lösning. Lsj (diskussion) 6 augusti 2015 kl. 15.39 (CEST)
- Ja, med en länk till själva det lokala namnet inom parentes, typ är ett administrativt område/administrativ enhet, (parish), (om det skall stå område eller enhet är jag inte klar på.Yger (diskussion) 6 augusti 2015 kl. 15.45 (CEST)
- Kan funka i artikeln om själva enheten. Men det blir klumpigt i artiklar om andra platser, där det står typ "X ligger i kommunen Y, och provinsen Z". Blir för långt med "X ligger i administrativa enheten (munisipyo) Y och administrativa enheten (lalawigan) Z." Där åtminstone vill jag översätta munisipyo till kommun och lalawigan till provins. Sedan krånglas det till ytterligare av att de provinsnamn (etc) som anges av Geonames ofta innehåller typbeteckningen: "Essex County", eller "Province of Cebu". Lsj (diskussion) 6 augusti 2015 kl. 15.53 (CEST)
- Du kan bättre hur det blir i det praktiska~och vad som är bäst göra rent konkret. Det är egentligen bara användningen av församling jag vill undviks.Yger (diskussion) 6 augusti 2015 kl. 19.50 (CEST)
- Man skulle kunna kalla dem för det lokala namnet, alternativt "administrativ församling" eller liknande. Jag förordar nog det senare. Har valt den lösningen för några andra länder som har öar eller byar som administrativa enheter - det får heta "administrativ ö" (motsvarar ofta inte exakt en geografisk ö). Sedan kompliceras det ytterligare av att GeoNames har med genuina församlingar för några länder, bl.a. Sverige och England. Dessa bör rimligen inte kallas något annat än församling. Lsj (diskussion) 6 augusti 2015 kl. 21.41 (CEST)
- Är det inte Civil parish som ska länkas i England? -- Innocent bystander 6 augusti 2015 kl. 21.45 (CEST)
- Jo, det har du nog alldeles rätt i. Och den benämningen och länken bör kunna användas i alla gamla brittiska besittningar med parishes, inklusive Antigua, tycker jag. Lsj (diskussion) 6 augusti 2015 kl. 22.09 (CEST)
- När ska vi då använda Parish? -- Innocent bystander 7 augusti 2015 kl. 08.51 (CEST)
- Är inte civil parish och parish kandidater för hopslagning? Lsj (diskussion) 7 augusti 2015 kl. 09.38 (CEST)
- Möjligt, men jag ser ännu hellre att Parish (Antigua och Babuda), Parish (Barbados) etc. skapas så Parish kan göras till en grensida. -- Innocent bystander 7 augusti 2015 kl. 10.42 (CEST)
- Vi har ju faktiskt Antigua och Barbudas administrativa indelning redan. Kanske bättre att vi konsekvent länkar till artiklarna i Kategori:Administrativa indelningar av länder? Det borde ge läsaren mer info än att länka till en generell artikel om parishsbegreppet, och är tekniskt enkelt för boten så länge artiklarna är konsekvent namngivna. Lsj (diskussion) 7 augusti 2015 kl. 11.14 (CEST)
- Låter ännu bättre! -- Innocent bystander 7 augusti 2015 kl. 11.25 (CEST)
- Ok, då låter jag boten konsekvent länka till "X-lands administrativa indelning" för alla administrativa enheter. Blir en del rödlänkar, men det är artiklar vi borde ha om vi inte har dem redan. Lsj (diskussion) 7 augusti 2015 kl. 11.33 (CEST)
- Låter ännu bättre! -- Innocent bystander 7 augusti 2015 kl. 11.25 (CEST)
- Vi har ju faktiskt Antigua och Barbudas administrativa indelning redan. Kanske bättre att vi konsekvent länkar till artiklarna i Kategori:Administrativa indelningar av länder? Det borde ge läsaren mer info än att länka till en generell artikel om parishsbegreppet, och är tekniskt enkelt för boten så länge artiklarna är konsekvent namngivna. Lsj (diskussion) 7 augusti 2015 kl. 11.14 (CEST)
- Möjligt, men jag ser ännu hellre att Parish (Antigua och Babuda), Parish (Barbados) etc. skapas så Parish kan göras till en grensida. -- Innocent bystander 7 augusti 2015 kl. 10.42 (CEST)
- Är inte civil parish och parish kandidater för hopslagning? Lsj (diskussion) 7 augusti 2015 kl. 09.38 (CEST)
- När ska vi då använda Parish? -- Innocent bystander 7 augusti 2015 kl. 08.51 (CEST)
- Jo, det har du nog alldeles rätt i. Och den benämningen och länken bör kunna användas i alla gamla brittiska besittningar med parishes, inklusive Antigua, tycker jag. Lsj (diskussion) 6 augusti 2015 kl. 22.09 (CEST)
- Är det inte Civil parish som ska länkas i England? -- Innocent bystander 6 augusti 2015 kl. 21.45 (CEST)
- Man skulle kunna kalla dem för det lokala namnet, alternativt "administrativ församling" eller liknande. Jag förordar nog det senare. Har valt den lösningen för några andra länder som har öar eller byar som administrativa enheter - det får heta "administrativ ö" (motsvarar ofta inte exakt en geografisk ö). Sedan kompliceras det ytterligare av att GeoNames har med genuina församlingar för några länder, bl.a. Sverige och England. Dessa bör rimligen inte kallas något annat än församling. Lsj (diskussion) 6 augusti 2015 kl. 21.41 (CEST)
- Du kan bättre hur det blir i det praktiska~och vad som är bäst göra rent konkret. Det är egentligen bara användningen av församling jag vill undviks.Yger (diskussion) 6 augusti 2015 kl. 19.50 (CEST)
- Kan funka i artikeln om själva enheten. Men det blir klumpigt i artiklar om andra platser, där det står typ "X ligger i kommunen Y, och provinsen Z". Blir för långt med "X ligger i administrativa enheten (munisipyo) Y och administrativa enheten (lalawigan) Z." Där åtminstone vill jag översätta munisipyo till kommun och lalawigan till provins. Sedan krånglas det till ytterligare av att de provinsnamn (etc) som anges av Geonames ofta innehåller typbeteckningen: "Essex County", eller "Province of Cebu". Lsj (diskussion) 6 augusti 2015 kl. 15.53 (CEST)
- Ja, med en länk till själva det lokala namnet inom parentes, typ är ett administrativt område/administrativ enhet, (parish), (om det skall stå område eller enhet är jag inte klar på.Yger (diskussion) 6 augusti 2015 kl. 15.45 (CEST)
- Jag har i möjligaste mån försökt hitta svenska benämningar på enheterna, där det gått att hitta något vettigt. Menar du att allihop skulle länkas till administrativ enhet? Ja, inte mig emot, det är ju en enkel lösning. Lsj (diskussion) 6 augusti 2015 kl. 15.39 (CEST)
Fixat:
- Församlingar -> parish/parroquia etc
- Länkning till "X-lands administrativa indelning" för både adm-enheter och deras huvudorter.
- Rysslands oblaster, krajer, delrepubliker och allt vad de heter.
- USA-karta som korrekt hanterar Alaska & Hawaii.
- Svalbard-karta som korrekt hanterar Jan Mayen.
- Bättre identifiering av och länkning till befintliga artiklar.
- Bättre särskiljningsled, som inte tar med lat/long i onödan.
Kör Antigua & Barbuda en gång till nu. Lsj (diskussion) 7 augusti 2015 kl. 20.58 (CEST)
- Hittat en bugg - glömde uppdatera beteckningar på huvudorter när jag ändrat namn på adm-enheter. Lsj (diskussion) 7 augusti 2015 kl. 21.14 (CEST)
- Enligt katalanska wikin har parròquia en apostrof av någe slag, se ca:Parròquies d'Andorra. Sedan om det blir apostrof på "svenska" också, vet jag inte @Paracel63: -- Innocent bystander 8 augusti 2015 kl. 08.43 (CEST)
- Parroquia har accent på katalanska, men inte på spanska. Och jag är tveksam till om vi ska låta Andorras och Venezuelas administrativa enheter skilja sig med en accent. Accent på bokstaven o är hur som helst inte brukligt i svenska ordformer. Tycker vi kör parroquia utan accenter. Lsj (diskussion) 8 augusti 2015 kl. 10.49 (CEST)
- Helt, ok, bara en observation att katalanska och inte spanska är officiellt språk i Andorra. -- Innocent bystander 8 augusti 2015 kl. 12.09 (CEST)
- Parroquia har accent på katalanska, men inte på spanska. Och jag är tveksam till om vi ska låta Andorras och Venezuelas administrativa enheter skilja sig med en accent. Accent på bokstaven o är hur som helst inte brukligt i svenska ordformer. Tycker vi kör parroquia utan accenter. Lsj (diskussion) 8 augusti 2015 kl. 10.49 (CEST)
- Enligt katalanska wikin har parròquia en apostrof av någe slag, se ca:Parròquies d'Andorra. Sedan om det blir apostrof på "svenska" också, vet jag inte @Paracel63: -- Innocent bystander 8 augusti 2015 kl. 08.43 (CEST)
- Tack för att jag blev pingad. Accenter eller inte på svenska kan vara en känslig sak. Akut accent har vi gott om i svenska språket, efter franskt mönster. Det finns dock exempel på begrepp där vi accepterat att behålla grav accent i svenskan enligt franskt mönster (på rak arm kommer jag åtminstone på à). Lsj har nog rätt i att accent på o inte är brukligt/vanligt i svenskan, men frågan är här om vi ska betrakta parroquia/parròquia som svenska ord.
- När jag letar på ne.se och SAOL hittar jag inte parroquia, så sannolikt kan man inte betrakta det som ett svenskt ord. Om parroquia och liknande utländska ord ska nämnas i våra faktarutor bör de kanske markeras kursivt, så länge vi inte har en källa på att ordet är använt på svenska. I det fallet är parroquia och parròquia i mina ögon likvärdigt "utländska".
- När jag byggde ut artikeln comarca hade jag problem med att hitta begreppet beskrivet i svenska språket. Det noteras på enstaka ställen i ne.se och Nordisk familjebok (se referenser i artikeln), men inte på något ställe böjt på svenskt maner. Min försvenskade pluralform i artikeln comarca får därför ses som ett praktiskt förslag (utan källa), där vi trots allt måste hantera begreppet i löpande text.--Paracel63 (diskussion) 8 augusti 2015 kl. 13.58 (CEST)
- Om det inte redan är nämnt… Parròquia/Parroquia används inte bara i Andorra. Även i Asturien och Galicien fungerar det som administrativt begrepp. Där delas kommunerna in i sådana. Det är hyfsat lätt att se hur ett historiskt sockenbegrepp levt vidare även efter senare tiders politiska/administrativa omvälvningar, åtminstone i avlägsna delar av iberiska halvön. Katalonien har sin egen problematik (som vi inte behöver dra just här). :-)--Paracel63 (diskussion) 8 augusti 2015 kl. 14.09 (CEST)
- Personligen föredrar jag "socken" som översättning på parish, det är lättare att böja och socken kan både vara en kyrklig och en världslig administrativ enhet.--ボスニア (diskussion) 8 augusti 2015 kl. 16.23 (CEST)
- Om det inte redan är nämnt… Parròquia/Parroquia används inte bara i Andorra. Även i Asturien och Galicien fungerar det som administrativt begrepp. Där delas kommunerna in i sådana. Det är hyfsat lätt att se hur ett historiskt sockenbegrepp levt vidare även efter senare tiders politiska/administrativa omvälvningar, åtminstone i avlägsna delar av iberiska halvön. Katalonien har sin egen problematik (som vi inte behöver dra just här). :-)--Paracel63 (diskussion) 8 augusti 2015 kl. 14.09 (CEST)
Börjar se bra ut
[redigera wikitext]Jag tycker det mesta ser OK ut nu. Det är lite lustigt att använda svensk böjd form på parish, dvs ligger i parishen Parish xx, men jag tycket det är OK. För själva enheten Parish of tycker jag ordvalet och länkningen ser bra ut. Jag gillar inte ordvalet i Antigua och Barbudas administrativa indelning (men den finns väl bara i ett ex, så ev kan jag ändra själv. Jag tycker inte det skall stå församling som sista ord i inledningsraden utan något som administratva enheter kallade ParishYger (diskussion) 7 augusti 2015 kl. 21.58 (CEST)
- Finns fortfarande lite småbuggar. Men visst börjar det arta sig. Beträffande Antigua och Barbudas administrativa indelning så är den inte botskapad. Sådana artiklar måste nog tyvärr handskapas. Lsj (diskussion) 7 augusti 2015 kl. 23.55 (CEST)
- Och texten i Antigua och Barbudas administrativa indelning är nu åtgärdad av ett IPnummer.Yger (diskussion) 8 augusti 2015 kl. 08.46 (CEST)
- Finns fortfarande lite småbuggar. Men visst börjar det arta sig. Beträffande Antigua och Barbudas administrativa indelning så är den inte botskapad. Sådana artiklar måste nog tyvärr handskapas. Lsj (diskussion) 7 augusti 2015 kl. 23.55 (CEST)
Massraderingar
[redigera wikitext]Det kanske förklaras någonstans ovan, men varför tas stora mängder redan skapade artiklar bort då och då? Tostarpadius (diskussion) 8 augusti 2015 kl. 13.48 (CEST)
- Vi har kommit dithän nu att det krävs rejäla provserier för att upptäcka mer subtila problem. I det tidigare art-projektet lät jag provserierna ligga kvar och körde nya grupper för att testa ny kod. Därför finns nu gamla botskapade artiklar om ffa svampar som inte riktigt håller måttet. Med geografin tänker jag se till att göra rätt från början, och därför raderar jag provserierna och kör om samma artiklar igen i varje provkörning. Förhoppningsvis ska vi inte behöva så många ronder till med totalradering. Lsj (diskussion) 8 augusti 2015 kl. 17.12 (CEST)
Kina 1
[redigera wikitext]Jag följer diskussionen högst sporadiskt här, men som många säkert vet håller jag på med att skapa alla kinesiska orter på "häradsnivå" manuellt. Detta är fullt görligt och projektet väntas vara klart till hösten. Däremot ser jag gärna att boten skapar artiklar för alla orter på den fjärde nivån i Kinas administrativa indelning, socknen och köpingen (som vi kallar dem tills vidare), vilka det finns inte mindre än 47 000 av i hela Kina. Eftersom orter på denna nivå kan ha tiotusentals invånare är detta en stor prioritet för vår täckning av Kina.
På Projekt Kina har vi för närvarande ingen mall för denna nivån i Kinas administrativa indelning och jag har ingen bestämd åsikt om vi ska skapa en eller använda GeoBox, här är i alla fall ett exempel på en köping artikel jag skapat med hjälp av GeoBox. När det blir dags för Kina hoppas jag att ni pingar in mig och kanske också lägger en blänkare på vår projektsida.--ボスニア (diskussion) 8 augusti 2015 kl. 16.35 (CEST)
- Jag känner till, och beundrar, ditt gedigna arbete med Kinas geografi. Hade definitivt tänkt kontakta dig innan vi kommer till Kina, för det finns en del saker att reda ut. Ser att GeoNames, som boten använder som källa, har data för ungefär 2000 härader och 10 000 socknar - i så fall saknas där väldigt många socknar. Boten använder konsekvent Geobox som faktamall. Det gör livet mycket enklare för botar om vi inte har alltför många olika malltyper, så jag ser helst att vi inte skapar nya mallar för sådant som Geobox klarar. Vi kommer att få en del pyssel med att undvika dubletter i Kina, eftersom botens algoritm för att känna igen befintliga artiklar bygger på latitud/longitud, vilket dina häradsartiklar i allmänhet saknar. Hur löser vi det? Kanske helt enkelt så att boten låter bli häradsnivån, men boten behöver ändå kunna länka från sina sockenartiklar till dina häradsartiklar. Namnen är inte helt pålitliga, inte säkert du och GeoNames använder samma namnformer och transkription. Lsj (diskussion) 8 augusti 2015 kl. 17.27 (CEST)
- Även om de svenska artiklarna saknar Coord-mall, så tror jag det enkelt går att hitta sådan med interwikin, eller utifrån P625. -- Innocent bystander 8 augusti 2015 kl. 18.18 (CEST)
- Det blir bäst om boten låter bli härader, eftersom jag ändå snart blir klar med dem. Däremot skulle det vara bra om en bott lade in koordinater i befintliga orter, om den klarar av den mall vi använder. På sikt kanske vi borde fundera på att ersätta de befintliga mallarna med GeoBox, men det är ett arbete som måste skötas med bot för att fungera.
- Även om de svenska artiklarna saknar Coord-mall, så tror jag det enkelt går att hitta sådan med interwikin, eller utifrån P625. -- Innocent bystander 8 augusti 2015 kl. 18.18 (CEST)
- Anledningen till att det kan bli en överlappning mellan härader och socknar/köpingar är att centralorten i ett härad nästan alltid är en köping. Således delar två orter på olika nivåer samma koordinater. Ett annat problem är att många kinesiska orter har samma namn i transkribering, något som jag löst genom att arrangera namnen efter den enhet som står över orten i hierarkin. Således blir det Yiliang, Zhaotong och Yiliang, Kunming. Namngivning kommer att bli en viktig fråga att diskutera så att boten kan skapa artiklar smärtfritt.--ボスニア (diskussion) 8 augusti 2015 kl. 20.37 (CEST)
- Tror det här är lösbart, men vi behöver hålla kontakt. Bra idé från Innocent bystander att ta koordinater från wd/iw. Om boten ändå ska plocka upp koordinaterna, så är det sedan inte mycket extra besvär att lägga in dem in häradsmallen. Lsj (diskussion) 8 augusti 2015 kl. 21.15 (CEST)
- Se även denna diskussion: Användardiskussion:Bothnia#Lsjbot och Kina Maundwiki (diskussion) 29 februari 2016 kl. 15.42 (CET)
- Tror det här är lösbart, men vi behöver hålla kontakt. Bra idé från Innocent bystander att ta koordinater från wd/iw. Om boten ändå ska plocka upp koordinaterna, så är det sedan inte mycket extra besvär att lägga in dem in häradsmallen. Lsj (diskussion) 8 augusti 2015 kl. 21.15 (CEST)
Har robotskapandet startat på "riktigt"?
[redigera wikitext]Med resultat som Northern (olika betydelser), Bahrein (olika betydelser) och Tyros (olika betydelser) undrar jag om det verkligen är moget att börja, om det nu har börjat, eftersom jag ser de här sidorna i loggen över nyskapade sidor? Det är uppenbara språkfel redan i den första handfull artiklar jag kollat på. Höstblomma (diskussion) 8 augusti 2015 kl. 17.56 (CEST)
De bör i så fall ha en robotskapad-mall, så att det på något sätt visas att de behöver språkvårdas (översätta engelskan till svenska). Höstblomma (diskussion) 8 augusti 2015 kl. 18.00 (CEST)
- Om du tittar här ovan så ser du att vi har en pågående process med provkörning och diskussion av botens alster. Det går inte att provköra botskapande ordentligt utan att det syns i "Nya sidor". Vad mall beträffar innehåller dessa artiklar redan mallen
{{Robotskapad förgrening}}
. Lsj (diskussion) 8 augusti 2015 kl. 18.29 (CEST)
Dessa kan inte heller vara rätt: اَلْبَحْرَيْن och اَلْمُحَرَّق (?) Höstblomma (diskussion) 8 augusti 2015 kl. 18.10 (CEST)
- Se tidigare diskussion här. Konsensus för att namnformer på det lokala språket inkluderas, men inte alla upptänkliga andra namnformer. Lsj (diskussion) 8 augusti 2015 kl. 18.29 (CEST)
- Den diskussionen handlade väl om vilka omdirigeringar som ska skapas? Nu har det ju även skapats vanliga artiklar (inte omdirigeringar) med namn som t.ex:
- الشمالية ,اَلْبَحْرَيْن ,اَلْحَفِيرَة ,اَلْمُحَرَّق ,جَزِيرَة حَوَار ,دَوْحَة سَلْوَى ,سِتْرَة
- Finns det verkligen konsensus för det? Svensson1 (diskussion) 8 augusti 2015 kl. 18.48 (CEST)
- Det är inte vanliga artiklar, det är förgreningssidor. Om två olika artiklar gör anspråk på samma omdirigering, gör boten en grensida av den omdirigeringen. Det här med grensidor tog jag upp i den tidigare diskussionen om omdirigeringar, så jag tycker nog de omfattas av samma konsensus. Det har för övrigt även skapats några vanliga omdirigeringar idag, t.ex. عَيْن يُوسُف, i enlighet med den diskussion vi hade. Lsj (diskussion) 8 augusti 2015 kl. 19.05 (CEST)
- Vi har inte haft omdirigerar och förgreningssidor på andra språk och alfabet som praxis vad jag vet. Hur kan det ha blivit praxis? Detta blir nog tyvärr rörigt, tror jag. Översättningarna mellan svenska-engelska är inte gjorda, och det borde ändå vara det enklaste, och hur ska man kunna veta att de på andra språk och alfabet är riktiga? Höstblomma (diskussion) 8 augusti 2015 kl. 19.15 (CEST)
- Jag tycke nog dessa förgreningssidor med arabiska namn på och på deras alfabet är logiskt och korrekt. Sedan kommer väl aldrig någon söka efter dem, men så länge det inte är fel/skämmigt tycker jag inte vi behöver oroa oss för dem.Yger (diskussion) 8 augusti 2015 kl. 19.43 (CEST)
- Och det är just det, hur ska man veta att de är rätt och inte fel? Jag känner stor osäkerhet över det, än större för andra alfabet, då inte t.ex översättningar engelska-svenska som ändå har samma alfabet verkar gå. Jag tycker fortfarande att ett allt omfattande projekt är att ta sig vatten över huvudet, hur duktig på programmering man än är. Höstblomma (diskussion) 8 augusti 2015 kl. 19.52 (CEST)
- Jag tycke nog dessa förgreningssidor med arabiska namn på och på deras alfabet är logiskt och korrekt. Sedan kommer väl aldrig någon söka efter dem, men så länge det inte är fel/skämmigt tycker jag inte vi behöver oroa oss för dem.Yger (diskussion) 8 augusti 2015 kl. 19.43 (CEST)
- Vi har inte haft omdirigerar och förgreningssidor på andra språk och alfabet som praxis vad jag vet. Hur kan det ha blivit praxis? Detta blir nog tyvärr rörigt, tror jag. Översättningarna mellan svenska-engelska är inte gjorda, och det borde ändå vara det enklaste, och hur ska man kunna veta att de på andra språk och alfabet är riktiga? Höstblomma (diskussion) 8 augusti 2015 kl. 19.15 (CEST)
- Det är inte vanliga artiklar, det är förgreningssidor. Om två olika artiklar gör anspråk på samma omdirigering, gör boten en grensida av den omdirigeringen. Det här med grensidor tog jag upp i den tidigare diskussionen om omdirigeringar, så jag tycker nog de omfattas av samma konsensus. Det har för övrigt även skapats några vanliga omdirigeringar idag, t.ex. عَيْن يُوسُف, i enlighet med den diskussion vi hade. Lsj (diskussion) 8 augusti 2015 kl. 19.05 (CEST)
- När det lokala och svenska namnet skiljer sig för en plats, har vi som praxis att ge artikeln det svenska namnet och omdirigera från det lokala namnet, se t.ex. Venezia, California, eller 日本. Vad jag gör är att konsekvent tillämpa den praxisen, efter att ha lyft saken till diskussion och nått konsensus om en kompromiss i den diskussionen. Lsj (diskussion) 8 augusti 2015 kl. 19.42 (CEST)
- Yger, här hänger jag inte riktigt med. Artiklarna ska ju återfinnas under latinsk transkribtion, och vi kommer därför att ha motsvarande förgreningssidor för de namnen. De icke-latinska förgreningssidorna blir ju då rena dubbletter (som inte kommer att uppdateras när det exempelvis tillkommer handskrivna artiklar som gör anspråk på samma uppslagsord). Är det då inte bättre att dessa icke-latinska omdirigerar till den ordinarie "latinska" grensidan? Eller tänker jag alldeles galet? Taxelson (diskussion) 8 augusti 2015 kl. 19.56 (CEST)
- jag fattade inte att föregreningsartiklarna är dubbletter utan att bara själva artiklarna skrev med latinsk transkribtion. Jag passar i diskussionen då för avancerat för mig.Yger (diskussion) 8 augusti 2015 kl. 20.07 (CEST)
- En komplikation är att det inte alls är självklart att två platser med samma arabiska namn också ska ha samma transkription. Det finns en mängd sätt att transkribera arabiska, och transkription av det lokala namnet kan bli olika för platser där olika dialekter talas, för att inte tala om namn på t.ex. persiska som använder samma alfabet. För att kringgå det problemet kan vi hellre ha en grensida "för mycket". Samma sak händer t.ex. med kyrilliska, som transkriberas väldigt olika i Kazakstan och Serbien (se diskussion här ovan). Lsj (diskussion) 8 augusti 2015 kl. 20.17 (CEST)
- Ett arabiskt namn i Nordafrika ska inte transkriberas på samma sätt som ett i Arabien, helt korrekt.
- Att grensidor riskerar att inte vara kompletta är inte ett jättestort problem. Vi lever redan med det problemet. -- Innocent bystander 8 augusti 2015 kl. 20.24 (CEST)
- Ja med olika dialekter etc som transkriberas (translittereras) enligt olika principer, är det kanske bra att också ha dessa. Det låter rimligt. Taxelson (diskussion) 8 augusti 2015 kl. 20.36 (CEST)
- Skulle man kunna ha en kategori på dessa sidor som heter t.ex. "Artikelnamn på arabiska" eller en mall (ungefär som för omdirigeringar), så att man vet vilket språk det är? Svensson1 (diskussion) 9 augusti 2015 kl. 09.26 (CEST)
- Visst, det går att ordna. Men hellre "Artikelnamn med arabisk skrift" än "...på arabiska", eftersom språket kan vara farsi eller urdu. Och förstås motsvarande för kyrilliska, kinesiska, etc. Men borde man inte i så fall lägga även omdirigeringarna i de kategorierna? Lsj (diskussion) 9 augusti 2015 kl. 16.19 (CEST)
- Har kört lite statistik nu. Det finns ungefär 4,6 miljoner namn som boten finner relevanta. (Ungefär lika med antalet relevanta platser, men samma plats kan ha fler namn, och samma namn kan syfta på flera platser; ren tillfällighet att det går ungefär jämnt upp.) Av dessa 4,6 miljoner är ungefär 93% med latinska alfabetet, 2% var med arabiska och kyrilliska, 0,7% thai, 0,5% kinesiska/japanska, etc ner till 0,00004% syrianska. Lsj (diskussion) 9 augusti 2015 kl. 19.30 (CEST)
- Ja, omdirigeringarna borde nog också läggas i de kategorierna eller några omdirigeringskategorier som heter ungefär samma sak som artikelnamnskategorierna. Man kan väl överväga att det görs med automatik då mallen används? På engelskspråkiga Wikipedia gör mallanropet {{R from alternative language|fr}} att omdirigeringen med automatik läggs i kategorin "Redirects from French-language terms". Svensson1 (diskussion) 9 augusti 2015 kl. 19.45 (CEST)
- Fixat
{{Sidnamn annan skrift}}
, och lagt till den i botkoden för både grensidor och omdirigeringar. Lsj (diskussion) 11 augusti 2015 kl. 19.20 (CEST)
- Fixat
- Ja, omdirigeringarna borde nog också läggas i de kategorierna eller några omdirigeringskategorier som heter ungefär samma sak som artikelnamnskategorierna. Man kan väl överväga att det görs med automatik då mallen används? På engelskspråkiga Wikipedia gör mallanropet {{R from alternative language|fr}} att omdirigeringen med automatik läggs i kategorin "Redirects from French-language terms". Svensson1 (diskussion) 9 augusti 2015 kl. 19.45 (CEST)
- Har kört lite statistik nu. Det finns ungefär 4,6 miljoner namn som boten finner relevanta. (Ungefär lika med antalet relevanta platser, men samma plats kan ha fler namn, och samma namn kan syfta på flera platser; ren tillfällighet att det går ungefär jämnt upp.) Av dessa 4,6 miljoner är ungefär 93% med latinska alfabetet, 2% var med arabiska och kyrilliska, 0,7% thai, 0,5% kinesiska/japanska, etc ner till 0,00004% syrianska. Lsj (diskussion) 9 augusti 2015 kl. 19.30 (CEST)
- Visst, det går att ordna. Men hellre "Artikelnamn med arabisk skrift" än "...på arabiska", eftersom språket kan vara farsi eller urdu. Och förstås motsvarande för kyrilliska, kinesiska, etc. Men borde man inte i så fall lägga även omdirigeringarna i de kategorierna? Lsj (diskussion) 9 augusti 2015 kl. 16.19 (CEST)
- Skulle man kunna ha en kategori på dessa sidor som heter t.ex. "Artikelnamn på arabiska" eller en mall (ungefär som för omdirigeringar), så att man vet vilket språk det är? Svensson1 (diskussion) 9 augusti 2015 kl. 09.26 (CEST)
- Ja med olika dialekter etc som transkriberas (translittereras) enligt olika principer, är det kanske bra att också ha dessa. Det låter rimligt. Taxelson (diskussion) 8 augusti 2015 kl. 20.36 (CEST)
- En komplikation är att det inte alls är självklart att två platser med samma arabiska namn också ska ha samma transkription. Det finns en mängd sätt att transkribera arabiska, och transkription av det lokala namnet kan bli olika för platser där olika dialekter talas, för att inte tala om namn på t.ex. persiska som använder samma alfabet. För att kringgå det problemet kan vi hellre ha en grensida "för mycket". Samma sak händer t.ex. med kyrilliska, som transkriberas väldigt olika i Kazakstan och Serbien (se diskussion här ovan). Lsj (diskussion) 8 augusti 2015 kl. 20.17 (CEST)
- jag fattade inte att föregreningsartiklarna är dubbletter utan att bara själva artiklarna skrev med latinsk transkribtion. Jag passar i diskussionen då för avancerat för mig.Yger (diskussion) 8 augusti 2015 kl. 20.07 (CEST)
- Yger, här hänger jag inte riktigt med. Artiklarna ska ju återfinnas under latinsk transkribtion, och vi kommer därför att ha motsvarande förgreningssidor för de namnen. De icke-latinska förgreningssidorna blir ju då rena dubbletter (som inte kommer att uppdateras när det exempelvis tillkommer handskrivna artiklar som gör anspråk på samma uppslagsord). Är det då inte bättre att dessa icke-latinska omdirigerar till den ordinarie "latinska" grensidan? Eller tänker jag alldeles galet? Taxelson (diskussion) 8 augusti 2015 kl. 19.56 (CEST)
Språkfel
[redigera wikitext]Höstblomma talar här ovan om "uppenbara språkfel" i förgreningssidorna. Det jag hittar är att provinsnamn och liknande inte är översatta. I vissa fall, t.ex. "Peloponnese", är detta en bugg i programmet som gjort att fel form kommit med - tack för att du påtalade den. (Jodå, det finns buggar - det är fortfarande provkörning.) I andra fall är det inte alls självklart vilka former som verkligen ska översättas. Jag tycker inte att vi konsekvent ska översätta alla "Northern Province" till "Norra provinsen" om inte formen faktiskt är vedertagen på svenska för just den provinsen. När boten kan identifiera en svensk form så ska den användas, men vi ska inte nyskapa försvenskade former. Lsj (diskussion) 8 augusti 2015 kl. 19.58 (CEST)
- Ett exempel är Bahrein (olika betydelser), det relaterar antagligen till Bahrain, men en märklighet är uppslaget "Bahrain (självständig stat i Bahrain)". Hur skedde avläsningen där? Något sådant som "Bahrain (självständig stat i Bahrain)" finns inte. Höstblomma (diskussion) 8 augusti 2015 kl. 20.12 (CEST)
- Det faller nog tillbaka på en egenhet hos databasen. En PCLI i databasen anger att databasposten om den självständiga staten Bahrain ligger i Bahrain. Det låter konstigt, men är nog sematiskt korrekt. Det fanns ett tag förslag på att vi skulle koda Wikidata på samma sätt, men jag tror aldrig det blev genomfört. -- Innocent bystander 8 augusti 2015 kl. 20.38 (CEST)
- Här går det att lösa hyfsat enkelt genom att behandla PCLI som ett specialfall. Vad Bahrain/Bahrein beträffar så är detta två legitima stavningsvarianter för landet (se artikeln Bahrain), apropå det där med olika arabisk transkription. Lsj (diskussion) 8 augusti 2015 kl. 21.00 (CEST)
- Det faller nog tillbaka på en egenhet hos databasen. En PCLI i databasen anger att databasposten om den självständiga staten Bahrain ligger i Bahrain. Det låter konstigt, men är nog sematiskt korrekt. Det fanns ett tag förslag på att vi skulle koda Wikidata på samma sätt, men jag tror aldrig det blev genomfört. -- Innocent bystander 8 augusti 2015 kl. 20.38 (CEST)
Brunn?
[redigera wikitext]Rent spontant tycker jag att "brunn" verkar vara lite för vagt för att det ska framgå att det är något som är relevant för en artikel. Hade jag sett en artikel där det bara stod att det handlade om en brunn hade jag nog raderat den som icke relevant, även om den var namngiven, såvida det inte framgick att det var frågan om någon särskilt intressant brunn, typ en hälsobrunn eller någon på något annat vis historiskt intressant brunn. Exempel: Al Ḩafīrah. Höstblomma (diskussion) 8 augusti 2015 kl. 19.30 (CEST)
- Frågan om vilka platstyper som är relevanta väckte jag redan när jag först flaggade för det här projektet, se högst upp på den här sidan. Jag har fått en del feedback, och tagit bort t.ex. vadställen, men det är ingen som reagerat mot just brunnarna innan. Här är aktuell lista: Användare:Lsjbot/linkfeatures. Lsj (diskussion) 8 augusti 2015 kl. 19.45 (CEST)
- jag uppfattar brunn här syfta på ett ställe i ökenområde där det går få fram vatten. Och att det får olika namn och sätts ut på kartor är nog också inte så underligt. Vi har i Sverige namn på 55000 sjöar och jag misstänker dessa brunnar för de boende är betydligt mer uppmärksammade och viktiga är vårã gölar ute i skogen är för oss.Yger (diskussion) 8 augusti 2015 kl. 19.48 (CEST)
- Inte ens arabiska Wikipedia har någon artikel om någon av de där brunnarna och med bara Geonames som källa ser jag inte hur man ska kunna avgöra hur viktig en sådan brunn egentligen är. Om de matchade mot en annan Wikipedia eller så skulle det vara lugnt. Höstblomma (diskussion)
- Jag kan hoppa över brunnarna om det finns konsensus för det. Annars tycker jag Yger har en poäng -- på en ö med ökenklimat är brunnar livsviktiga. Lsj (diskussion) 8 augusti 2015 kl. 20.08 (CEST)
- I sådan fall pga osäkert? källäge, inte utan vidare för relevansen. Vi får inte bli för hemmablinda när vi ser på fenomen i andra delar av världen (men vadställe, som redan strukits, är inte bra, de är för föränderliga).Yger (diskussion) 8 augusti 2015 kl. 20.12 (CEST)
- Brunnar grävs det nya med jämna mellanrum också och gamla brunnar kan sina. Höstblomma (diskussion) 8 augusti 2015 kl. 20.14 (CEST)
- det du skriver är korrekt i Sverige men vet du att detta gäller dessa namngivna brunnar i bahrein? oaser tex är tämligen stabila över tiden, och goda vattenställen (brunnar) kan jag tänka mig lever över hundratal år.Yger (diskussion) 8 augusti 2015 kl. 20.21 (CEST)
- Ett exempel på en brunn vi redan har en artikel om finns här. Den var en legend redan för 2000 år sedan och är fortfarande välkänd, oavsett om den fortfarande ger vatten eller inte. "Icke är du väl förmer än vår fader Jakob, som gav oss brunnen". Abraham, Rebecka, Isak, Jeremia, Sippora, Hagar, David och Elisa är andra namn som gjort brunnar kända. -- Innocent bystander 9 augusti 2015 kl. 08.03 (CEST)
- Jag är absolut för artiklar om brunnar som Jakobs brunn och Ygers resonemang om brunnar i torra länder är säkert riktigt. Jag vet inte hur förhållandena ser ut i just Bahrain. Poängen är att Geonames är den enda källan här och efter vad jag sett tycker jag inte att det är tillräckligt bra med bara en databas av den typen som källa. Jag tycker efter botprojektet med djurartiklar att en slutsats man kan dra är att det inte var helt bra att databasen som användes som källa var av den typen som bara listar allt som kan hittas, utan någon verklig kunskap bakom (människor som övervakar databasen och granskar dess faktiska innehåll). Geonames verkar vara av den typen och i vissa kategorier slår det förmodligen igenom mer än i andra och svårigheten att hitta objektet andra källor kan t.ex vara en varning. Kan man hitta det i andra källor av den typen som jag tycker är att föredra (granskade källor) är det inga problem. En risk som jag tycker är oroande i och med metoden med botskapande ur aktuella databaser är risken för att Wikipedia till stora delar ska bli bara ännu en sådan databas, dessutom med risken att informationen blir felaktig av olika orsaker. Vi har en delvis förvrängd version av CoL som en del av vår "artikelsamling", det var ett experiment, men jag önskar att det i framtiden blir mer noggrant med hur botskaparprocessen går till. Mindre omgångar, med kontroll och rättning av varje omgång, är den enda metoden jag tror fungerar i längden utan konflikter. Men massproduktion med hundratusentals artiklar och rättning i efterhand är inte en metod jag har någon tilltro för. Höstblomma (diskussion) 10 augusti 2015 kl. 08.30 (CEST)
- Ja, det är ett problem att det kan vara svårt att komplettera dessa artiklar. Vilken historia finns bakom denna brunn, vem grävde den och vad fyller den för funktion idag? Det är uppgifter det blir småsvårt att hitta för den som inte är hemma i Bahrain.
- Informationen i Geodata går att rätta för en vanlig dödlig. Det går att logga in och rätta uppgifterna. Jag har gjort det vid några få tillfällen. Tex blev en Södermanländsk tätort placerad i en by med samma namn i Ångermanland. Jag tog här bort uppgiften om att en liten by om en handfull gårdar skulle ha 400 invånare. -- Innocent bystander 10 augusti 2015 kl. 09.28 (CEST)
- Jag tar bort brunnarna, så slipper vi bekymra oss om dem. Lsj (diskussion) 13 augusti 2015 kl. 16.07 (CEST)
- Jag är absolut för artiklar om brunnar som Jakobs brunn och Ygers resonemang om brunnar i torra länder är säkert riktigt. Jag vet inte hur förhållandena ser ut i just Bahrain. Poängen är att Geonames är den enda källan här och efter vad jag sett tycker jag inte att det är tillräckligt bra med bara en databas av den typen som källa. Jag tycker efter botprojektet med djurartiklar att en slutsats man kan dra är att det inte var helt bra att databasen som användes som källa var av den typen som bara listar allt som kan hittas, utan någon verklig kunskap bakom (människor som övervakar databasen och granskar dess faktiska innehåll). Geonames verkar vara av den typen och i vissa kategorier slår det förmodligen igenom mer än i andra och svårigheten att hitta objektet andra källor kan t.ex vara en varning. Kan man hitta det i andra källor av den typen som jag tycker är att föredra (granskade källor) är det inga problem. En risk som jag tycker är oroande i och med metoden med botskapande ur aktuella databaser är risken för att Wikipedia till stora delar ska bli bara ännu en sådan databas, dessutom med risken att informationen blir felaktig av olika orsaker. Vi har en delvis förvrängd version av CoL som en del av vår "artikelsamling", det var ett experiment, men jag önskar att det i framtiden blir mer noggrant med hur botskaparprocessen går till. Mindre omgångar, med kontroll och rättning av varje omgång, är den enda metoden jag tror fungerar i längden utan konflikter. Men massproduktion med hundratusentals artiklar och rättning i efterhand är inte en metod jag har någon tilltro för. Höstblomma (diskussion) 10 augusti 2015 kl. 08.30 (CEST)
- Ett exempel på en brunn vi redan har en artikel om finns här. Den var en legend redan för 2000 år sedan och är fortfarande välkänd, oavsett om den fortfarande ger vatten eller inte. "Icke är du väl förmer än vår fader Jakob, som gav oss brunnen". Abraham, Rebecka, Isak, Jeremia, Sippora, Hagar, David och Elisa är andra namn som gjort brunnar kända. -- Innocent bystander 9 augusti 2015 kl. 08.03 (CEST)
- det du skriver är korrekt i Sverige men vet du att detta gäller dessa namngivna brunnar i bahrein? oaser tex är tämligen stabila över tiden, och goda vattenställen (brunnar) kan jag tänka mig lever över hundratal år.Yger (diskussion) 8 augusti 2015 kl. 20.21 (CEST)
- Brunnar grävs det nya med jämna mellanrum också och gamla brunnar kan sina. Höstblomma (diskussion) 8 augusti 2015 kl. 20.14 (CEST)
- I sådan fall pga osäkert? källäge, inte utan vidare för relevansen. Vi får inte bli för hemmablinda när vi ser på fenomen i andra delar av världen (men vadställe, som redan strukits, är inte bra, de är för föränderliga).Yger (diskussion) 8 augusti 2015 kl. 20.12 (CEST)
- Jag kan hoppa över brunnarna om det finns konsensus för det. Annars tycker jag Yger har en poäng -- på en ö med ökenklimat är brunnar livsviktiga. Lsj (diskussion) 8 augusti 2015 kl. 20.08 (CEST)
- Inte ens arabiska Wikipedia har någon artikel om någon av de där brunnarna och med bara Geonames som källa ser jag inte hur man ska kunna avgöra hur viktig en sådan brunn egentligen är. Om de matchade mot en annan Wikipedia eller så skulle det vara lugnt. Höstblomma (diskussion)
- jag uppfattar brunn här syfta på ett ställe i ökenområde där det går få fram vatten. Och att det får olika namn och sätts ut på kartor är nog också inte så underligt. Vi har i Sverige namn på 55000 sjöar och jag misstänker dessa brunnar för de boende är betydligt mer uppmärksammade och viktiga är vårã gölar ute i skogen är för oss.Yger (diskussion) 8 augusti 2015 kl. 19.48 (CEST)
Sjöfart
[redigera wikitext]I trakten runt ‘Ayn Yūsuf finns ovanligt många namngivna öar, vattenkällor, halvöar, rev och sjöfart. - Vad är sjöfart här? -- Innocent bystander 8 augusti 2015 kl. 20.29 (CEST)
- "Sjöfart" är mitt försök att skapa en kategori för alla sjöfartsrelaterade platstyper (hamnar, farleder, etc.). Blir inte språkligt klockren när den används såhär. Förslag på bättre benämning? Lsj (diskussion) 8 augusti 2015 kl. 21.04 (CEST)
- Har du fler exempel än "hamnar" och "farleder"? -- Innocent bystander 9 augusti 2015 kl. 08.04 (CEST)
- Hela listan: ankarplats, sjökanal, havskanal, farled, hamn. Dessutom är kategori:kanaler underkategori till sjöfart. (Jag använder samma kategorisering när jag gör kategorier för platserna, som när jag räknar fram "ovanligt många".) Lsj (diskussion) 9 augusti 2015 kl. 12.15 (CEST)
- Sjöfartsrelaterade platser? Taxelson (diskussion) 9 augusti 2015 kl. 18.27 (CEST)
- Tar gärna emot bättre förslag till kategorisering. Finns också motsvarande kategori för luftfart (flygplatser m.m.) i botens lista, som kanske inte heller är helt ideal. Det kategorisystem som boten skapar kan beskådas i sina huvuddrag här: Kategori:Antigua och Barbudas geografi. Lsj (diskussion) 9 augusti 2015 kl. 19.11 (CEST)
- Jag tänkte mig inte förslaget som kategorinamn, utan i artiklarna. Förstår att det inte är idealiskt att ha olika ord för kategori och i artiklarna, men kanske behöver man tänka i de banorna. Taxelson (diskussion) 9 augusti 2015 kl. 19.22 (CEST)
- Ok, jag missförstod innan. 'Sjöfartsrelaterade platser' funkar nog både som kategorinamn och i artiklarna. De flygrelaterade får helt enkelt heta "flygplatser". Lsj (diskussion) 11 augusti 2015 kl. 18.05 (CEST)
- Jag tänkte mig inte förslaget som kategorinamn, utan i artiklarna. Förstår att det inte är idealiskt att ha olika ord för kategori och i artiklarna, men kanske behöver man tänka i de banorna. Taxelson (diskussion) 9 augusti 2015 kl. 19.22 (CEST)
- Tar gärna emot bättre förslag till kategorisering. Finns också motsvarande kategori för luftfart (flygplatser m.m.) i botens lista, som kanske inte heller är helt ideal. Det kategorisystem som boten skapar kan beskådas i sina huvuddrag här: Kategori:Antigua och Barbudas geografi. Lsj (diskussion) 9 augusti 2015 kl. 19.11 (CEST)
- Sjöfartsrelaterade platser? Taxelson (diskussion) 9 augusti 2015 kl. 18.27 (CEST)
- Hela listan: ankarplats, sjökanal, havskanal, farled, hamn. Dessutom är kategori:kanaler underkategori till sjöfart. (Jag använder samma kategorisering när jag gör kategorier för platserna, som när jag räknar fram "ovanligt många".) Lsj (diskussion) 9 augusti 2015 kl. 12.15 (CEST)
- Har du fler exempel än "hamnar" och "farleder"? -- Innocent bystander 9 augusti 2015 kl. 08.04 (CEST)
Nordkorea
[redigera wikitext]Kartan ovan antyder att det finns mycket material från Nordkorea. Det är högst förvånande! Vad för typ av objekt är det? -- Innocent bystander 9 augusti 2015 kl. 08.27 (CEST)
- @Innocent bystander: Se tabellen nedan.
Feature class Antal objekt (KP)
NordkoreaAntal objekt (KR)
SydkoreaP (city, village, ...) 31 566 45 112 T (mountain, hill, rock, ...) 5 474 11 775 L (parks, area, ...) 1 236 7 344 S (spot, building, farm) 1 101 15 661 H (stream, lake, ...) 910 6 960 A (country, state, region) 224 4 390 R (road, railroad) 53 573 U (undersea) 0 0 V (forest, heath, ...) 0 1 Totalt 40 564 91 816
- Kompletterat tabellen med en jämförelse med Sydkorea som har mer än dubbelt så många objekt med en större spridning på objekttyper. --Larske (diskussion) 9 augusti 2015 kl. 09.18 (CEST)
- Min förvåning bottnar i att jag har uppfattat att det är mycket som är osäkert om folkrepublikens administrativa indelning. -- Innocent bystander 9 augusti 2015 kl. 09.19 (CEST)
- Vilket också bekräftas ovan. Syd har 20 gånger mer i kategori A. -- Innocent bystander 9 augusti 2015 kl. 15.59 (CEST)
- När det gäller administrativ indelning kan länder skilja sig enormt utan att det är något "konstigt". Det kan både vara genuina skillnader, som att Frankrike inte har haft någon sådan storkommunreform som Sverige har haft, och skillnader i hur långt ner i hierarkin som GeoNames går. Totalt i GeoNames har USA flest indelningar, men något otippat är Nepal tvåa, helt enkelt därför att varenda by i Nepal är en egen administrativ enhet, och GeoNames har 40000 av dem listade. Lsj (diskussion) 9 augusti 2015 kl. 16.14 (CEST)
- Vilket också bekräftas ovan. Syd har 20 gånger mer i kategori A. -- Innocent bystander 9 augusti 2015 kl. 15.59 (CEST)
- Min förvåning bottnar i att jag har uppfattat att det är mycket som är osäkert om folkrepublikens administrativa indelning. -- Innocent bystander 9 augusti 2015 kl. 09.19 (CEST)
- Kompletterat tabellen med en jämförelse med Sydkorea som har mer än dubbelt så många objekt med en större spridning på objekttyper. --Larske (diskussion) 9 augusti 2015 kl. 09.18 (CEST)
@Innocent bystander: Här är listan för alla länder:
Antal objekt per objektstyp per land i GeoNames (per 2015-08-09 01:47) | ||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|
Objektstyp | ||||||||||||
Landskod | - | A | H | L | P | R | S | T | U | V | Totalt | |
- | 5 | 364 | 100 | 2 | 231 | 81 | 5 072 | 1 | 5 856 | |||
AD | 11 | 727 | 580 | 56 | 121 | 559 | 943 | 205 | 3 202 | |||
AE | 20 | 931 | 379 | 635 | 14 | 2 821 | 1 139 | 80 | 6 019 | |||
AF | 474 | 17 168 | 1 819 | 32 530 | 107 | 3 260 | 20 151 | 1 | 49 | 75 559 | ||
AG | 9 | 148 | 27 | 124 | 92 | 186 | 586 | |||||
AI | 1 | 65 | 5 | 36 | 26 | 46 | 179 | |||||
AL | 624 | 643 | 67 | 4 337 | 3 | 440 | 1 679 | 11 | 7 804 | |||
AM | 79 | 205 | 4 | 1 266 | 210 | 234 | 1 | 1 999 | ||||
AO | 180 | 22 618 | 4 572 | 16 398 | 2 147 | 3 754 | 303 | 49 972 | ||||
AQ | 166 | 1 | 4 025 | 44 | 3 | 259 | 13 739 | 310 | 18 547 | |||
AR | 542 | 7 630 | 3 284 | 6 917 | 64 | 21 088 | 8 196 | 3 | 43 | 47 767 | ||
AS | 2 | 101 | 238 | 19 | 148 | 65 | 420 | 1 | 1 | 995 | ||
AT | 2 661 | 3 516 | 3 531 | 15 422 | 148 | 10 589 | 10 027 | 433 | 46 327 | |||
AU | 701 | 52 976 | 14 900 | 15 716 | 1 153 | 86 117 | 32 573 | 72 | 62 | 204 270 | ||
AW | 1 | 64 | 6 | 105 | 108 | 60 | 344 | |||||
AX | 20 | 325 | 2 | 367 | 85 | 2 427 | 13 | 3 239 | ||||
AZ | 101 | 742 | 385 | 5 039 | 653 | 997 | 8 | 7 925 | ||||
BA | 173 | 6 451 | 5 803 | 21 993 | 6 | 1 381 | 15 881 | 2 | 51 | 51 741 | ||
BB | 12 | 81 | 10 | 514 | 1 | 174 | 70 | 862 | ||||
BD | 604 | 3 249 | 432 | 48 743 | 17 | 929 | 243 | 30 | 54 247 | |||
BE | 651 | 1 818 | 87 | 12 640 | 50 | 3 170 | 183 | 1 460 | 20 059 | |||
BF | 67 | 708 | 129 | 9 130 | 436 | 256 | 13 | 10 739 | ||||
BG | 2 947 | 726 | 269 | 6 443 | 2 | 1 470 | 838 | 1 | 12 696 | |||
BH | 6 | 84 | 16 | 120 | 212 | 90 | 4 | 532 | ||||
BI | 146 | 2 354 | 402 | 6 963 | 17 | 770 | 624 | 202 | 11 478 | |||
BJ | 92 | 1 311 | 35 | 3 663 | 80 | 127 | 2 | 5 310 | ||||
BL | 1 | 29 | 17 | 15 | 35 | 97 | ||||||
BM | 12 | 241 | 3 | 21 | 2 | 72 | 286 | 3 | 640 | |||
BN | 5 | 530 | 1 | 220 | 33 | 108 | 9 | 906 | ||||
BO | 432 | 4 557 | 1 419 | 14 038 | 2 | 1 526 | 4 909 | 13 | 26 896 | |||
BQ | 4 | 91 | 100 | 88 | 58 | 121 | 462 | |||||
BR | 5 640 | 24 148 | 3 122 | 54 822 | 40 | 15 689 | 7 561 | 2 | 28 | 111 052 | ||
BS | 42 | 400 | 9 | 345 | 227 | 1 119 | 5 | 2 147 | ||||
BT | 47 | 26 | 1 | 243 | 31 | 51 | 399 | |||||
BV | 1 | 17 | 4 | 1 | 24 | 47 | ||||||
BW | 19 | 634 | 304 | 1 719 | 244 | 843 | 3 763 | |||||
BY | 209 | 2 170 | 449 | 25 357 | 1 394 | 59 | 18 | 29 656 | ||||
BZ | 10 | 619 | 210 | 465 | 1 | 623 | 349 | 3 | 1 | 2 281 | ||
CA | 1 814 | 2 733 | 191 997 | 20 635 | 19 341 | 659 | 10 718 | 57 105 | 8 005 | 116 | 313 123 | |
CC | 1 | 14 | 2 | 2 | 4 | 39 | 62 | |||||
CD | 282 | 25 796 | 122 | 36 604 | 3 | 2 026 | 881 | 17 | 65 731 | |||
CF | 90 | 9 009 | 40 | 5 700 | 107 | 422 | 9 | 15 377 | ||||
CG | 59 | 3 364 | 282 | 5 807 | 1 | 127 | 289 | 128 | 10 057 | |||
CH | 2 757 | 298 | 62 | 8 715 | 28 | 27 417 | 6 833 | 35 | 46 145 | |||
CI | 185 | 5 738 | 214 | 10 700 | 131 | 701 | 1 | 12 | 17 682 | |||
CK | 17 | 151 | 119 | 41 | 93 | 209 | 630 | |||||
CL | 422 | 10 572 | 1 742 | 3 896 | 25 | 6 764 | 13 788 | 1 | 21 | 37 231 | ||
CM | 87 | 7 580 | 157 | 13 427 | 111 | 1 383 | 46 | 22 791 | ||||
CN | 12 057 | 10 012 | 11 017 | 547 507 | 177 | 11 766 | 7 693 | 15 | 27 | 600 271 | ||
CO | 1 159 | 20 987 | 3 076 | 33 417 | 19 | 10 263 | 6 901 | 1 | 168 | 75 991 | ||
CR | 92 | 1 136 | 46 | 2 396 | 5 | 764 | 547 | 4 | 4 990 | |||
CS | 2 | 2 | ||||||||||
CU | 143 | 3 751 | 19 834 | 9 006 | 31 | 2 470 | 2 944 | 2 | 28 | 38 209 | ||
CV | 24 | 163 | 256 | 123 | 417 | 983 | ||||||
CW | 3 | 99 | 6 | 95 | 211 | 70 | 7 | 491 | ||||
CX | 1 | 4 | 1 | 6 | 5 | 65 | 82 | |||||
CY | 600 | 653 | 2 343 | 699 | 6 | 2 179 | 459 | 167 | 7 106 | |||
CZ | 119 | 647 | 82 | 16 418 | 458 | 2 704 | 2 693 | 43 | 23 164 | |||
DE | 12 565 | 13 816 | 2 530 | 78 891 | 102 | 44 939 | 25 326 | 1 | 6 924 | 185 094 | ||
DJ | 10 | 3 284 | 191 | 49 | 63 | 1 814 | 34 | 5 445 | ||||
DK | 107 | 1 556 | 77 | 7 197 | 4 | 4 107 | 1 122 | 5 | 565 | 14 740 | ||
DM | 11 | 138 | 8 | 106 | 30 | 104 | 397 | |||||
DO | 136 | 6 600 | 2 602 | 7 934 | 7 | 1 015 | 4 000 | 1 | 89 | 22 384 | ||
DZ | 822 | 16 426 | 3 198 | 8 250 | 4 | 8 780 | 16 340 | 2 | 390 | 54 212 | ||
EC | 166 | 4 257 | 206 | 7 334 | 3 | 436 | 1 211 | 2 | 13 615 | |||
EE | 243 | 857 | 1 085 | 7 049 | 1 | 651 | 323 | 1 | 10 210 | |||
EG | 193 | 6 852 | 757 | 10 375 | 186 | 8 303 | 4 469 | 2 | 84 | 31 221 | ||
EH | 2 | 947 | 366 | 36 | 2 | 168 | 761 | 2 282 | ||||
ER | 57 | 1 626 | 642 | 1 362 | 237 | 2 367 | 6 291 | |||||
ES | 8 240 | 7 274 | 1 178 | 29 560 | 52 | 25 544 | 6 255 | 1 | 364 | 78 468 | ||
ET | 363 | 3 755 | 1 495 | 10 837 | 2 | 1 458 | 2 268 | 19 | 20 197 | |||
FI | 517 | 8 599 | 161 | 14 385 | 18 | 10 463 | 49 200 | 17 | 83 360 | |||
FJ | 29 | 7 862 | 166 | 1 287 | 3 | 336 | 2 132 | 10 | 11 825 | |||
FK | 1 | 365 | 14 | 55 | 17 | 670 | 1 122 | |||||
FM | 83 | 427 | 76 | 475 | 21 | 669 | 725 | 81 | 56 | 2 613 | ||
FO | 37 | 300 | 7 | 187 | 2 | 70 | 1 203 | 1 | 1 807 | |||
FR | 37 069 | 5 647 | 367 | 59 417 | 56 | 29 234 | 6 896 | 3 | 2 609 | 141 298 | ||
GA | 37 | 2 371 | 21 | 3 926 | 46 | 423 | 7 | 6 831 | ||||
GB | 11 893 | 4 841 | 724 | 17 326 | 410 | 19 987 | 4 200 | 19 | 276 | 59 676 | ||
GD | 8 | 140 | 1 | 276 | 2 | 124 | 142 | 693 | ||||
GE | 128 | 1 311 | 426 | 5 141 | 7 | 545 | 1 198 | 2 | 8 758 | |||
GF | 35 | 1 672 | 357 | 632 | 20 | 215 | 430 | 73 | 3 434 | |||
GG | 13 | 105 | 62 | 257 | 135 | 271 | 1 | 844 | ||||
GH | 200 | 1 738 | 273 | 10 134 | 2 | 421 | 567 | 13 335 | ||||
GI | 1 | 19 | 15 | 4 | 5 | 176 | 22 | 242 | ||||
GL | 24 | 2 166 | 217 | 254 | 1 | 217 | 4 519 | 1 | 7 399 | |||
GM | 47 | 131 | 73 | 2 035 | 1 | 52 | 59 | 2 398 | ||||
GN | 50 | 2 509 | 33 | 6 794 | 88 | 1 037 | 10 511 | |||||
GP | 37 | 429 | 20 | 415 | 95 | 511 | 2 | 1 509 | ||||
GQ | 23 | 1 513 | 2 084 | 496 | 222 | 1 | 4 339 | |||||
GR | 569 | 2 652 | 360 | 14 011 | 2 | 9 379 | 5 741 | 2 | 3 | 32 719 | ||
GS | 1 | 176 | 2 | 1 | 292 | 472 | ||||||
GT | 371 | 2 786 | 946 | 7 010 | 1 | 3 491 | 743 | 15 348 | ||||
GU | 20 | 120 | 73 | 126 | 20 | 626 | 213 | 17 | 1 | 1 216 | ||
GW | 39 | 2 175 | 27 | 4 297 | 43 | 319 | 14 | 6 914 | ||||
GY | 59 | 3 132 | 244 | 552 | 24 | 1 270 | 584 | 3 | 5 868 | |||
HK | 21 | 206 | 40 | 1 142 | 1 | 622 | 449 | 2 481 | ||||
HM | 1 | 18 | 63 | 82 | ||||||||
HN | 319 | 3 509 | 108 | 12 075 | 1 | 229 | 2 690 | 4 | 1 | 18 936 | ||
HR | 133 | 2 500 | 2 587 | 9 627 | 6 | 2 685 | 5 935 | 71 | 23 544 | |||
HT | 185 | 1 458 | 1 774 | 10 884 | 28 | 116 | 1 294 | 3 | 15 742 | |||
HU | 198 | 1 052 | 1 910 | 15 919 | 6 | 2 574 | 2 707 | 49 | 24 415 | |||
ID | 28 284 | 54 384 | 1 426 | 253 671 | 15 | 4 905 | 40 803 | 5 | 77 | 383 570 | ||
IE | 109 | 3 079 | 3 386 | 9 855 | 88 | 6 255 | 3 267 | 105 | 26 144 | |||
IL | 28 | 1 676 | 602 | 1 548 | 730 | 2 680 | 1 135 | 70 | 8 469 | |||
IM | 25 | 28 | 1 | 37 | 30 | 37 | 158 | |||||
IN | 857 | 8 452 | 3 148 | 81 473 | 119 | 8 569 | 3 180 | 1 | 583 | 106 382 | ||
IO | 1 | 28 | 4 | 4 | 70 | 107 | ||||||
IQ | 211 | 8 465 | 4 285 | 23 839 | 198 | 3 205 | 3 779 | 1 | 400 | 44 383 | ||
IR | 601 | 19 053 | 7 024 | 79 586 | 1 140 | 41 026 | 47 796 | 2 | 2 547 | 198 775 | ||
IS | 320 | 2 949 | 222 | 109 | 5 | 5 632 | 6 548 | 35 | 293 | 16 113 | ||
IT | 8 247 | 3 219 | 1 034 | 61 911 | 72 | 24 338 | 8 030 | 2 | 534 | 107 387 | ||
JE | 14 | 151 | 3 | 68 | 105 | 131 | 1 | 473 | ||||
JM | 17 | 774 | 92 | 2 173 | 6 | 517 | 605 | 4 | 4 188 | |||
JO | 92 | 2 594 | 165 | 874 | 9 | 983 | 1 402 | 16 | 6 135 | |||
JP | 4 706 | 6 350 | 653 | 30 738 | 218 | 17 177 | 11 123 | 18 | 45 | 71 028 | ||
KE | 2 410 | 5 710 | 4 025 | 3 018 | 161 | 5 628 | 4 306 | 230 | 25 488 | |||
KG | 74 | 2 905 | 258 | 2 513 | 1 | 485 | 1 845 | 2 | 8 083 | |||
KH | 337 | 1 807 | 6 | 7 782 | 1 | 571 | 1 156 | 11 660 | ||||
KI | 41 | 150 | 18 | 206 | 26 | 333 | 176 | 64 | 58 | 1 072 | ||
KM | 4 | 261 | 47 | 401 | 23 | 378 | 22 | 1 136 | ||||
KN | 15 | 116 | 5 | 118 | 209 | 53 | 516 | |||||
KP | 224 | 910 | 1 236 | 31 566 | 53 | 1 101 | 5 474 | 40 564 | ||||
KR | 4 390 | 6 960 | 7 344 | 45 112 | 573 | 15 661 | 11 775 | 1 | 91 816 | |||
KW | 7 | 228 | 142 | 121 | 2 | 214 | 159 | 873 | ||||
KY | 15 | 109 | 21 | 68 | 52 | 100 | 2 | 367 | ||||
KZ | 326 | 6 176 | 1 101 | 10 195 | 81 | 3 498 | 1 952 | 29 | 23 358 | |||
LA | 199 | 3 617 | 65 | 12 204 | 2 | 167 | 2 765 | 50 | 19 069 | |||
LB | 47 | 7 108 | 1 735 | 3 646 | 68 | 1 731 | 8 144 | 1 725 | 24 204 | |||
LC | 12 | 144 | 3 | 189 | 1 | 126 | 154 | 1 | 630 | |||
LI | 26 | 111 | 50 | 361 | 3 | 76 | 751 | 470 | 1 848 | |||
LK | 5 258 | 9 126 | 4 533 | 17 731 | 81 | 8 019 | 1 418 | 2 | 1 326 | 47 494 | ||
LR | 855 | 853 | 38 | 6 293 | 5 | 310 | 393 | 13 | 8 760 | |||
LS | 154 | 143 | 2 | 276 | 410 | 227 | 1 212 | |||||
LT | 75 | 1 137 | 34 | 7 027 | 1 | 513 | 44 | 190 | 9 021 | |||
LU | 142 | 56 | 3 | 644 | 208 | 31 | 52 | 1 136 | ||||
LV | 122 | 1 269 | 15 | 4 649 | 2 | 2 542 | 66 | 55 | 8 720 | |||
LY | 50 | 8 876 | 1 777 | 877 | 185 | 5 232 | 4 119 | 277 | 21 393 | |||
MA | 1 720 | 5 282 | 3 053 | 17 084 | 3 | 8 708 | 8 381 | 2 | 36 | 44 269 | ||
MC | 12 | 5 | 4 | 8 | 55 | 10 | 94 | |||||
MD | 42 | 212 | 46 | 1 807 | 1 | 288 | 86 | 9 | 2 491 | |||
ME | 22 | 1 512 | 1 698 | 4 046 | 12 | 1 084 | 5 772 | 2 | 14 148 | |||
MF | 2 | 45 | 1 | 54 | 33 | 65 | 200 | |||||
MG | 83 | 3 446 | 890 | 24 113 | 419 | 2 628 | 2 | 133 | 31 714 | |||
MH | 48 | 190 | 30 | 113 | 217 | 677 | 41 | 1 | 1 317 | |||
MK | 109 | 4 028 | 4 776 | 2 736 | 16 | 587 | 10 668 | 220 | 23 140 | |||
ML | 71 | 3 929 | 1 062 | 14 908 | 539 | 2 977 | 194 | 23 680 | ||||
MM | 96 | 5 676 | 324 | 39 433 | 591 | 3 667 | 49 787 | |||||
MN | 424 | 2 473 | 205 | 1 538 | 5 | 458 | 1 903 | 11 | 7 017 | |||
MO | 3 | 18 | 13 | 7 | 1 | 101 | 21 | 164 | ||||
MP | 17 | 74 | 50 | 45 | 13 | 321 | 284 | 92 | 21 | 917 | ||
MQ | 41 | 316 | 7 | 507 | 1 | 270 | 354 | 2 | 1 498 | |||
MR | 75 | 3 788 | 627 | 1 055 | 4 | 288 | 3 005 | 16 | 8 858 | |||
MS | 4 | 102 | 15 | 83 | 56 | 38 | 298 | |||||
MT | 75 | 293 | 1 185 | 279 | 2 | 819 | 242 | 1 | 2 | 2 898 | ||
MU | 13 | 311 | 61 | 531 | 1 | 319 | 373 | 1 609 | ||||
MV | 29 | 40 | 85 | 248 | 800 | 1 202 | ||||||
MW | 32 | 1 974 | 78 | 4 908 | 58 | 693 | 1 238 | 4 | 8 985 | |||
MX | 2 496 | 90 119 | 8 744 | 214 047 | 97 | 17 226 | 57 084 | 11 | 389 824 | |||
MY | 402 | 30 585 | 2 841 | 19 998 | 33 | 6 494 | 7 878 | 7 | 553 | 68 791 | ||
MZ | 190 | 17 413 | 600 | 22 651 | 3 | 3 522 | 4 551 | 16 | 48 946 | |||
NA | 29 | 1 348 | 149 | 2 033 | 1 | 3 224 | 1 075 | 8 | 7 867 | |||
NC | 37 | 1 430 | 305 | 628 | 134 | 2 154 | 6 | 10 | 4 704 | |||
NE | 52 | 7 345 | 890 | 12 834 | 2 | 306 | 2 637 | 70 | 24 136 | |||
NF | 1 | 14 | 1 | 4 | 32 | 25 | 1 | 78 | ||||
NG | 3 619 | 4 623 | 529 | 50 179 | 10 | 588 | 2 146 | 1 | 6 | 61 701 | ||
NI | 177 | 1 485 | 258 | 2 786 | 3 | 256 | 1 093 | 6 058 | ||||
NL | 438 | 2 961 | 2 037 | 7 640 | 261 | 6 577 | 1 950 | 585 | 22 449 | |||
NO | 471 | 184 771 | 138 | 12 477 | 16 | 138 334 | 263 872 | 9 | 17 | 600 105 | ||
NP | 40 883 | 1 571 | 41 | 79 607 | 8 | 260 | 475 | 6 | 122 851 | |||
NR | 15 | 9 | 6 | 11 | 3 | 49 | 6 | 3 | 3 | 105 | ||
NU | 1 | 2 | 60 | 15 | 1 | 5 | 84 | |||||
NZ | 571 | 377 | 26 413 | 3 994 | 2 989 | 789 | 13 796 | 18 889 | 5 | 351 | 68 174 | |
OM | 12 | 1 876 | 356 | 2 333 | 6 | 850 | 1 144 | 20 | 6 597 | |||
PA | 605 | 5 042 | 317 | 6 891 | 18 | 517 | 3 464 | 16 854 | ||||
PE | 2 056 | 23 807 | 4 438 | 38 745 | 8 | 2 945 | 27 016 | 19 | 99 034 | |||
PF | 86 | 865 | 61 | 306 | 144 | 1 077 | 2 539 | |||||
PG | 159 | 4 696 | 32 | 11 598 | 17 | 1 356 | 3 804 | 24 | 5 | 21 691 | ||
PH | 1 698 | 13 451 | 449 | 43 873 | 2 255 | 3 717 | 10 827 | 8 | 31 | 76 309 | ||
PK | 185 | 29 039 | 8 859 | 100 945 | 794 | 5 556 | 12 081 | 1 | 750 | 158 210 | ||
PL | 2 917 | 2 403 | 81 | 46 175 | 27 | 2 492 | 1 479 | 1 | 217 | 55 792 | ||
PM | 3 | 263 | 9 | 5 | 1 | 26 | 199 | 13 | 519 | |||
PN | 1 | 6 | 2 | 2 | 1 | 29 | 41 | |||||
PR | 10 | 1 137 | 562 | 256 | 2 504 | 37 | 2 261 | 1 439 | 2 | 16 | 8 224 | |
PS | 19 | 1 506 | 152 | 1 248 | 3 | 2 735 | 437 | 22 | 6 122 | |||
PT | 4 606 | 4 354 | 44 | 16 575 | 40 | 4 271 | 2 894 | 2 | 80 | 32 866 | ||
PW | 18 | 186 | 70 | 86 | 13 | 196 | 232 | 12 | 4 | 817 | ||
PY | 22 | 577 | 265 | 2 045 | 2 | 476 | 162 | 26 | 3 575 | |||
QA | 12 | 303 | 72 | 196 | 263 | 499 | 11 | 1 356 | ||||
RE | 31 | 310 | 19 | 344 | 138 | 375 | 8 | 1 225 | ||||
RO | 3 230 | 888 | 69 | 18 065 | 11 | 1 525 | 2 350 | 28 | 26 166 | |||
RS | 200 | 3 014 | 4 069 | 9 498 | 24 | 1 192 | 6 375 | 1 | 40 | 24 413 | ||
RU | 2 491 | 83 991 | 10 213 | 200 813 | 200 | 26 434 | 23 846 | 33 | 387 | 348 408 | ||
RW | 72 | 7 015 | 206 | 10 046 | 113 | 595 | 95 | 18 142 | ||||
SA | 17 | 7 488 | 988 | 3 153 | 278 | 1 708 | 9 437 | 19 | 23 088 | |||
SB | 13 | 2 897 | 665 | 3 067 | 2 | 148 | 2 400 | 6 | 9 198 | |||
SC | 27 | 131 | 1 | 18 | 120 | 167 | 1 | 465 | ||||
SD | 58 | 9 468 | 996 | 7 448 | 4 | 550 | 7 399 | 1 | 81 | 26 005 | ||
SE | 4 534 | 20 221 | 222 | 28 124 | 10 | 22 785 | 19 045 | 2 | 47 | 94 990 | ||
SG | 6 | 385 | 169 | 372 | 3 | 743 | 232 | 1 910 | ||||
SH | 4 | 91 | 17 | 13 | 127 | 394 | 646 | |||||
SI | 233 | 210 | 27 | 6 379 | 4 | 554 | 391 | 1 | 7 799 | |||
SJ | 7 | 1 865 | 67 | 10 | 4 | 58 | 3 491 | 25 | 5 527 | |||
SK | 97 | 459 | 29 | 4 991 | 4 | 908 | 1 284 | 11 | 7 783 | |||
SL | 197 | 2 067 | 34 | 14 075 | 1 | 64 | 727 | 17 165 | ||||
SM | 10 | 8 | 22 | 28 | 68 | |||||||
SN | 55 | 1 153 | 439 | 9 640 | 700 | 206 | 39 | 12 232 | ||||
SO | 110 | 6 042 | 3 412 | 4 500 | 22 | 416 | 2 963 | 4 | 17 469 | |||
SR | 11 | 1 205 | 127 | 520 | 39 | 217 | 221 | 11 | 2 351 | |||
SS | 47 | 4 177 | 555 | 5 253 | 461 | 1 564 | 1 | 29 | 12 087 | |||
ST | 5 | 80 | 221 | 12 | 298 | 616 | ||||||
SV | 322 | 1 249 | 34 | 3 528 | 1 | 352 | 934 | 6 420 | ||||
SX | 1 | 29 | 13 | 59 | 66 | 27 | 195 | |||||
SY | 357 | 4 906 | 1 446 | 10 576 | 96 | 3 473 | 4 931 | 1 276 | 27 061 | |||
SZ | 15 | 77 | 4 | 81 | 1 | 32 | 128 | 338 | ||||
TC | 1 | 59 | 20 | 75 | 69 | 1 | 225 | |||||
TD | 67 | 6 459 | 402 | 11 551 | 157 | 3 370 | 34 | 22 040 | ||||
TF | 11 | 544 | 19 | 1 | 2 | 44 | 1 011 | 3 | 3 | 1 638 | ||
TG | 36 | 1 115 | 64 | 4 133 | 85 | 302 | 18 | 5 753 | ||||
TH | 1 041 | 51 351 | 39 | 85 846 | 95 | 100 286 | 13 721 | 5 | 24 | 252 408 | ||
TJ | 124 | 628 | 61 | 2 694 | 1 | 164 | 574 | 1 | 4 247 | |||
TK | 4 | 16 | 10 | 5 | 28 | 49 | 4 | 2 | 118 | |||
TL | 81 | 1 442 | 1 | 3 385 | 33 | 2 168 | 7 110 | |||||
TM | 53 | 2 239 | 174 | 1 281 | 578 | 1 121 | 1 | 5 447 | ||||
TN | 160 | 6 681 | 1 199 | 1 798 | 4 | 6 053 | 3 922 | 1 | 3 | 19 821 | ||
TO | 8 | 147 | 6 | 141 | 40 | 311 | 8 | 661 | ||||
TR | 1 919 | 5 900 | 746 | 52 281 | 19 | 8 946 | 8 604 | 45 | 78 460 | |||
TT | 53 | 660 | 79 | 452 | 174 | 376 | 1 794 | |||||
TV | 10 | 64 | 9 | 27 | 6 | 99 | 100 | 7 | 19 | 341 | ||
TW | 1 182 | 2 495 | 518 | 16 089 | 422 | 13 625 | 4 019 | 1 | 6 | 38 357 | ||
TZ | 402 | 2 682 | 808 | 7 692 | 15 | 758 | 3 169 | 7 | 15 533 | |||
UA | 850 | 1 873 | 443 | 31 558 | 5 | 2 949 | 827 | 21 | 38 526 | |||
UG | 1 860 | 2 731 | 1 185 | 6 469 | 20 | 517 | 2 299 | 147 | 15 228 | |||
UM | 10 | 49 | 22 | 3 | 5 | 101 | 64 | 4 | 13 | 271 | ||
US | 2 704 | 54 627 | 506 233 | 78 703 | 191 886 | 24 662 | 1 122 660 | 225 060 | 185 | 2 046 | 2 208 766 | |
UY | 21 | 2 541 | 60 | 863 | 4 | 916 | 946 | 1 | 5 352 | |||
UZ | 295 | 1 476 | 63 | 5 479 | 22 | 365 | 467 | 3 | 8 170 | |||
VA | 1 | 1 | 1 | 20 | 23 | |||||||
VC | 7 | 85 | 3 | 72 | 1 | 36 | 91 | 295 | ||||
VE | 440 | 17 578 | 3 763 | 24 938 | 9 | 11 703 | 9 414 | 313 | 68 158 | |||
VG | 1 | 256 | 3 | 23 | 30 | 257 | 570 | |||||
VI | 8 | 344 | 244 | 36 | 228 | 28 | 496 | 474 | 1 858 | |||
VN | 10 201 | 5 748 | 393 | 40 812 | 25 | 1 925 | 5 178 | 16 | 3 | 64 301 | ||
VU | 9 | 983 | 202 | 1 270 | 125 | 1 224 | 5 | 3 818 | ||||
WF | 4 | 27 | 32 | 2 | 70 | 9 | 144 | |||||
WS | 38 | 129 | 49 | 412 | 8 | 73 | 213 | 922 | ||||
XK | 47 | 652 | 582 | 2 511 | 1 | 261 | 1 723 | 12 | 5 789 | |||
YE | 2 401 | 5 273 | 1 276 | 36 259 | 2 | 4 006 | 5 218 | 10 | 54 445 | |||
YT | 18 | 163 | 18 | 142 | 6 | 11 | 199 | 9 | 566 | |||
YU | 1 | 1 | ||||||||||
ZA | 296 | 11 187 | 1 953 | 12 506 | 35 | 57 772 | 17 955 | 1 | 215 | 101 920 | ||
ZM | 245 | 10 183 | 338 | 12 827 | 6 | 1 576 | 3 337 | 315 | 28 827 | |||
ZW | 78 | 4 594 | 884 | 2 055 | 21 | 11 918 | 5 132 | 41 | 24 723 | |||
Totalt | 5 275 | 325 580 | 2 059 535 | 340 346 | 3 804 592 | 38 701 | 2 224 186 | 1 455 703 | 14 333 | 33 584 | 10 301 835 |
--Larske (diskussion) 9 augusti 2015 kl. 11.23 (CEST)
- Tack för en bra översikt av materialet. Värt att komma ihåg dock att drygt hälften sorteras bort som irrelevant, däribland det mesta i klass R och S. Även många byar sorteras bort, när det inte går att få fram vettiga befolkningssiffror. Lsj (diskussion) 9 augusti 2015 kl. 12.10 (CEST)
- För att hitta rätt terminologi kan det vara bra att kolla in Nordkoreas administrativa indelning och Sydkoreas administrativa indelning, där jag försökt hitta bra termer på svenska. De båda staterna liknar varandra i mycket hög grad, men Nordkorea är något enklare då man reducerat hierarkierna. Pinga gärna in mig och medlemmarna i Wikipedia:Projekt Korea för hjälp. Min koreanska är ganska rudimentär, men jag kan stava mig igenom ord med hjälp av min ordlista.--ボスニア (diskussion) 9 augusti 2015 kl. 17.38 (CEST)
Förgreningssidor med Geo-Länk?
[redigera wikitext]Kanske vore det en bra idé att förse grensidorna med {{GeoLänk}}
när du ändå lägger in coord på dem. För att det ska vara helt meningsfullt behöver coordmallarna då kompletteras med parametern 'name=' som ska sättas till artikelnamnet (inklusive särskiljning), se t.ex Bodträsket. Taxelson (diskussion) 9 augusti 2015 kl. 16.36 (CEST)
- Ja. det är lätt gjort. Boten har ju redan namnen till hands. Kategorierna som boten skapar får Geolänk-mallen redan. Lsj (diskussion) 9 augusti 2015 kl. 17.28 (CEST)
- Ok, det funkar. Lsj (diskussion) 11 augusti 2015 kl. 19.31 (CEST)
Är GeoNames pålitligt?
[redigera wikitext]Ett rimligt sätt att bedöma pålitligheten i GeoNames är att jämföra dess uppgifter i de fall vi har andra källor. Här är två sådana jämförelser. I den ena jämförs befokningssiffror från GeoNames med befolkningssiffror tagna från Wikipedia, för platser som enligt Wikidata är samma plats. I den andra jämförs höjduppgifter från GeoNames med höjduppgifter från en Digital Elevation Model (Viewfinder Panorama). Som synes är båda fördelningarna väl samlade kring noll, även om överensstämmelsen inte är perfekt. Lsj (diskussion) 10 augusti 2015 kl. 21.36 (CEST)
- Missförstå mig inte här, även om det låter kritiskt: Förstår jag det rätt att det förekommer fel som är mer än 90% fel åt endera hållen (den övre jämförelsen), även om det är enskilda förekomster? Skulle vi kunna kolla med en tredje källa om just de förekomsterna är rätt i Geonames eller Wikipedia? Och i så fall göra det maskinellt? Om jag har missförstått jämförelsen kan ni bortse från frågan. :-) //Hannibal (diskussion) 10 augusti 2015 kl. 22.48 (CEST)
- För enstaka småbyar borde det inte vara jättekonstigt. 90 % är visserligen ganska mycket, men 50 % tycker inte jag är konstigt alls (skillnaden på 200 och 400). Om det är precis 90 % kan det dessutom vara en siffra som fallit bort. --افيراتير (diskussion) 10 augusti 2015 kl. 22.56 (CEST)
- Det förekommer uppgifter som är tokfel åt båda hållen, inte bara för småbyar (jag skippar byar med <100 invånare). City of London har 7,5 miljoner invånare i GeoNames, medan boten plockar upp 7375 invånare från wiki. Misstänker att det är helt olika betydelser av "City of London" som felaktigt har kopplats ihop. Mer problematiskt är att flera av Nordirlands distrikt har bara några hundra invånare enligt vad boten plockar upp från wiki, men betydligt rimligare tiotusentals enligt GeoNames. I andra ändan av skalan hittar jag den italienska byn Tonara, där GeoNames har ca 2000 invånare, vilket stämmer med italienska wiki, medan enwp har orimliga 2.3 miljoner, vilket boten plockar upp därifrån. Därefter kommer den indiska staden Gohpur, för vilken enwp anger 1,1 miljoner, medan GeoNames har 9896. Den källa som enwp anger, Census of India, anger 9408 invånare. Nirsa i Indien har likaså ca 13000 invånare i Census of India, 14000 i GeoNames, och 1,3 miljoner på enwp. Den första jag hittar där GeoNames har klart fel är Central River Division, en av Gambias fem provinser, där Geonames anger 3584 invånare men enwp betydligt rimligare 226000. Både wiki och enwp kan alltså ha fel, men jag ser inget som tyder på att GeoNames är överlag sämre än enwp, snarare bättre. Det verkar ganska vanligt att enwp antingen tappar 2-3 nollor eller lägger till några extra nollor. Men totalt sett är överensstämmelsen god. Ungefär 96% av platserna ligger inom +/- 25%, och två tredjedelar inom 2%. Lsj (diskussion) 10 augusti 2015 kl. 23.29 (CEST)
- Tack för det. Ja, att siffror faller bort är såklart något som händer. Och som Averater skriver kan skillnaden vara obetydlig, eller som Lsj skriver, 100-tals gånger fel. Det som är helt otroligt med det här är att vi faktiskt börjar få koll på hur goda källor vi använder på stor skala. Det gillar jag mycket skarpt. Jag gissar att det också är poängen med Lsj:s första inlägg. :-) //Hannibal (diskussion) 10 augusti 2015 kl. 23.37 (CEST)
- Jag har hittat exempel på fall där man uppenbarligen har haft tillgång till folkmängdssiffror för svenska tätorter, och placerat in dem i det första bästa ställe som hetat samma sak. En by med ett par gårdar i Västernorrland fick därför nästan 400 invånare. Men dessa tillhör definitivt undantagen. -- Innocent bystander 11 augusti 2015 kl. 11.09 (CEST)
- Jag har börjat gå igenom Kategori:Robotskapade Ålandartiklar och jag har också noterat otillförlitligheten i datat från Geonames. Koordinaterna är fel på 100-200 meter i runt 25% av fallen, men ibland så mycket som över en kilometer. Höjden för högsta punkt är oftare fel än rätt (i det fallet har jag utgått från att höjddatat på Kartplatsen är rätt). Ortnamnen är ofta särskrivna och ibland felstavade (a i stället för å). Så långt inget fel på botten, utan helt och hållet indatat. Det jag skulle vilja förbättra med botten är att den inte hela tiden beskriver skärgårdsterräng som platt. Visserligen är havet väldigt platt, men jag tror inte att någon som har stiftat bekantskap med klipphällarna i den Åländska skärgården skulle hålla med om att den är särskilt platt. /ℇsquilo 27 februari 2016 kl. 15.04 (CET)
- Koordinatfelen har jag också märkt, eller snarare bristen på precision i koordinaterna. Fel upp till en km är vad det blir när koordinaterna är avrundade till hela minuter, vilket tyvärr händer ibland i Geonames -- plottar man alla koordinater i vissa regioner blir det ett rutnät. Något hundratal meter fel blir det om de avrundas till tre decimaler. Vad terrängen beträffar så tas själva havet inte med i terrängberäkningen, utan bara de pixlar som har en positiv höjd tas med. Tror problemet snarare ligger i att de tröskelvärden som boten använder för att definiera "platt" är anpassade till vad som är lagom på fastlandet, vilket kan bli konstigt på små öar. Ska se vad jag kan göra åt det. Lsj (diskussion) 27 februari 2016 kl. 15.56 (CET)
- Jag har börjat gå igenom Kategori:Robotskapade Ålandartiklar och jag har också noterat otillförlitligheten i datat från Geonames. Koordinaterna är fel på 100-200 meter i runt 25% av fallen, men ibland så mycket som över en kilometer. Höjden för högsta punkt är oftare fel än rätt (i det fallet har jag utgått från att höjddatat på Kartplatsen är rätt). Ortnamnen är ofta särskrivna och ibland felstavade (a i stället för å). Så långt inget fel på botten, utan helt och hållet indatat. Det jag skulle vilja förbättra med botten är att den inte hela tiden beskriver skärgårdsterräng som platt. Visserligen är havet väldigt platt, men jag tror inte att någon som har stiftat bekantskap med klipphällarna i den Åländska skärgården skulle hålla med om att den är särskilt platt. /ℇsquilo 27 februari 2016 kl. 15.04 (CET)
- Jag har hittat exempel på fall där man uppenbarligen har haft tillgång till folkmängdssiffror för svenska tätorter, och placerat in dem i det första bästa ställe som hetat samma sak. En by med ett par gårdar i Västernorrland fick därför nästan 400 invånare. Men dessa tillhör definitivt undantagen. -- Innocent bystander 11 augusti 2015 kl. 11.09 (CEST)
- Tack för det. Ja, att siffror faller bort är såklart något som händer. Och som Averater skriver kan skillnaden vara obetydlig, eller som Lsj skriver, 100-tals gånger fel. Det som är helt otroligt med det här är att vi faktiskt börjar få koll på hur goda källor vi använder på stor skala. Det gillar jag mycket skarpt. Jag gissar att det också är poängen med Lsj:s första inlägg. :-) //Hannibal (diskussion) 10 augusti 2015 kl. 23.37 (CEST)
- Det förekommer uppgifter som är tokfel åt båda hållen, inte bara för småbyar (jag skippar byar med <100 invånare). City of London har 7,5 miljoner invånare i GeoNames, medan boten plockar upp 7375 invånare från wiki. Misstänker att det är helt olika betydelser av "City of London" som felaktigt har kopplats ihop. Mer problematiskt är att flera av Nordirlands distrikt har bara några hundra invånare enligt vad boten plockar upp från wiki, men betydligt rimligare tiotusentals enligt GeoNames. I andra ändan av skalan hittar jag den italienska byn Tonara, där GeoNames har ca 2000 invånare, vilket stämmer med italienska wiki, medan enwp har orimliga 2.3 miljoner, vilket boten plockar upp därifrån. Därefter kommer den indiska staden Gohpur, för vilken enwp anger 1,1 miljoner, medan GeoNames har 9896. Den källa som enwp anger, Census of India, anger 9408 invånare. Nirsa i Indien har likaså ca 13000 invånare i Census of India, 14000 i GeoNames, och 1,3 miljoner på enwp. Den första jag hittar där GeoNames har klart fel är Central River Division, en av Gambias fem provinser, där Geonames anger 3584 invånare men enwp betydligt rimligare 226000. Både wiki och enwp kan alltså ha fel, men jag ser inget som tyder på att GeoNames är överlag sämre än enwp, snarare bättre. Det verkar ganska vanligt att enwp antingen tappar 2-3 nollor eller lägger till några extra nollor. Men totalt sett är överensstämmelsen god. Ungefär 96% av platserna ligger inom +/- 25%, och två tredjedelar inom 2%. Lsj (diskussion) 10 augusti 2015 kl. 23.29 (CEST)
- För enstaka småbyar borde det inte vara jättekonstigt. 90 % är visserligen ganska mycket, men 50 % tycker inte jag är konstigt alls (skillnaden på 200 och 400). Om det är precis 90 % kan det dessutom vara en siffra som fallit bort. --افيراتير (diskussion) 10 augusti 2015 kl. 22.56 (CEST)
- Sedan tycker jag i och för sig inte det är tokfel att kalla Ledskär på bilden här bredvid "platt". Lsj (diskussion) 27 februari 2016 kl. 16.18 (CET)
- Ledskär med sina dryga fem meter över havet är ganska platt, ja. Amborsö är ungefär lika sort, men reser sig 23 meter över havet och är inte alls lika platt. Ganska många öar har uppgifter för yta och/eller längd och bredd. Går det att utifrån förhållandet storlek/höjd räkna fram ett bättre gränsvärde för vilka öar som är platta? /ℇsquilo 27 februari 2016 kl. 17.01 (CET)
- En annan sak som jag kom att tänka på: Hur kommer det sig att "elevation" i faktarutan alltid är mindre än "öns högsta punkt" i texten? /ℇsquilo 27 februari 2016 kl. 17.50 (CET)
- Hmmm... ett misstag i koden. Lsjbot söker ut öns högsta punkt och anger i texten, men "elevation" i faktarutan är fortfarande höjden vid den angivna koordinatpunkten (som inte alltid är öns högsta punkt). Lsj (diskussion) 27 februari 2016 kl. 18.36 (CET)
- Hmmm... ett misstag i koden. Lsjbot söker ut öns högsta punkt och anger i texten, men "elevation" i faktarutan är fortfarande höjden vid den angivna koordinatpunkten (som inte alltid är öns högsta punkt). Lsj (diskussion) 27 februari 2016 kl. 18.36 (CET)
- En annan sak som jag kom att tänka på: Hur kommer det sig att "elevation" i faktarutan alltid är mindre än "öns högsta punkt" i texten? /ℇsquilo 27 februari 2016 kl. 17.50 (CET)
- Ledskär med sina dryga fem meter över havet är ganska platt, ja. Amborsö är ungefär lika sort, men reser sig 23 meter över havet och är inte alls lika platt. Ganska många öar har uppgifter för yta och/eller längd och bredd. Går det att utifrån förhållandet storlek/höjd räkna fram ett bättre gränsvärde för vilka öar som är platta? /ℇsquilo 27 februari 2016 kl. 17.01 (CET)
- Sedan tycker jag i och för sig inte det är tokfel att kalla Ledskär på bilden här bredvid "platt". Lsj (diskussion) 27 februari 2016 kl. 16.18 (CET)
Exempelö | |
Ö | |
Höjdläge | 1 234 m ö.h. |
---|---|
Högsta punkt | Toppentoppen |
- höjdläge | 2 345 m ö.h. |
- Kan man inte använda highest_elevation i faktaboxen för den högsta punkten? --Larske (diskussion) 27 februari 2016 kl. 18.46 (CET)
- Det där med storlek/höjd är en bra idé för öar. Ska testa det. Lsj (diskussion) 27 februari 2016 kl. 18.37 (CET)
Svenska namn och svenska dubletter
[redigera wikitext]Några ord om hur boten identifierar svenska namn på platser, och hur den identifierar befintliga artiklar på svwp om samma plats, två problem som hänger nära ihop. Jag har jobbat om det här en del sedan senaste provkörningen. GeoNames anger för varje plats dels ett primärt namn (antingen på lokalt språk (transkriberat till latin) eller på engelska), och dels ett antal alternativa namn. För de alternativa namnen anges ofta vilket språk de är på. Finns det ett alternativnamn markerat som svenskt, så använder boten i första hand det som artikelnamn. Annars tar den primärnamnet. Sedan söker den efter om det redan finns en artikel om platsen, i ett antal steg. Procedur:
- Finn svenskt namn bland alternativnamnen på GeoNames.
- Om svenskt namn saknas, och platsen ligger i ett "kyrilliskt" land, transkribera det lokala namnet med svensk transkribering, och använd som svenskt namn.
- Om varken 1 eller 2 ger någonting, använd primärnamnet från GeoNames.
- Sök på svwp efter artikel med samma namn. Finns det en sådan, kolla om den innehåller en mall med latitud/longitud. Stämmer positionen med GeoNames (inom några km)?
- Försök identifiera en matchande post på Wikidata. Har den interwiki tillbaka till svenska?
- Gå igenom en lista med alla 200 000+ koordinatsatta artiklar på svwp. Kolla alla som ligger inom några km från GeoNames-platsen. Ta bort eventuella särskiljningsled från deras namn. Matchar namnet nu?
- Använd "fuzzy matching" (namnjämförelse som tillåter några bokstävers skillnad) för att hitta artiklar om platser med ungefär rätt namn, fortfarande med en position som också är ungefär rätt. Detta fångar upp olika stavning/transkribering av namn, men samtidigt finns en risk att få falska positiva. En algoritm som kan koppla ihop Prag och Prague, vilket vi vill, kommer också att koppla ihop Hosjö och Hosjön, vilket vi inte vill.
- För platstypen ADM1 (län, provinser etc.), som är extra viktig eftersom varje ADM1-namn dyker upp i snitt i kanske 1000 andra artiklar och otaliga särskiljningsled, gör dessutom följande:
- Gör fuzzy matching mot alla artiklar i landets underkategori till Kategori:Regionala politiska indelningar.
- Gör fuzzy matching mot alla artiklar i landets underkategori till Kategori:Regionala politiska indelningar en gång till, med grövre tolerans, men handkolla alla resultaten.
- Ta de sista återstående ADM1-platserna (ca 2000) och gå igenom dem för hand. Resultatet av det är att svwp saknar artiklar om ungefär 1000 av världens provinser.
Totalt fångar den här proceduren upp ungefär 100 000 GeoNames-platser som redan har en artikel på svwp. Dessa skapas det förstås inga artiklar om, och den befintliga artikeln länkas till från grensidor och andra relevanta artiklar. Proceduren missar två sorters artiklar:
- De vars svenska namn skiljer sig så mycket från GeoNames-namnet att boten inte kan se kopplingen ens med fuzzy matching.
- De som saknar latitud/longitud i artikeln.
Lsj (diskussion) 13 augusti 2015 kl. 17.29 (CEST)
- Just regioner har ju en tendens att vara ganska mycket olika stora, varför det finns stort utrymme att placera koordinater på olika platser, utan att det är två olika enheter. Jag vill minnas att jag stötte på detta när du presenterade "avvikelser" mellan Geonames och Wikidata. Argentina och Antarktis var två exempel där som inte alls var några fel. -- Innocent bystander 13 augusti 2015 kl. 17.58 (CEST)
- Har inte gjort något systematiskt, men har sett att av de artiklar om städer i Tyskland och administrativa storheter i Nederländerna, så saknas ofta koordinater. Borde kanske alltså kolla koordinater i iw-länkade artiklar, när sådana finns. En annan sak, som borde rättas till i vilket fall som helst är den besynnerliga och svåravlästa koordinatparametern i
{{Kommun Finland}}
. Har vi fler sådana olämpliga mallar? De svenska kommunerna hämtar koordinaterna på något magiskt sätt (WD), vilket kanske är mindre problematiskt i detta sammanhang av flera skäl. På svenskt samiskt område har vi problem med namnen på sjöarna - om geonames har modern stavning - eller ännu omodernare - så kan det bli problem. Taxelson (diskussion) 13 augusti 2015 kl. 18.15 (CEST)- Ja, regioner (och även floder och liknande) är svårt att få rätt koordinater på.
{{Kommun Finland}}
ska boten klara av, den läser ett ganska brett sortiment av koordinatparametrar. Lsj (diskussion) 13 augusti 2015 kl. 18.28 (CEST)- Det fanns en äldre variant av Coord-mallen, jag hittar den inte nu, som byggde koordinaterna ganska annorlunda mot dagens. Den fanns ganska väl spridd i Tyskland vill jag minnas. Jag hade själv periodiska arbeten med att få bort den, och kanske har jag fått hjälp, såpass att den nu helt är utrangerad. -- Innocent bystander 13 augusti 2015 kl. 20.40 (CEST)
- Ja, regioner (och även floder och liknande) är svårt att få rätt koordinater på.
- Har inte gjort något systematiskt, men har sett att av de artiklar om städer i Tyskland och administrativa storheter i Nederländerna, så saknas ofta koordinater. Borde kanske alltså kolla koordinater i iw-länkade artiklar, när sådana finns. En annan sak, som borde rättas till i vilket fall som helst är den besynnerliga och svåravlästa koordinatparametern i
Ny provserie Bahrain
[redigera wikitext]Lade ut en ny provserie igår kväll med grensidor och artiklar om Bahrain. Har redan hittat några småbuggar i terränghanteringen. Det blev fel när terräng saknas, felformulerat vid vikar ("En vik av österut..."), och fel vid negativa höjder (platser under havsnivån blev "mycket bergiga"). Det blev också fel genus på guvernment. Har någon sett andra fel i den serien? Lsj (diskussion) 14 augusti 2015 kl. 14.01 (CEST)
- I Ḩayr Shutayā ligger pricken utanför kartan.
- "Trakten är glest befolkad. Det finns inga andra samhällen i närheten" är en intressant mening om ett grund . -- Innocent bystander 14 augusti 2015 kl. 14.43 (CEST)
- category = Sjö om ett grund är också lite udda. -- Innocent bystander 14 augusti 2015 kl. 14.45 (CEST)
- Och nära till havet... -- Innocent bystander 14 augusti 2015 kl. 14.45 (CEST)
- Tror hela terrängavsnittet kan strykas för saker i havet. Annars är det väl helt riktigt att trakten är glest befolkad och nära till havet :) Vad kartan beträffar så täcker positionskartan för Bahrain inte hela Bahrains territorialvatten. Det enda som går att göra åt det är väl att fixa en större karta. Lsj (diskussion) 14 augusti 2015 kl. 15.06 (CEST)
- Southern Governorate borde heta Södra guvernementet (Bahrain), enligt Bahrains guvernement.--ボスニア (diskussion) 14 augusti 2015 kl. 19.28 (CEST)
- Jag observerade också användandet av engelska namn för just t.ex. Bahrains guvernement. Men det kan ju fixas manuellt, i allmänhet verkade det riktigt bra (även om jag inte vet mycket om botar och sådant). K9re11 (diskussion) 14 augusti 2015 kl. 19.44 (CEST)
- Språkbruket är mycket vacklande. Vedertaget på svenska med South Australia snarare än Sydaustralien, och Niederösterreich snarare än Nedre Österrike. Och när vi diskuterade Antigua och Barbuda härovan blev ju konsensus att återgå till den engelska benämningen Parish istället för den översättning till Församling som jag tidigare hade. Jag har därför lagt in svenska namn bara när artiklar faktiskt finns (eller GeoNames ger ett svenskt namn), inte hittat på översättningar själv, och inte tagit från listor med rödlänkar. Hur mycket ska vi översätta? Här är en lista med alla de ADM1 som saknar svensk artikel: Användare:Lsjbot/Saknade ADM1. Vilka av dem ska vi översätta, och till vad?
- Jag tycker personligen att man ska använda svenska namn där det finns, men det är ju något man kan rätta till i efterhand beroende på land och konsensus.--ボスニア (diskussion) 15 augusti 2015 kl. 16.17 (CEST)
- Det är den principen jag har försökt följa, lägga in svenska namn där de finns, men inte där de inte finns. Det man kan tänka sig därutöver är trivialöversättningar, som Southern Governorate till Södra guvernementet -- bör vi översätta sådant? Enstaka platsnamn är enkelt att rätta till i efterhand, ja -- men just namn på ADM1-enheter (provinser, guvernement, etc) dyker upp på så många ställen, ffa i särskiljningsled och därmed också i grensidor, där det är jobbigt att rätta till i efterhand, att det är bra om vi når konsensus innan. Lsj (diskussion) 15 augusti 2015 kl. 16.49 (CEST)
- Det finns ingen entydig konsensus för denna typ av namngivning. Själv är jag skeptisk alternativ motståndare till att översätta. Jag tycker det är att likställa med "egen forskning".Yger (diskussion) 15 augusti 2015 kl. 17.32 (CEST)
- Jag tror inte vi ska han en så strikt syn på översättningar att det betraktas som egen forskning, det skulle hämma produktiviteten. Traduttore, traditore!--ボスニア (diskussion) 15 augusti 2015 kl. 17.42 (CEST)
- Inte helt lätt att nå konsensus här. Vi har allt från en användare som kallar det "#språkfel" att ha oöversatta benämningar, till en som kallar det egen forskning att översätta. Jag har ett kompromissförslag: Använd den procedur som är beskriven ovan (#Svenska namn och svenska dubletter), och handöversätt dessutom namn på ADM1 om och endast om Geonames ger en benämning på engelska och engelska inte är ett lokalt gångbart språk, och översättningen är uppenbar. Det skulle innebära att Bahrains guvernement översätts, men inte t.ex. Jamaicas motsvarigheter. Benämningar som i GeoNames är på andra lokalt gångbara språk handöversätts inte, liksom inte heller namn på allt utom ADM1. Låter det någorlunda acceptabelt för alla parter? Lsj (diskussion) 15 augusti 2015 kl. 18.59 (CEST)
- OK.Yger (diskussion) 15 augusti 2015 kl. 19.02 (CEST)
- Jag vill förtydliga att jag inte tycker att vi bör hitta på namn åt ställen utan svenskt namn, utan att det jag reagerade på vad att ett engelskt namn används för ett ställe på Bahrain. Arabiska är enda officiellt språk i Bahrain, så jag tycker att en lämplig translitterering av المحافظة الجنوبية eller ett svenskt namn bör användas, men inte engelskt. K9re11 (diskussion) 15 augusti 2015 kl. 19.57 (CEST)
- Ok, det låter förenligt med mitt förslag ovan. Lsj (diskussion) 15 augusti 2015 kl. 21.16 (CEST)
- Låter bra, men jag hjälper gärna till med översättningar om det skulle behövas. Jag har betyg i arabiska och kan lätt slå upp ord och begrepp.--ボスニア (diskussion) 15 augusti 2015 kl. 22.09 (CEST)
- Här är mina förslag till översättningar: Användare:Lsjbot/Översättningsförslag. Jag har inte försökt göra något originellt. I vissa fall när andra ADM1 i samma land redan har namn på svwp har jag gjort de nya namnen kongruenta med dessa. Övriga namn i Användare:Lsjbot/Saknade ADM1 tycker jag inte behöver översättas, eftersom de är på ett lokalt gångbart språk. Lsj (diskussion) 15 augusti 2015 kl. 22.46 (CEST)
- Låter bra, men jag hjälper gärna till med översättningar om det skulle behövas. Jag har betyg i arabiska och kan lätt slå upp ord och begrepp.--ボスニア (diskussion) 15 augusti 2015 kl. 22.09 (CEST)
- Ok, det låter förenligt med mitt förslag ovan. Lsj (diskussion) 15 augusti 2015 kl. 21.16 (CEST)
- Jag vill förtydliga att jag inte tycker att vi bör hitta på namn åt ställen utan svenskt namn, utan att det jag reagerade på vad att ett engelskt namn används för ett ställe på Bahrain. Arabiska är enda officiellt språk i Bahrain, så jag tycker att en lämplig translitterering av المحافظة الجنوبية eller ett svenskt namn bör användas, men inte engelskt. K9re11 (diskussion) 15 augusti 2015 kl. 19.57 (CEST)
- OK.Yger (diskussion) 15 augusti 2015 kl. 19.02 (CEST)
- Inte helt lätt att nå konsensus här. Vi har allt från en användare som kallar det "#språkfel" att ha oöversatta benämningar, till en som kallar det egen forskning att översätta. Jag har ett kompromissförslag: Använd den procedur som är beskriven ovan (#Svenska namn och svenska dubletter), och handöversätt dessutom namn på ADM1 om och endast om Geonames ger en benämning på engelska och engelska inte är ett lokalt gångbart språk, och översättningen är uppenbar. Det skulle innebära att Bahrains guvernement översätts, men inte t.ex. Jamaicas motsvarigheter. Benämningar som i GeoNames är på andra lokalt gångbara språk handöversätts inte, liksom inte heller namn på allt utom ADM1. Låter det någorlunda acceptabelt för alla parter? Lsj (diskussion) 15 augusti 2015 kl. 18.59 (CEST)
- Jag tror inte vi ska han en så strikt syn på översättningar att det betraktas som egen forskning, det skulle hämma produktiviteten. Traduttore, traditore!--ボスニア (diskussion) 15 augusti 2015 kl. 17.42 (CEST)
- Det finns ingen entydig konsensus för denna typ av namngivning. Själv är jag skeptisk alternativ motståndare till att översätta. Jag tycker det är att likställa med "egen forskning".Yger (diskussion) 15 augusti 2015 kl. 17.32 (CEST)
- Det är den principen jag har försökt följa, lägga in svenska namn där de finns, men inte där de inte finns. Det man kan tänka sig därutöver är trivialöversättningar, som Southern Governorate till Södra guvernementet -- bör vi översätta sådant? Enstaka platsnamn är enkelt att rätta till i efterhand, ja -- men just namn på ADM1-enheter (provinser, guvernement, etc) dyker upp på så många ställen, ffa i särskiljningsled och därmed också i grensidor, där det är jobbigt att rätta till i efterhand, att det är bra om vi når konsensus innan. Lsj (diskussion) 15 augusti 2015 kl. 16.49 (CEST)
- Jag tycker personligen att man ska använda svenska namn där det finns, men det är ju något man kan rätta till i efterhand beroende på land och konsensus.--ボスニア (diskussion) 15 augusti 2015 kl. 16.17 (CEST)
- Språkbruket är mycket vacklande. Vedertaget på svenska med South Australia snarare än Sydaustralien, och Niederösterreich snarare än Nedre Österrike. Och när vi diskuterade Antigua och Barbuda härovan blev ju konsensus att återgå till den engelska benämningen Parish istället för den översättning till Församling som jag tidigare hade. Jag har därför lagt in svenska namn bara när artiklar faktiskt finns (eller GeoNames ger ett svenskt namn), inte hittat på översättningar själv, och inte tagit från listor med rödlänkar. Hur mycket ska vi översätta? Här är en lista med alla de ADM1 som saknar svensk artikel: Användare:Lsjbot/Saknade ADM1. Vilka av dem ska vi översätta, och till vad?
- Jag observerade också användandet av engelska namn för just t.ex. Bahrains guvernement. Men det kan ju fixas manuellt, i allmänhet verkade det riktigt bra (även om jag inte vet mycket om botar och sådant). K9re11 (diskussion) 14 augusti 2015 kl. 19.44 (CEST)
- Southern Governorate borde heta Södra guvernementet (Bahrain), enligt Bahrains guvernement.--ボスニア (diskussion) 14 augusti 2015 kl. 19.28 (CEST)
- Tror hela terrängavsnittet kan strykas för saker i havet. Annars är det väl helt riktigt att trakten är glest befolkad och nära till havet :) Vad kartan beträffar så täcker positionskartan för Bahrain inte hela Bahrains territorialvatten. Det enda som går att göra åt det är väl att fixa en större karta. Lsj (diskussion) 14 augusti 2015 kl. 15.06 (CEST)
- Och nära till havet... -- Innocent bystander 14 augusti 2015 kl. 14.45 (CEST)
- category = Sjö om ett grund är också lite udda. -- Innocent bystander 14 augusti 2015 kl. 14.45 (CEST)
I många länder är andraspråket relativt dominerande varför det inte alls är konstigt att ha namn på engelska (eller franska eller något annat) i länder där det inte är officiellt språk. Jag tänker till exempel på Kambodja som tidigare var fransk koloni men nu har mycket engelskspråkig turism och där många ställen därför har namn på engelska och franska. Så jag tycker vi ska vara försiktiga med egna transkriberingar eftersom andra namn kan i praktiken ha nästan officiell status. Hur det är i just Bahrain vet jag inte men tänker att det skulle kunna vara liknande där. --افيراتير (diskussion) 16 augusti 2015 kl. 10.12 (CEST)
- Fast hur namn "i praktiken har nästan..." är delikat att avgöra, och knappast något en bot kan åstadkomma. Translitterering är nog inget man behöver vara försiktig med, då det är en i princip alltid reversibel process, som bara handlar om överföring till ett annat alfabet (medan transkribering ofta innebär en förenkling/förvanskning av något slag). Taxelson (diskussion) 16 augusti 2015 kl. 10.27 (CEST)
- Jag är medveten om att det är ganska vagt och inget boten kan göra automatiskt. Men för vissa länder är det inte så konstigt om man använder till exempel engelska termer i namn. Finns det möjlighet att låta det vara olika i olika länder eller blir det också för svårt? --افيراتير (diskussion) 16 augusti 2015 kl. 10.34 (CEST)
- Om man håller sig till ADM1 så är de tillräckligt få för att namnge för hand, vilket är vad jag föreslår ovan. För andra platser är bekymret mindre, de är mer sällan översatta i GeoNames och det är enklare att handflytta i efterhand om det blir fel för enstaka platser. Lsj (diskussion) 16 augusti 2015 kl. 11.50 (CEST)
- Då är jag med. Det låter bra. --افيراتير (diskussion) 16 augusti 2015 kl. 11.58 (CEST)
- Om man håller sig till ADM1 så är de tillräckligt få för att namnge för hand, vilket är vad jag föreslår ovan. För andra platser är bekymret mindre, de är mer sällan översatta i GeoNames och det är enklare att handflytta i efterhand om det blir fel för enstaka platser. Lsj (diskussion) 16 augusti 2015 kl. 11.50 (CEST)
- Jag är medveten om att det är ganska vagt och inget boten kan göra automatiskt. Men för vissa länder är det inte så konstigt om man använder till exempel engelska termer i namn. Finns det möjlighet att låta det vara olika i olika länder eller blir det också för svårt? --افيراتير (diskussion) 16 augusti 2015 kl. 10.34 (CEST)
Åland (igen)
[redigera wikitext]Åland ser märklig ut här! -- Innocent bystander 15 augusti 2015 kl. 19.18 (CEST)
- Ett litet fel: Yemen borde säkert vara Jemen. K9re11 (diskussion) 15 augusti 2015 kl. 19.58 (CEST)
- Ok, tack. Lsj (diskussion) 15 augusti 2015 kl. 21.15 (CEST)
En liten anmärkning: Lsjbot brukar skriva [[Antigua (ö)|Antigua]], men det räcker med att skriva Antigua. K9re11 (diskussion) 17 augusti 2015 kl. 18.21 (CEST)
Och Further-eastern European Time borde säkert vara Ytterligare östeuropeisk tid. K9re11 (diskussion) 17 augusti 2015 kl. 20.00 (CEST)
- Tidszonerna har jag inte översatt. Vet inte om de ens har vedertagna svenska namn. I Kategori:Tidszoner blandas det friskt mellan svenska och engelska. Den dag någon skriver artiklar om dem så löser det sig nog. "Ännu östligare europeisk tid" borde det väl annars vara. Lsj (diskussion) 17 augusti 2015 kl. 20.18 (CEST)
Homs
[redigera wikitext]På sidan Al Maqţa‘ används Homs Governorate, engelska sidan med det namnet är länkad med Homs (provins) (om detta är fel ställe att anmäla allehanda fel, säg gärna). K9re11 (diskussion) 20 augusti 2015 kl. 19.02 (CEST)
- Helt rätt sida att anmäla fel, även om en egen rubrik kan vara bra för ett "nytt" fel. Lsj (diskussion) 21 augusti 2015 kl. 17.30 (CEST)
- Ok, har hittat buggen. En annan ändring i koden fick boten att "tappa bort" vissa namn som hade översatts. Lsj (diskussion) 21 augusti 2015 kl. 17.42 (CEST)
- Ser rätt ut nu i en ny körning. Lsj (diskussion) 21 augusti 2015 kl. 21.01 (CEST)
- Ok, har hittat buggen. En annan ändring i koden fick boten att "tappa bort" vissa namn som hade översatts. Lsj (diskussion) 21 augusti 2015 kl. 17.42 (CEST)
Kolla om en plats ligger i havet
[redigera wikitext](hitflyttat från Användardiskussion:Lsjbot/Projekt alla arter)
Meningar som Terrängen runt XXX är mycket bergig
, och trakten är tätbefolkad
, blir lite tokiga för platser som ligger till havs. Kanske värt att låta boten kolla om en namngiven plats innanför kustlinjen eller inte? Case: Outer_Anchorage (rev. 30355288) Rotsee (diskussion) 17 augusti 2015 kl. 10.53 (CEST)
- Jo, det har du helt rätt i. Tar bort hela det terrängavsnittet för platser till havs. Lsj (diskussion) 17 augusti 2015 kl. 11.04 (CEST)
Finland
[redigera wikitext]Det finns en del korta artiklar om Finland skapade av MoRsE som sedan gjorts till omdirigeringar (se t.ex. [11]). Vissa av dessa kanske är artiklar som Lsjbot skulle skapa, men min fråga är: kommer Lsjbot att skippa dessa eftersom det redan finns en sida (om än bara omdirigering)? Eller borde dessa omdirigeringar raderas? K9re11 (diskussion) 18 augusti 2015 kl. 12.02 (CEST)
- Lsjbot vet inget om dessa omdirigeringar, så det kommer att skapas dubletter till dem, med (kanske onödiga) särskiljningsled. De kan flyttas/sammanfogas senare, så det är ingen panik. -- Innocent bystander 18 augusti 2015 kl. 12.14 (CEST)
- Nja... Lsjbot letar efter befintliga artiklar innan den skapar, och följer därvid omdirigeringar. Om boten vill skapa en artikel om platsen X, och namnet X på wiki är en omdirigering till en artikel Y, så kollar boten om artikel Y innehåller koordinater som är samma som platsen X (inom några km). I så fall antar den att Y är en befintlig artikel om X, och avstår från skapande (och andra botskapade artiklar som ska länka till X får en länk till Y). Annars skapar den en artikel om X med särskiljningsled. Lsj (diskussion) 18 augusti 2015 kl. 12.55 (CEST)
- Mja, nu är Bengtsmora omdirigerad till orten Karis, dvs något lite annorlunda. Jag vet inte hur långtifrån tätorten Karis byn Bengtsmora ligger, men det borde vanligtvis inte indikera någon krock när Lsjbot letar och som jag förstått arbetsgången, så borde en artikel i dessa fall skapas. Om omdirigeringarna däremot är från svenska namnet eller en alternativ stavning av Karis, så har jag uppfattat det som du säger. -- Innocent bystander 18 augusti 2015 kl. 13.06 (CEST)
- Så de ställen som omdirigeras och som ligger nära Karis kommer då inte få en artikel men de som ligger längre ifrån får det? --افيراتير (diskussion) 18 augusti 2015 kl. 13.11 (CEST)
- Ja, precis som du Averater beskriver det. Boten försöker inte tolka omdirigeringars namnlikhet, utan utgår från att omdirigeringen är en legitim synonym. Det ställer till det lite när omdirigeringar inte är synonymer, vilket egentligen inte borde förekomma. Lsj (diskussion) 18 augusti 2015 kl. 13.33 (CEST)
- Så borde dessa omdirigeringar raderas för att Lsjbot sedan skulle skapa artiklar om dem? Jag har dessutom sett en del andra artiklar som sedan gjorts till omdirigeringar (vilket jag inte tycker är bra, för då finns det ingen artikel om ämnet, men eventuella länkar lyser inte röda, så man märker nödvändigtvis inte behovet av artiklar). Om dessa omdirigeringar utgör ett hinder för skapande av artiklar, kunde jag nog radera en del av dem, men jag vill först höra andras åsikt om det. K9re11 (diskussion) 18 augusti 2015 kl. 17.02 (CEST)
- Inte säkert GeoNames har tillräckliga uppgifter om varje by för en vettig artikel. Boten hoppar över alla byar som saknar en befolkningssiffra, liksom alla som har under 100 invånare. Lsj (diskussion) 18 augusti 2015 kl. 17.06 (CEST)
- Många av de omdirigerade Finlandsstubbarna handlar om platser vars motsvarigheter i Sverige nu börjar få artiklar (t.ex. sjöarna). Det är alltså inte självklart att de inte skall få artiklar – om boten har något vettigt att skriva om dem. Att en plats ligger nära kommuncentrum borde inte vara en orsak att låta bli att skriva. Jag tror vi borde titta litet närmare på hurudana artiklar det handlar om. För Finland kan man säkert tänka sig en del handarbete (jfr utvidgade insektartiklar och informationen om fåglarnas utbredningsområde). LPfi (diskussion) 18 augusti 2015 kl. 18.40 (CEST)
- Sjöar av någorlunda storlek (någon km) kan boten skriva en hel del vettigt om. Det bör vi försöka ordna. Byar/förorter är värre. Lsj (diskussion) 18 augusti 2015 kl. 18.49 (CEST)
- Är det inte så att dessa finlandsstubbar vanligen är omdirigerade till respektive kommun/stadsartikel? Skulle det då kanske går att se om målsidan för omdirigeringen är ett namn som i Geonames nämns som administrativt centrum, och om så är fallet köra över omdirigeringen med botartikel eller -grensida? Taxelson (diskussion) 18 augusti 2015 kl. 19.22 (CEST)
- Väldigt svårt att göra pålitligt och generellt. Dessutom har svwp alldeles för många artiklar som både handlar om en administrativt område och dess administrativa centrum. Jag är öht mycket tveksam till att låta boten någonsin köra över något människoskapat. Varje misstag skulle ge botmotståndare alldeles för mycket vatten på sina kvarnar. Lsj (diskussion) 18 augusti 2015 kl. 19.47 (CEST)
- Att köra över en omdirigering är väl inte särskilt kontroversiellt, om man lägger in en topplänk motsvarande omdirigeringen (någon specifik text kan boten knappast konstruera, men något à la "se även" torde räcka). Administrativt centrum är inte vattentätt, då många omdirigerar till det som då (eller i tiderna) var socken, kommun eller administrativt centrum, t.ex. Karis och inte Raseborg, vilket i de flesta fall är helt rätt. Just för Finland kan jag tänka mig ett arbetssätt där boten gör sitt bästa och människor kollar att det blir rätt. Det kanske är bäst att göra i form av listor på en arbetssida, där boten lägger in tillräcklig information för att man i de flesta fall (åtminstoen om man har viss lokalkännedom) inte behöver klicka sig till själva artiklarna för att kunna säga ja/nej/kanske. När listorna legat tillräckligt länge kan boten kolla dem och skapa de artiklar som verkat OK. --LPfi (diskussion) 18 augusti 2015 kl. 22.36 (CEST)
- Väldigt svårt att göra pålitligt och generellt. Dessutom har svwp alldeles för många artiklar som både handlar om en administrativt område och dess administrativa centrum. Jag är öht mycket tveksam till att låta boten någonsin köra över något människoskapat. Varje misstag skulle ge botmotståndare alldeles för mycket vatten på sina kvarnar. Lsj (diskussion) 18 augusti 2015 kl. 19.47 (CEST)
- Är det inte så att dessa finlandsstubbar vanligen är omdirigerade till respektive kommun/stadsartikel? Skulle det då kanske går att se om målsidan för omdirigeringen är ett namn som i Geonames nämns som administrativt centrum, och om så är fallet köra över omdirigeringen med botartikel eller -grensida? Taxelson (diskussion) 18 augusti 2015 kl. 19.22 (CEST)
- Sjöar av någorlunda storlek (någon km) kan boten skriva en hel del vettigt om. Det bör vi försöka ordna. Byar/förorter är värre. Lsj (diskussion) 18 augusti 2015 kl. 18.49 (CEST)
- Många av de omdirigerade Finlandsstubbarna handlar om platser vars motsvarigheter i Sverige nu börjar få artiklar (t.ex. sjöarna). Det är alltså inte självklart att de inte skall få artiklar – om boten har något vettigt att skriva om dem. Att en plats ligger nära kommuncentrum borde inte vara en orsak att låta bli att skriva. Jag tror vi borde titta litet närmare på hurudana artiklar det handlar om. För Finland kan man säkert tänka sig en del handarbete (jfr utvidgade insektartiklar och informationen om fåglarnas utbredningsområde). LPfi (diskussion) 18 augusti 2015 kl. 18.40 (CEST)
- Inte säkert GeoNames har tillräckliga uppgifter om varje by för en vettig artikel. Boten hoppar över alla byar som saknar en befolkningssiffra, liksom alla som har under 100 invånare. Lsj (diskussion) 18 augusti 2015 kl. 17.06 (CEST)
- Så borde dessa omdirigeringar raderas för att Lsjbot sedan skulle skapa artiklar om dem? Jag har dessutom sett en del andra artiklar som sedan gjorts till omdirigeringar (vilket jag inte tycker är bra, för då finns det ingen artikel om ämnet, men eventuella länkar lyser inte röda, så man märker nödvändigtvis inte behovet av artiklar). Om dessa omdirigeringar utgör ett hinder för skapande av artiklar, kunde jag nog radera en del av dem, men jag vill först höra andras åsikt om det. K9re11 (diskussion) 18 augusti 2015 kl. 17.02 (CEST)
- Ja, precis som du Averater beskriver det. Boten försöker inte tolka omdirigeringars namnlikhet, utan utgår från att omdirigeringen är en legitim synonym. Det ställer till det lite när omdirigeringar inte är synonymer, vilket egentligen inte borde förekomma. Lsj (diskussion) 18 augusti 2015 kl. 13.33 (CEST)
- Så de ställen som omdirigeras och som ligger nära Karis kommer då inte få en artikel men de som ligger längre ifrån får det? --افيراتير (diskussion) 18 augusti 2015 kl. 13.11 (CEST)
- Mja, nu är Bengtsmora omdirigerad till orten Karis, dvs något lite annorlunda. Jag vet inte hur långtifrån tätorten Karis byn Bengtsmora ligger, men det borde vanligtvis inte indikera någon krock när Lsjbot letar och som jag förstått arbetsgången, så borde en artikel i dessa fall skapas. Om omdirigeringarna däremot är från svenska namnet eller en alternativ stavning av Karis, så har jag uppfattat det som du säger. -- Innocent bystander 18 augusti 2015 kl. 13.06 (CEST)
- Nja... Lsjbot letar efter befintliga artiklar innan den skapar, och följer därvid omdirigeringar. Om boten vill skapa en artikel om platsen X, och namnet X på wiki är en omdirigering till en artikel Y, så kollar boten om artikel Y innehåller koordinater som är samma som platsen X (inom några km). I så fall antar den att Y är en befintlig artikel om X, och avstår från skapande (och andra botskapade artiklar som ska länka till X får en länk till Y). Annars skapar den en artikel om X med särskiljningsled. Lsj (diskussion) 18 augusti 2015 kl. 12.55 (CEST)
Бутан
[redigera wikitext]Бутан är väl bara den kyrilliska stavningen av Bhutan. Men kartan i artikeln visar en punkt i Bhutan där Бутан ska ligga. --Ettrig (diskussion) 18 augusti 2015 kl. 17.41 (CEST)
- Бутан kommer med som grensida eftersom det är det inhemska namnet på det bulgariska distriktet. Då får vi andra platser som har Бутан som alternativnamn "på köpet". Punkten på kartan visar landet Bhutans koordinatposition, vilket naturligt nog är någonstans mitt i landet, även om det ser lite lustigt ut. Buggen som åstadkom Butan () har jag sett och håller på att fixa.
- Jag var kanske otydlig. Bildtexten (karttexten) lyder Бутан i Bhutan. Så säger man inte om man menar att Бутан är hela Bhutan. Så den mest rimliga tolkningen av det som står är att Бутан är pricken. Detta är i motsättning till definitionen i själva artikeltexten. Så till slut listar nog läsaren ut vad som menas. Men det är bättre om alla delar av texten korrekt beskriver hur det är. --Ettrig (diskussion) 19 augusti 2015 kl. 09.09 (CEST)
- Kartorna är nog gjorda för vad än Бутан än skulle kunnat avse. Det hade kunnat finnas flera Бутан i Bhutan, men nu känner vi till bara ett fall. I just detta specialfall hade en karta över hela Centralasien varit bättre, men det är nog inte så lite småsvårt att anpassa sig efter alla dylika specialfall. -- Innocent bystander 19 augusti 2015 kl. 12.49 (CEST)
- Det här specialfallet "land i land" går att hantera -- världskarta är väl det enklaste. Men det krånglar till koden snabbt om det är flera specialfall som ska hanteras. Lsj (diskussion) 19 augusti 2015 kl. 15.13 (CEST)
- Menar ni att automatgenererade artiklar är undantagna från normala kvalitetskrav? Det tycker inte jag. Menar ni att koden "tror" att Бутан är en äkta delmängd av (mindre än) Bhutan. I så fall är artikeln "avsiktligt" vilseledande. --Ettrig (diskussion) 19 augusti 2015 kl. 16.40 (CEST)
- Nej, men all typ av botkörning har den egenskapen att en liten procentandel av redigeringarna genererar långt mer än hälften av arbetet bakom. Det kommer alltid att dyka upp saker som man inte förutsett. Någonstans måste man därför anse koden vara fähig nog, eftersom kostnaden till slut inte motiverar marginalnyttan. Vanliga användare genererar långt mycket mer kvalitetsbrister än en robot, men mängden gör förstås att det ändå kan bli ett betydande problem. -- Innocent bystander 19 augusti 2015 kl. 17.08 (CEST)
- Menar ni att automatgenererade artiklar är undantagna från normala kvalitetskrav? Det tycker inte jag. Menar ni att koden "tror" att Бутан är en äkta delmängd av (mindre än) Bhutan. I så fall är artikeln "avsiktligt" vilseledande. --Ettrig (diskussion) 19 augusti 2015 kl. 16.40 (CEST)
- Det här specialfallet "land i land" går att hantera -- världskarta är väl det enklaste. Men det krånglar till koden snabbt om det är flera specialfall som ska hanteras. Lsj (diskussion) 19 augusti 2015 kl. 15.13 (CEST)
- Kartorna är nog gjorda för vad än Бутан än skulle kunnat avse. Det hade kunnat finnas flera Бутан i Bhutan, men nu känner vi till bara ett fall. I just detta specialfall hade en karta över hela Centralasien varit bättre, men det är nog inte så lite småsvårt att anpassa sig efter alla dylika specialfall. -- Innocent bystander 19 augusti 2015 kl. 12.49 (CEST)
- Jag var kanske otydlig. Bildtexten (karttexten) lyder Бутан i Bhutan. Så säger man inte om man menar att Бутан är hela Bhutan. Så den mest rimliga tolkningen av det som står är att Бутан är pricken. Detta är i motsättning till definitionen i själva artikeltexten. Så till slut listar nog läsaren ut vad som menas. Men det är bättre om alla delar av texten korrekt beskriver hur det är. --Ettrig (diskussion) 19 augusti 2015 kl. 09.09 (CEST)
- Kyrilliska är inte officiellt språk i Bhutan (däremot ett erkänt språk). Varför behövs en hänvisning till Bhutan på det uppslaget? Бутан är kanske det kyrilliska namnet på Bhutan, men om nu omdirigeringar skulle massskapas så var det väl officiella språk det skulle gälla, inte alla världens språk. Dessutom finns Botan (olika betydelser), där "Botan" verkar vara namnet på Bhutan på frankoprovensalska enligt wikilänkar, inte heller det är ett officiellt språk i landet ifråga. Jag tycker detta är för långsökt för att motivera en förgreningssida som pekar på Botan som kunnande avse Bhutan, när det är ett svenskspråkigt uppslagsverk vi arbetar med. Det blir missvisande anser jag, för det är som att säga att "Botan" i svenska språket kan syfta på Bhutan, vilket det inte gör. En användning av Botan är som ett smeknamn för Botaniska trädgården, men annars är det väl som en antydning om att det rör något med växter som det används i svenskan, botan-, som i botanik, botanisk, m.m. Höstblomma (diskussion) 19 augusti 2015 kl. 08.39 (CEST)
- Ja, du har en poäng där, Höstblomma, det blev för mycket alternativnamn här. Ska se över algoritmen som väljer ut namnformer en gång till. Och sedan får några hundra grensidor raderas och återskapas en gång till :) Lsj (diskussion) 19 augusti 2015 kl. 15.07 (CEST)
- Jag har hittat problemet med Бутан och Botan. GeoNames har en flagga som markerar att ett namn för en plats är officiellt (typ "Konungariket Sverige"). Dessa namn tog boten självklart med som alternativnamn. Problemet är att för just landet Bhutan är det massor med namn på olika språk som är markerade som officiella, inklusive Бутан och Botan. Får ta och sortera bort dessa på lämpligt sätt. Lsj (diskussion) 19 augusti 2015 kl. 16.42 (CEST)
- WD har lite av samma problem ibland, se d:Q20#P1448 tex. -- Innocent bystander 21 augusti 2015 kl. 07.51 (CEST)
- Jag har hittat problemet med Бутан och Botan. GeoNames har en flagga som markerar att ett namn för en plats är officiellt (typ "Konungariket Sverige"). Dessa namn tog boten självklart med som alternativnamn. Problemet är att för just landet Bhutan är det massor med namn på olika språk som är markerade som officiella, inklusive Бутан och Botan. Får ta och sortera bort dessa på lämpligt sätt. Lsj (diskussion) 19 augusti 2015 kl. 16.42 (CEST)
Tror problemen med både Бутан och den konstiga kartpricken ska vara lösta nu -- se Butan (olika betydelser), och det faktum att Бутан är en rödlänk. "Botan" klassas fortfarande som ett giltigt alternativnamn, tror Botan ligger som en stavningsvariant för Bhutan i GeoNames, och stavningsvarianter (inom latinska alfabetet) vill vi normalt ha med. Lsj (diskussion) 19 augusti 2015 kl. 21.50 (CEST)
- Nu är "Botan" inte en stavningsvariant av Bhutan, om man som jag skulle göra utan vidare upplysningar utgår från att detta är ett svenskspråkigt uppslagsverk. Utan det är namnet på Bhutan på frankoprovensalska. Så om sådana här hänvisningar ska skapas kanske det ska läggas till en not om detta, för att ingen ska tro att det är en stavningsvariant av landets namn som används i svenskan. Vilket är vad jag tycker hänvisningen framställer det som (något som är förvirrande och missvisande). Höstblomma (diskussion) 20 augusti 2015 kl. 08.48 (CEST)
- I och för sig tycker jag vi kan vara generösa med stavningsvarianter, inklusive möjliga felstavningar. Syftet med omdirigeringar och grensidor är inte att fostra folk i vad som är korrekt svenska, utan att hjälpa folk att hitta rätt från alla upptänkliga håll. Men tycker du att det behövs en varning går den att lägga i
{{robotskapad förgrening}}
. Lsj (diskussion) 20 augusti 2015 kl. 10.40 (CEST)
- I och för sig tycker jag vi kan vara generösa med stavningsvarianter, inklusive möjliga felstavningar. Syftet med omdirigeringar och grensidor är inte att fostra folk i vad som är korrekt svenska, utan att hjälpa folk att hitta rätt från alla upptänkliga håll. Men tycker du att det behövs en varning går den att lägga i
- Problemet gäller inte bara robotskapade förgreningar. Det är mycket vanligt att en allmänt använd beteckning för något är felaktig. Folk som stöter på ett sådant felaktigt namn skall kunna hitta den rätta artikeln och förgreningssidorna är i många fall det rätta stället att styra dem rätt. I många fall fungerar en länk under Se även, men om den rätta benämningen inte nödvändigtvis känns igen av läsaren som syftande på rätt sak behövs en förklaring eller en direkt länk från den felaktiga benämningen. Om vi skall ha en varning för felaktiga namnformer bör den läggas in på raden för länken ifråga, inte överst på förgreningssidan. Som jag förstår saken vet roboten inte vilka stavningsvarianter som är korrekta i svenskan eller på ett officiellt språk i landet, vilket gör det litet knepigt att formulera varningen, eventuellt borde den länkas till en närmare förklaring. --LPfi (diskussion) 22 augusti 2015 kl. 11.55 (CEST)
Bhutan
[redigera wikitext]Noterbart i körningen av artiklar om Bhutan:
- Bugg i texten "...ovanligt många...".
- Algoritm för "högsta punkten" behöver revideras. Kolla DEM.
- Hur gör vi med långsträckta "platser" som sträcker sig utanför landet, som Drangme Chhu eller Lesser Himalaya? Filtrera bort med bounding box?
- Många berg i Bhutan saknas i GeoNames.
Lsj (diskussion) 22 augusti 2015 kl. 08.58 (CEST)
- Svårt med "kartprick" som hamnar långt utanför landet. För stora områden i allmänhet vore det kanske bättre med någon annan karta än vad som Geobox locator/Kartposition kan erbjuda.
- För artiklar där positionskarta ändå ska användas kanske det kan vara bra om man inte hårdkodar filnamnet utan hämtar det via mall, se min ändring i artikeln Drangme Chhu. Då slipper man redigera alla artiklar för till exempel ett land om det skulle komma en bättre version av kartan. Jag såg att det saknades en översättning för parametern country1 i samma artikel. --Larske (diskussion) 22 augusti 2015 kl. 09.26 (CEST)
- Tack för bra påpekanden. Visste inte att det fungerade att lägga Kartposition-mallen inne i Geobox. Lsj (diskussion) 22 augusti 2015 kl. 21.51 (CEST)
- Den användningen av "Kartposition xxx" som jag avsåg är bara att hämta namnet på kartfilen och det är ju bara en enkel sträng som returneras, precis vad Geobox vill ha.
- Exempel:
{{Kartposition Bhutan|bild}}
ger Bhutan location map.svg och{{Kartposition Bhutan|bild1}}
ger Bhutan relief location map.jpg. - Själv föredrar jag reliefkartor men det är inte alltid det finns. Med koden
{{#if:{{Kartposition xxx|bild1}}|{{Kartposition xxx|bild1}}|{{Kartposition xxx|bild}}}}
får man reliefkartan om den finns och annars den nakna kartan.
- --Larske (diskussion) 23 augusti 2015 kl. 00.29 (CEST)
- Blir det här rätt för kartor med mer komplexa projektioner, t.ex.
{{Kartposition USA2}}
? Lsj (diskussion) 27 augusti 2015 kl. 22.36 (CEST)
- Blir det här rätt för kartor med mer komplexa projektioner, t.ex.
- --Larske (diskussion) 23 augusti 2015 kl. 00.29 (CEST)
- Ja, förutsatt att bild (den nakna kartan) och bild1 (reliefkartan) använder samma projektion(er) i alla stycken. --Larske (diskussion) 29 augusti 2015 kl. 01.11 (CEST)
- Ok, tack. Ser ut att fungera nu, både med din kod, och med att automatiskt skifta till en annan karta om pricken skulle hamna utanför - se nyskapad Drangme Chhu. Lsj (diskussion) 29 augusti 2015 kl. 10.35 (CEST)
- Ja, förutsatt att bild (den nakna kartan) och bild1 (reliefkartan) använder samma projektion(er) i alla stycken. --Larske (diskussion) 29 augusti 2015 kl. 01.11 (CEST)
Egen forskning?
[redigera wikitext]Hur mycket egen forskning är det här som boten räknar ut? Att hämta enskilda data ur en databas är inget problem, där kan vem som helst gå till källan och kontrollera uppgifterna. Men när data kombineras för att räkna fram saker om omgivningen behöver också källa till vilka algoritmer som använts. Algoritmer skapade speciellt för den här boten är inte så stark som källa. Helst bör det vara sådant som geografer, statistiker eller andra experter faktiskt använder.
Det är inte alltid självklart vad som räknas ut. Ta t.ex. Mount Obama, där höjden räknats ut till 202 m ö.h. och högsta punkten i närheten till Shekerley Mountains med 329 m ö.h.. Andra Wikipedior har källor till att berget är 402 m ö.h. och att det är högsta toppen i bergskedjan Shekerley Mountains. 90.229.134.107 23 augusti 2015 kl. 11.18 (CEST)
- Den här boten gör en hel del beräkningar, som EMRÅ faller under det undantag som finns i WP:Ingen originalforskning#Undantag: "icke-kontroversiella artiklar där icke-kontroversiella beräkningar, sammanfattningar och sammanställningar görs som logisk följd av redovisat källmaterial". Man kan också se det så här: En människa som skriver en geografiartikel kan mycket väl skriva in i artikeln sådant som en människa kan se vid en snabb blick på en karta, utan att bli anklagad för egen forskning, t.ex. "Kungshamn är beläget på en halvö på västkusten strax norr om Lysekil." (ur artikeln Kungshamn). Det boten gör är i grund och botten samma sak, fast "en snabb blick på en karta" sker med andra metoder. Metoderna som används är inte hemliga; en sammanfattning ges i noterna i varje artikel, vissa har diskuterats i mer detalj här ovan, och hela koden kommer att läggas ut när den är någorlunda färdig.
- Vad gäller just höjduppgiften för Mount Obama, så är den inte en beräkning av boten, utan återfinns i angiven källa, vilket även höjden för Shekerley Mountains gör. Dåligt exempel på "egen forskning". Beträffande pålitligheten för källans höjduppgifter, se #Är GeoNames pålitligt? här ovan. Lsj (diskussion) 23 augusti 2015 kl. 14.24 (CEST)
- Geonames har slarvigt avrundad koordinat för berget. Den som angav den tyckte kanske att det räckte med 2 decimaler som ser kanske ser snyggare ut. Punkten i Geonames pekar inte på berget utan vid sidan om där är terrängen är 202 m ö.h. Någon har antagligen tagit höjden från den felaktiga punkten och matat in i databasen. Nasko (✉) 23 augusti 2015 kl. 14.33 (CEST)
Bathpalathang Airport
[redigera wikitext]Artikeln Bathpalathang Airport säger: I trakten runt Bathpalathang Airport finns ovanligt många namngivna . Lägg märke till punkten i citatet. Jag har inte klippt bort det som det finns många av. Det är artikeln som inte säger det. Samma problem finns i Kanglung och Daphu. --Ettrig (diskussion) 26 augusti 2015 kl. 15.30 (CEST)
- Ja, det var det problemet jag syftade på under rubriken #Bhutan ovan när jag sade 'Bugg i texten "...ovanligt många...".' Åtgärdat i koden, ska förhoppningsvis bli rätt när jag kör om Bhutan-artiklarna. Lsj (diskussion) 26 augusti 2015 kl. 16.10 (CEST)
Goleš
[redigera wikitext]Noterar att Lsjbot har skapat två förgreningssidor, Goleš och Goles, med samma innehåll. Goles borde ju omdirigera till Goleš. K9re11 (diskussion) 28 augusti 2015 kl. 21.04 (CEST)
- Innehållet i just dessa två är inte helt identiskt. Några länkar finns bara i den ena. Men annars kan det mycket väl inträffa att två grensidor med olika namn får samma innehåll. Jag har svårt att se att den här sortens dubletter egentligen gör någon skada (att komma från den ena grensidan till den andra hjälper knappast läsaren), och det skulle vara ett mycket omfattande arbete för boten att dubbelkolla en halv miljon grensidor, alla mot alla, för att finna vilka som eventuellt kan syfta på exakt samma uppsättning platser. Lsj (diskussion) 28 augusti 2015 kl. 21.54 (CEST)
- Tiitade på Goleš, och den tilltänkta Goleš (kulle i Kosovo, lat 42,62, long 21,22), 42°37′25″N 21°13′00″Ö / 42.62361°N 21.21667°Ö och måste medge att jag känner mig en smula osäker på om jag tycker det är en bra idé att skapa alla dessa kullar. När jag funderade på det gjorde jag ett test och skapade Backen, Kisa utifrån topografiska kartan, och vars relevans jag nog tycker är tveksam (tätortsnärheten ökar nog relevansen i Backen-fallet - utan den kanske jag inte ens vågat testa den i ns0...), och undrar om en sådan plats skulle (riskera att) få botartikel? Om alltför många artiklar om obetydliga platser skapas tror jag i vart fall att det är viktigt att de mer notabla inte drunknar i mängden. Jag har nyligen skapat Kategori:Insjöar i Sverige om minst en kvadratkilometer, med underkategorier för >2, >5, >10 och >100 km², för att inte de stora ska drunkna i mängden, och med arbetet med insjögrenar o.d kan jag medge att jag ibland känner mig lite tveksam om nyttan med artiklar om ensligt belägna sjöar om mindre än 10 ha. Näväl, om du inte redan tänkt på någon motsvarande kategorisering som den jag gjorde för de större sjöarna redan, så kanske det kunde vara något att överväga i alla fall? Taxelson (diskussion) 29 augusti 2015 kl. 11.25 (CEST)
- En intressant idé med storlekskategorisering, det hade jag inte tänkt på. Tekniskt inte jättesvårt, och kan nog vara till hjälp för läsare. Bör förmodligen göras per land. Sjöar och öar efter area, höjder av olika slag (kullar, berg, etc) efter höjd. Lsj (diskussion) 29 augusti 2015 kl. 11.35 (CEST)
- Per land är antagligen bra. Vad som är en betydande höjd i Danmark eller Nederländerna vore det ju knappast i om den istället legat i Schweiz eller Nepal. Jag valde att inte lägga sjökategorierna per landskap, utan tänker att man nu kan sålla fram de stora sjöar man vill i komun, län eller landskap, man vill ha, med CatScan. Taxelson (diskussion) 29 augusti 2015 kl. 11.45 (CEST)
- Bra det, och då får vi möjlighet att granska "låga berg". När jag tittar på Veternik (berg i Makedonien, lat 42,02, long 21,31), kan jag inte riktigt se att det alls finns finns något berg där - kanske avses området en knapp km söder ut? men det blir väldigt svårt att gissa vad som kan avses. När det som i detta fall finns mycket högre berg i närheten tycker jag det kunde vara värt att överväga att ett berg som detta inte skapas. Funderar över om det skulle gå att utnyttja det faktum att du redan analyserar höjdprofilen för området. Vet inte om du kommer åt områdets medelhöjd. I så fall kanske du kunde jämföra någon medelhöjd med de högsta topparna i området, och därefter ta bort de höjder som är exempelvis mindre än t.ex 50% av de högsta topparnas relativa höjd mot omgivningen? Kanske som någon andel av standardavvikelsen för områdets höjdangivelser, e.d? En ren höjd över havet blir ju däremot helt missvisande. Och en kulle i en slättbygd kan ju vara ett landmärke. Jag gjorde, och FBQ fyllde på en artikel om ett berg i min närhet i Dalarna, som jag är tveksam till relevansen för, och som dessutom visade sig ha osäkra data i GeoNames? Taxelson (diskussion) 29 augusti 2015 kl. 18.57 (CEST)
- Jag kommer åt områdets medelhöjd och mycket annat när jag skapar artiklar, men inte när jag skapar grensidor. Om det är ok att det blir en del rödlänkar i grensidorna så kan jag enkelt avstå från att skapa alltför obetydliga kullar. Att eliminera småkullarna från grensidor vore däremot mycket mer jobb. Vad just Veternik (berg i Makedonien, lat 42,02, long 21,31) beträffar så har Google Maps också ett Veternik på samma ställe. Misstänker att både GeoNames och Google har fått koordinater från samma källa, med ett smärre fel i koordinaterna, kanske avrundningsfel. Koordinater avrundade t.ex. till hela minuter kan ge fel på någon kilometer. Lsj (diskussion) 29 augusti 2015 kl. 20.34 (CEST)
- Ja, det tycker jag är ok. I efterhand borde det inte vara alltför svårt att rensa bort de röda. Ännu lättare om de som valts bort kunde loggas någonstans. Taxelson (diskussion) 29 augusti 2015 kl. 20.44 (CEST)
- Jag tycker inte det låter som en god ide att låta bli att skapa artiklar om (för små) kullar men ändå ha med dem i grensidor. Om man jämför med sjöar så tycker jag det är intressant även med små sjöar och tycker det är kul när jag enkelt kan få reda på främst djup. Samma sak med kullar, jag vill enkelt kunna slå upp främst höjd. --افيراتير (diskussion) 30 augusti 2015 kl. 08.11 (CEST)
- Averater, på de väldigt små sjöarna saknas nästan alltid djupuppgift. Av våra 57000 svenska sjöartiklar har bara 7394 (13%) maxdjup (färre även medeldjup) medan den mer lättberäknade arean finns för 34553 sjöar (61%) (höjd över havet för nästan lika många) men saknas således för nästan 40%. Dessa är nästan alltid små, och uppgifterna inte sällan felaktiga, Vi har >22000 artiklar om småsjöar med inte så mycket mer information än var de ligger (och vi har problem med felstavade eller föråldrade namn på många av dem). Rörmyrtjärnen (Jokkmokks socken, Lappland, 736432-169454) kan vara ett exempel på en sådan artikel vi möjligen har för många av. Eftersom den har ett svenskt namn ser alla att det av efterledet att döma antagligen är en lite sjö, men på ett främmande språk hade vi inte ens reagerat om namnet på sjön uppgivits vara "Tjärnmyrbacken" istället.
- Av det lilla jag sett av höjduppgifter i Geonames för mindre berg och höjder, har jag inte blivit så imponerad, och skulle gärna slippa tiotusentals artiklar om små berg, vars uppgifter i okänd utsträckning riskerar att vara fel - och ingen realistiskt kommer att kunna eller vilja kontrollera dem ens rudimentärt (namnets rimlighet, t.ex). Att vi i ett övergångsskede får massa rödlänkar i förgreningssidor är ett mindre problem. Kanske man inte ens ska ta bort dem helt från grensidorna, utan bara svärta dem, och låta namn och koordinat finnas kvar? Jag vet inte. Taxelson (diskussion) 30 augusti 2015 kl. 09.18 (CEST)
- Alla artiklar riskerar att ha fel. Bland växter som jag kollat mer på är det betydligt oftare fel i människoskapade än i robotskapade. Främst gäller det tveksamma arter eller släktskap som ändrats. Där har Lsjbot gjort en del fel men det är i en väldigt liten andel. Bland sjöar har jag ingen koll på Norrlands utan har hållit mig längre söderut där jag inte har samma upplevelse att de saknar så mycket. Dessutom är det för mig mycket lättare att komplettera eller rätta i en existerande artikel än att skapa en ny från grunden och därefter lägga in någon data. Hur höjddatat i Geonames är vet jag inte, för populationer gjorde Lsj nån jämförelse som visade att det var bra. Är datat däremot mycket sämre är det klart vi inte ska ha med det. --افيراتير (diskussion) 30 augusti 2015 kl. 09.37 (CEST)
- Finns jämförelse även för höjder under rubriken #Är GeoNames pålitligt? här ovan. Lsj (diskussion) 30 augusti 2015 kl. 09.51 (CEST)
- Alla artiklar riskerar att ha fel. Bland växter som jag kollat mer på är det betydligt oftare fel i människoskapade än i robotskapade. Främst gäller det tveksamma arter eller släktskap som ändrats. Där har Lsjbot gjort en del fel men det är i en väldigt liten andel. Bland sjöar har jag ingen koll på Norrlands utan har hållit mig längre söderut där jag inte har samma upplevelse att de saknar så mycket. Dessutom är det för mig mycket lättare att komplettera eller rätta i en existerande artikel än att skapa en ny från grunden och därefter lägga in någon data. Hur höjddatat i Geonames är vet jag inte, för populationer gjorde Lsj nån jämförelse som visade att det var bra. Är datat däremot mycket sämre är det klart vi inte ska ha med det. --افيراتير (diskussion) 30 augusti 2015 kl. 09.37 (CEST)
- Jag tycker inte det låter som en god ide att låta bli att skapa artiklar om (för små) kullar men ändå ha med dem i grensidor. Om man jämför med sjöar så tycker jag det är intressant även med små sjöar och tycker det är kul när jag enkelt kan få reda på främst djup. Samma sak med kullar, jag vill enkelt kunna slå upp främst höjd. --افيراتير (diskussion) 30 augusti 2015 kl. 08.11 (CEST)
Åboland-Turunmaa
[redigera wikitext]På sidan Lom (olika betydelser) står Lom (ö), Egentliga Finland, Åboland-Turunmaa. Det räcker med Åboland, Turunmaa är det finska namnet. K9re11 (diskussion) 28 augusti 2015 kl. 21.29 (CEST)
- Källan anger dubbelnamnet. Och eftersom den befintliga artikeln Åboland saknar faktaruta med latitud/longitud har boten inte lyckats identifiera att den handlar om samma ställe. På den högsta nivån (län och motsvarande) har jag gått igenom alla omatchade namn på administrativa enheter för hand för att få ordning på matchningen mot befintliga artiklar, men på lägre nivåer finns det alldeles för många (hundratusentals) för att det ska vara görbart. Lsj (diskussion) 28 augusti 2015 kl. 22.03 (CEST)
- Fixar detta i botkoden innan jag kör Finland snart. Lsj (diskussion) 12 maj 2016 kl. 17.27 (CEST)
Kyrilliska och källor
[redigera wikitext]Hej! Jag ser att det nu skapas förgreningssidor med kyrilliska namn. Det känns lite… ovanligt. Vad säger vi om det? I det här fallet länkar man till ännu ej skapade artiklar om källor. Hur stor är chansen att vi kan hitta mer info (fler källor ?) om de här och liknande källor (som antagligen borde kopplas till artiklar om vattendrag)?--Paracel63 (diskussion) 29 augusti 2015 kl. 01.03 (CEST)
- Vi hade en lång diskussion om detta här. Utfallet blev en kompromiss: att lokala namn på platser, med lokal skrift, ska finnas som omdirigeringar/grensidor och nämnas i artikeltexten, men bara latinska alfabetet ska användas i övrigt. Därför blir det kyrilliska grensidor när jag kör Makedonien nu, som ju använder kyrillisk skrift, på samma sätt som det blev en del arabiska omdirigeringar i Bahrein - se t.ex. أَبُو مَاهِر. Vad källorna beträffar så kommer de artiklarna att skapas inom kort - som botkoden är skriven behöver grensidorna skapas först, och sedan artiklarna om Makedonien i en separat körning. Lsj (diskussion) 29 augusti 2015 kl. 10.50 (CEST)
- Hittade just en bugg i det kyrilliska. För 99,9% av platserna anger GeoNames en huvudnamnform med latinsk skrift. Jag hade missat att det inte var 100%. Lsj (diskussion) 29 augusti 2015 kl. 18.05 (CEST)
- OK. Jag är med på det kyrilliska etc. Ledsen att jag för ett ögonblick glömde av den länkade diskussionen (som jag faktiskt läst om tidigare). Vad gäller källornas relevans som artiklar är jag inte helt övertygad, men, men… Allt gott.--Paracel63 (diskussion) 29 augusti 2015 kl. 23.53 (CEST)
Konstig interwiki
[redigera wikitext]Artikeln Topli Dol (å i Makedonien, lat 41,78, long 21,98) är om en å i Makedonien, medan dess motsvarigheter på andra språk är byar eller något dylikt: Topli Dol (en serbe...) est un village de Serbie situé... börjar den franska artikeln. Att ha befolkningsmängden för en å verkar lite konstigt, kanske borde Lsjbot inkludera invånarantalet bara för städer, byar och dylikt. K9re11 (diskussion) 29 augusti 2015 kl. 17.34 (CEST)
- Ja, detta ser ut som en bugg i interwikikopplingen. Ska undersöka. Lsj (diskussion) 29 augusti 2015 kl. 17.47 (CEST)
- Tror jag har hittat problemet. Men att åtgärda det kommer också att göra att boten missar en del äkta interwikilänkningar. Men hellre det än felaktiga. Lsj (diskussion) 29 augusti 2015 kl. 17.47 (CEST)
- Ställer också in generellt så att befolkning skrivs ut bara för orter och administrativa indelningar. Lsj (diskussion) 29 augusti 2015 kl. 17.51 (CEST)
- Det där sista låter rimligt. Hur många invånare kan en å ha (fantasin skenar)? :-)--Paracel63 (diskussion) 29 augusti 2015 kl. 23.56 (CEST)
- Floden Amstel har nog åtskilliga invånare där den rinner genom Amsterdam, med tanke på alla husbåtar som ligger där. Lsj (diskussion) 30 augusti 2015 kl. 10.07 (CEST)
- Det där sista låter rimligt. Hur många invånare kan en å ha (fantasin skenar)? :-)--Paracel63 (diskussion) 29 augusti 2015 kl. 23.56 (CEST)
- Ställer också in generellt så att befolkning skrivs ut bara för orter och administrativa indelningar. Lsj (diskussion) 29 augusti 2015 kl. 17.51 (CEST)
- Tror jag har hittat problemet. Men att åtgärda det kommer också att göra att boten missar en del äkta interwikilänkningar. Men hellre det än felaktiga. Lsj (diskussion) 29 augusti 2015 kl. 17.47 (CEST)
Småfixar, högt och lågt (eller avfolkat)
[redigera wikitext]Kikade på ett par av de nya artiklarna, och hittade ett par detaljfrågor jag tänkte jag kan passa på att lyfta:
Golemo Brdo (kulle i Makedonien, Opsjtina Negotino):
- "(Makedonska: Големо Брдо, Makedonska: Visoko Brdo)" – för det första (rätta mig om jag har fel), men jag tror det ska vara "makedonska" med litet m, i svenskan (parantesen ser jag då också som del av en annan mening). I det fallet blir det också två (länkade) "makedonska" efter varandra: det kan ju hända att det blir väldigt bökigt att lösa med boten, men t ex "makedonska: Големо Брдо, Visoko Brdo" eller "makedonska: Големо Брдо, translittererat: Visoko Brdo" (om translitterering är rätt term?) (eller alternativt bara ena ordet länkat) hade varit snyggt. (Det kanske för den delen är ett rätt ovanligt fall jag stötte på, med både kyrilliska (?) och latinska bokstäver?)
- "Golemo Brdo ligger 284 meter över havet", "Höjdläge 284 m ö.h." – återigen, en fråga om hur krångligt det blir att lösa för kullar och berg och liknande, men det innebär alltså att kullen mäter 284 meter, är 284 meter hög? Den formuleringen tycker jag i så fall är lite otydlig.
Och kanske något som bara har med terminologi att göra, men i den andra artikeln tyckte jag det var litegrann förvånande att det övergivna samhället Svinisjte har 139 invånare.. :) Förmodar att det har varit ett större samhälle, och jag vet inte hur vanligt den typen av fall är, men.. i sig lite förbryllande. Vänligen, flinga 29 augusti 2015 kl. 19.14 (CEST)
- Tack för bra synpunkter.
- Det där med språken har du alldeles rätt i, jag antog dumt nog att det bara skulle finnas ett namn på varje språk, och tänkte inte på att göra liten bokstav på svenska.
- Höjden är en standardformulering som används för alla platstyper, men den är kanske inte helt klockren för berg och liknande. Går att hantera som specialfall. Förslag på bättre formulering? "Toppen på X är Y meter över havet."?
- "Höjdläge" kommer ut geobox-mallen, och borde kanske ändra i mallen till bara "Höjd". Men det är en ändring som i så fall bör diskuteras först.
- Det där samhället som är övergivet men ändå inte är märkligt, men det är så källan säger.
- Lsj (diskussion) 29 augusti 2015 kl. 20.16 (CEST)
- Har skapat om Golemo Brdo (kulle i Makedonien, Opsjtina Negotino) nu med språk och höjd fixat. Bättre så? Lsj (diskussion) 29 augusti 2015 kl. 20.54 (CEST)
- Javisst, helt klart! Funderade på formulering för höjden, "Xs högsta höjd/punkt är Y meter över havet" "Xs höjd är Y meter över havet", spånade jag kring, men jag skulle inte säga att de precis är bättre än formuleringen som är nu. Sådant är ju alltid rätt svårt att välja, har någon en toppenformulering (hm!) kan den kanske höra av sig. Likadant med namnet, det är bättre såhär, någon annan får säga ifrån om de tycker att det behöver preciseras mer än så. flinga 29 augusti 2015 kl. 21.20 (CEST)
(utdrag) Andra småputsfrågor om kullar: I Bilo (ås i Makedonien, Opsjtina Sveti Nikole) står det i källhänvisningen "updated 1993-11-01". Ska det vara "uppdaterad" eller "Läst" eller något annat? Sedan undrar jag om GeoNames verkligen fanns 1993.--Paracel63 (diskussion) 30 augusti 2015 kl. 00.03 (CEST)
- Jag fyller på med ett par frågor kring samma kulle:
- Om jag klickar på rad 5 i den här listan så kommer jag till den här sidan. Om jag sedan klickar på ikonen med en 1:a i mitten på kartan, den med en tooltip som är
RDGE 792615 Bilo
, så uppenbarar sig en ruta där det bland annat står Bilo ca. 619 m. Men i den robotskapade infoboxen står det Höjdläge 516 m ö.h.. Varför är det olika? - Det verkar som om Ljsbot "avrundar" koordinaterna som på ovan nämnda sida är 41.976º/21.875º (41º58'33/21º52'28") till hela minuter (41º58'/21º53') vilket sedan presenteras som 41.96667°, 21.88333°.
- Latituden verkar trunkerad, en avrundning skulle väl ge 41º59', medan longituden verkar avrundad uppåt, avrundning till närmaste minut skulle ge 21º52'. Det kan finnas skäl för avrundning, men knappast trunkering eller avrundning uppåt till icke närmsta minut, men då tycker jag att formatet i
{{coord}}
också skulle vara ddºmm' och inte som nu dd.dddddº. Alltså 41°58′N 21°53′Ö / 41.967°N 21.883°Ö i stället för 41°58′00″N 21°53′00″Ö / 41.96667°N 21.88333°Ö. Nuvarande presentation av "avrundade" värden med fem decimaler ger en missvisande bild eftersom endast den första decimalen är korrekt. - --Larske (diskussion) 30 augusti 2015 kl. 01.03 (CEST)
- Beträffande datumet 1993, så är det vad som anges i källan. Förmodligen syftar det inte på det datum när GeoNames fick uppgifterna, utan på det datum när källan som GeoNames använde skapades.
- Beträffande höjd och koordinater, så avrundar inte Lsjbot någonting. Jag använder databasdumpar från GeoNames, och använder exakt de värden som står där, vilket är 516 möh och lat 41.96667, long 21.88333 för Bilo. Anmärkningsvärt att GeoNames ger olika uppgifter "live" och i dump. Tyvärr är användarvillkoren för deras API sådana att det inte funkar för botskapande. Lsj (diskussion) 30 augusti 2015 kl. 09.40 (CEST)
- Kollade dumpen igen nu -- dumpfilerna har blivit uppdaterade på GeoNames 2015-08-30, efter att jag laddat hem den. Den nya innehåller samma uppgifter som finns på deras sajt. Lsj (diskussion) 30 augusti 2015 kl. 09.45 (CEST)
- OK, allting har sin förklaring. Kanske dumpdatum skulle ingå i källangivelsen för artiklar skapade från geonames-dumpar. --Larske (diskussion) 30 augusti 2015 kl. 09.49 (CEST)
- Dumpdatum är lätt att lägga till. Och kanske jag borde se till att ladda hem en ny dumpfil innan jag kör varje land? Lsj (diskussion) 30 augusti 2015 kl. 09.53 (CEST)
- Datumet för Bilo är inte heller 1993 i den nya filen, utan 2015 :) Lsj (diskussion) 30 augusti 2015 kl. 10.05 (CEST)
- Dumpdatum är lätt att lägga till. Och kanske jag borde se till att ladda hem en ny dumpfil innan jag kör varje land? Lsj (diskussion) 30 augusti 2015 kl. 09.53 (CEST)
- OK, allting har sin förklaring. Kanske dumpdatum skulle ingå i källangivelsen för artiklar skapade från geonames-dumpar. --Larske (diskussion) 30 augusti 2015 kl. 09.49 (CEST)
Konstiga artikelnamn
[redigera wikitext]Hej! Här är en artikel och tre omdirigeringar med konstiga namn som nyligen skapats: Ajerodrom Skopje „Aleksandar Veliki“, Аеродром Скопје „Aлександар Вeлики“, Opsjtina „Kriva Palanka“ och (( Dobro Pole )). Svensson1 (diskussion) 30 augusti 2015 kl. 11.08 (CEST)
- Samtliga namn kommer från källan GeoNames (i vissa fall transkriberade). Flygplatsen har lite lustiga citattecken, men i övrigt heter den som det står, vilket också framgår av bilden. (( Dobro Pole )) är konstigt, vet inte varför källan anger ett namn i dubbelparentes. Opsjtina „Kriva Palanka“ har samma lustiga citattecken som flygplatsen. Båda de namnen har boten transkriberat från kyrilliska alfabetet, och då låter den allt som inte är bokstäver stå kvar som i originalet. Lsj (diskussion) 30 augusti 2015 kl. 19.48 (CEST)
- Skulle det vara tänkbart att du tittar efter „...“ och ersätter med ”...”? Och att även engelska “…” ersätts med ”...”? Det finns en lista med citationstecken på olika språk här: en:Quotation mark#Summary table for all languages. Man kanske inte behöver hantera alla dem, men några skulle väl kunna vara bra? Svensson1 (diskussion) 30 augusti 2015 kl. 19.59 (CEST)
- Det ska jag göra. Lsj (diskussion) 1 september 2015 kl. 07.16 (CEST)
- Skulle det vara tänkbart att du tittar efter „...“ och ersätter med ”...”? Och att även engelska “…” ersätts med ”...”? Det finns en lista med citationstecken på olika språk här: en:Quotation mark#Summary table for all languages. Man kanske inte behöver hantera alla dem, men några skulle väl kunna vara bra? Svensson1 (diskussion) 30 augusti 2015 kl. 19.59 (CEST)
Redigeringskommentarer (igen)
[redigera wikitext]Får man önska sig avvikande redigeringskommentarer till skapande av omdirigeringar? -- Innocent bystander 31 augusti 2015 kl. 17.10 (CEST)
- OK. Lsj (diskussion) 31 augusti 2015 kl. 18.37 (CEST)
- "Botskapande Malta omdirigering". Lsj (diskussion) 31 augusti 2015 kl. 18.49 (CEST)
Geonameslänk med citationstecken
[redigera wikitext]Hej! I artikeln Ajerodrom Skopje „Aleksandar Veliki“ fanns en Geonameslänk som innehöll raka citationstecken. Det gjorde att länken inte fungerade. Jag ersatte tecknen med %22 och därefter fungerar länken. Svensson1 (diskussion) 1 september 2015 kl. 07.22 (CEST)
- Tack. Fixat i koden nu. Lsj (diskussion) 1 september 2015 kl. 18.36 (CEST)
Hej, å borde länka till artikeln Å (vattendrag) och inte till artikeln om bokstaven Å, som nu görs i t.ex. Río Sacal. /Ariam (diskussion) 1 september 2015 kl. 09.07 (CEST)
- Hm, det trodde jag att jag hade fixat för ett tag sedan. Men det ser ut att ha kommit bort. Ska fixas. En annan fundering när vi nu pratar om åar: är det rätt benämning på diverse vattendrag världen över, eller vore det bättre att kalla dem "flod" eller helt enkelt "vattendrag"? Lsj (diskussion) 1 september 2015 kl. 18.33 (CEST)
- När jag är i olika delar av Sverige, tycker jag inte att jag hittar någon enhetlig benämning på olika typer av vatten, så eftersträva en global enhetlighet är nog att hoppas mycket. -- Innocent bystander 1 september 2015 kl. 18.53 (CEST)
- Det kan nog vara lite känsligt med de här benämningarna. Det kan vara bra att kolla upp om det finns info om vilka vattendrag som kan kallas vad. Mina gissningar är att "vattendrag" är godtagbart för allt men lite tråkigt, å är mindre än älv/flod, och för de större används flod överallt utom i skandinavien, där de istället heter älv. ⬤Boⅳⅰᴇ 1 september 2015 kl. 22.45 (CEST)
- Lite problematiskt att källan saknar uppgift om vattendragens storlek, annat än att de allra minsta bäckarna är i en separat kategori som jag sorterar bort som irrelevant. Misstänker att flertalet av dem som är kvar är av å-storlek, men saknar belägg för det. Lsj (diskussion) 2 september 2015 kl. 10.43 (CEST)
- Ja, som Boivie och IB, Att kalla Jordan något annat än flod är väl otänkbart, och ändå är dess flöde att jämföra med Fyrisåns enligt artikeln. Så även om flödet vore känt, så hade ordvalsfrågan ändå inte varit löst. Det handlar bland annat om språkliga konventioner, traditioner och kanske dess flödesstorlek i jämförelse med näraliggande floder. Bra alltså att ordet - vilket det nu blir - länkas, så att dessa vattendrag kan hittas, och den som vill kan gå igenom något område och förbättra ordvalet vid behov. Vi har förut diskuterat problemet med vattendrag i Sverige, som ständigt byter namn utmed sträckningen, vilket gör artiklar om vattendrag i Sverige svårskrivna, och täckningen också här besvärande dålig. Taxelson (diskussion) 2 september 2015 kl. 15.09 (CEST)
- Och vem har inte fått lära sig namnet på Hallands floder?
- -- Innocent bystander 2 september 2015 kl. 15.43 (CEST)
- Ja, som Boivie och IB, Att kalla Jordan något annat än flod är väl otänkbart, och ändå är dess flöde att jämföra med Fyrisåns enligt artikeln. Så även om flödet vore känt, så hade ordvalsfrågan ändå inte varit löst. Det handlar bland annat om språkliga konventioner, traditioner och kanske dess flödesstorlek i jämförelse med näraliggande floder. Bra alltså att ordet - vilket det nu blir - länkas, så att dessa vattendrag kan hittas, och den som vill kan gå igenom något område och förbättra ordvalet vid behov. Vi har förut diskuterat problemet med vattendrag i Sverige, som ständigt byter namn utmed sträckningen, vilket gör artiklar om vattendrag i Sverige svårskrivna, och täckningen också här besvärande dålig. Taxelson (diskussion) 2 september 2015 kl. 15.09 (CEST)
- Lite problematiskt att källan saknar uppgift om vattendragens storlek, annat än att de allra minsta bäckarna är i en separat kategori som jag sorterar bort som irrelevant. Misstänker att flertalet av dem som är kvar är av å-storlek, men saknar belägg för det. Lsj (diskussion) 2 september 2015 kl. 10.43 (CEST)
- Det kan nog vara lite känsligt med de här benämningarna. Det kan vara bra att kolla upp om det finns info om vilka vattendrag som kan kallas vad. Mina gissningar är att "vattendrag" är godtagbart för allt men lite tråkigt, å är mindre än älv/flod, och för de större används flod överallt utom i skandinavien, där de istället heter älv. ⬤Boⅳⅰᴇ 1 september 2015 kl. 22.45 (CEST)
- När jag är i olika delar av Sverige, tycker jag inte att jag hittar någon enhetlig benämning på olika typer av vatten, så eftersträva en global enhetlighet är nog att hoppas mycket. -- Innocent bystander 1 september 2015 kl. 18.53 (CEST)
Andra betydelser
[redigera wikitext]I artiklar som Cerro Peñas Blancas (berg i Nicaragua, Región Autónoma del Atlántico Norte, lat 13,77, long -84,64) kunde det vara bra med {{för|Cerro Peñas Blancas}} i början. K9re11 (diskussion) 1 september 2015 kl. 18.46 (CEST)
- Tekniskt inte helt enkelt, eftersom boten då behöver hålla reda på vad grensidan hette. En ytterligare komplikation är att många artiklar länkas till från flera grensidor, och då behöver det hållas reda på vilken/vilka av dessa som är relevanta för topplänk. Lsj (diskussion) 2 september 2015 kl. 10.54 (CEST)
- Men kan det inte räcka att bara skala bort särskiljningsledet (fram till " (" eller ",") och kolla om den sidan finns och är en grensida. Om inte grensida, kolla om motsvarande "... (olika betydelser)" är det, och till sist följa eventuella omdirigeringar. Blir det inte napp på någon av dessa, så skapas ingen topplänk. Men jag kanske förbiser något. Taxelson (diskussion) 2 september 2015 kl. 14.53 (CEST)
- Ja, Cerro Penas Blancas är inte relevant som topplänk så länge artikeln ligger under Cerro Peñas Blancas. -- Innocent bystander 2 september 2015 kl. 15.56 (CEST)
- Ja, Taxelsons algoritm bör fungera i de allra flesta fall. Relativt enkelt att koda också. Lsj (diskussion) 2 september 2015 kl. 18.42 (CEST)
- Ja, Cerro Penas Blancas är inte relevant som topplänk så länge artikeln ligger under Cerro Peñas Blancas. -- Innocent bystander 2 september 2015 kl. 15.56 (CEST)
- Men kan det inte räcka att bara skala bort särskiljningsledet (fram till " (" eller ",") och kolla om den sidan finns och är en grensida. Om inte grensida, kolla om motsvarande "... (olika betydelser)" är det, och till sist följa eventuella omdirigeringar. Blir det inte napp på någon av dessa, så skapas ingen topplänk. Men jag kanske förbiser något. Taxelson (diskussion) 2 september 2015 kl. 14.53 (CEST)
- Provkör nu. Ser det ok ut i Vaidava (å i Estland)? Lsj (diskussion) 4 september 2015 kl. 20.38 (CEST)
Jag hittade ganska lätt interwikilänkar för ett par slumpvis valda "platser" i Nicaragua (t ex en:Escondido River (Nicaragua)). Finns det planer på att Lsjbot lägger till dem automagiskt? (I så fall är det ju inte lönt att göra det för hand.) --Ettrig (diskussion) 4 september 2015 kl. 09.10 (CEST)
- Det är intewiki i många sidor som läggs upp. Det är förstås alltid en viss nivå av osäkerhet när man ska matcha två artiklar. Och konsekvensen av att två artiklar är sammanfogade som inte bör vara det, är nog allvarligare än om vi får dubletter på Wikidata. -- Innocent bystander 4 september 2015 kl. 09.16 (CEST)
- Missförstå mig rätt! Det här var inte ett klagomål. Ville bara veta om mer iw-länkar är att vänta. Jag tolkar ditt svar som att det är det inte. --Ettrig (diskussion) 4 september 2015 kl. 09.35 (CEST)
- Nu är det inte min robot, men vi har ovan stött på problem med att det dök upp interwiki mellan vattendrag och orter i Makedonien. Konsekvensen av den upptäckten blev att Lsj gjorde algoritmen som kopplade samman artiklar lite mer släpphänt. Så lite missade interwikilänkar är kanske priset vi får betala för att inte folk i Nicaragua ska tvingas lägga sina städer under vatten. -- Innocent bystander 4 september 2015 kl. 09.48 (CEST)
- Lsjbot kommer inte att lägga till fler IW-länkar. Den lägger redan till alla där den är tillräckligt säker på att det verkligen är rätt plats, vilket inte är alldeles enkelt att avgöra. Bra om iw-länkningen kan kompletteras manuellt, se bara upp med felaktiga poster på wikidata. Inte alls ovanligt att wikidata rör ihop en kommun med sin centralort, vilket både svwp och Lsjbot vill undvika. Lsj (diskussion) 4 september 2015 kl. 17.14 (CEST)
- Nu är det inte min robot, men vi har ovan stött på problem med att det dök upp interwiki mellan vattendrag och orter i Makedonien. Konsekvensen av den upptäckten blev att Lsj gjorde algoritmen som kopplade samman artiklar lite mer släpphänt. Så lite missade interwikilänkar är kanske priset vi får betala för att inte folk i Nicaragua ska tvingas lägga sina städer under vatten. -- Innocent bystander 4 september 2015 kl. 09.48 (CEST)
- Missförstå mig rätt! Det här var inte ett klagomål. Ville bara veta om mer iw-länkar är att vänta. Jag tolkar ditt svar som att det är det inte. --Ettrig (diskussion) 4 september 2015 kl. 09.35 (CEST)
Finska öar
[redigera wikitext]På Kili finns följande:
- Avön (ö i Finland), Åland, 60°00′13″N 24°22′24″Ö / 60.00361°N 24.37333°Ö
- Kili (ö i Finland), Kajanaland, Kajana, 64°06′27″N 27°28′10″Ö / 64.10762°N 27.46957°Ö
Den första heter enligt lantmäteriets karta just Kili på finska men Ävön (inte Avön) på svenska. Och den ligger inte i Åland. Nu kunde ju detta enkelt rättas, men hur borde det göras så att inte boten kör vilse? Felen lär ju ligga i GeoNames (såvida nu inte Lantmäteriet har fel, då...). (För den andra Kili noterar jag att den ligger i en insjö - gissar och hoppas botartikeln så småningom kommer att meddela i vilken sjö!) Taxelson (diskussion) 4 september 2015 kl. 18.02 (CEST)
- Vilket var delar av anledningen till att jag inte var överförtjust i att vi skulle ha ascii-alternativ även till svenska bokstäver (åäö) som omdirigeringar. Avön är ju just en sådan variant till Ävön, jämför Are nedan. -- Innocent bystander 4 september 2015 kl. 20.21 (CEST)
- Avön i.st.f. Ävön är ett fel I GeoNames. Var boten fick Åland ifrån förstår jag inte riktigt, GeoNames säger att Avön ligger i Nyland. Boten har kod för att identifiera i vilken sjö en ö ligger (se t.ex. Isla Grande (ö i Nicaragua, Chontales, lat 12,00, long -85,62)), men den förutsätter att sjön går att kartlägga i DEM-kartan som boten använder och fungerar därför inte på alltför små eller komplexa sjöar. Lsj (diskussion) 4 september 2015 kl. 20.25 (CEST)
- Har hittat felet med Åland/Nyland. Nu ska det bli rätt i artikeltext åtminstone. Dock svårt att åtgärda i grensidorna och särskiljningsleden. Lsj (diskussion) 4 september 2015 kl. 20.40 (CEST)
- Avön i.st.f. Ävön är ett fel I GeoNames. Var boten fick Åland ifrån förstår jag inte riktigt, GeoNames säger att Avön ligger i Nyland. Boten har kod för att identifiera i vilken sjö en ö ligger (se t.ex. Isla Grande (ö i Nicaragua, Chontales, lat 12,00, long -85,62)), men den förutsätter att sjön går att kartlägga i DEM-kartan som boten använder och fungerar därför inte på alltför små eller komplexa sjöar. Lsj (diskussion) 4 september 2015 kl. 20.25 (CEST)
Lindanäs
[redigera wikitext]Boten försöker ju hitta svenska namn på platser och använder dessa i artiklarna. Ibland lyckas den lite för bra . För Estlands huvudstad har den, helt korrekt om än lätt obsolet, grävt fram det gamla svenska namnet Lindanäs -- se Riisupi Oja. Får nog bli en liten handfix här... Lsj (diskussion) 4 september 2015 kl. 18.35 (CEST)
- Och på Kuressaare (olika betydelser) hade den hittat det gamla tyska namnet Arensburg som omdirigerar till just Kuressaare... Jag vill minnas att vi haft en, kanske flera, diskussioner om användning av sådana svenska namn i Finland, som anses föråldrade. Med tanke på estlandssvenskans tynande tillvaro torde svenska namn där kunna vara än mer problematiska som uppslagsord. Vore kanske bra om estniska namn normalt ges företräde framför svenska, tyska och ryska? Pingar @K9re11, LPfi:. Taxelson (diskussion) 5 september 2015 kl. 18.45 (CEST)
- :-)
- Att använda estniskt namn för Dagö, Ösel, Runö m.fl. är inte lämpligt. Frågan är om dessa kan skiljas från fall som Lindanäs. Går det att kontrollera huruvida något av namnen finns som artikel och beskriver rätt plats? --LPfi (diskussion) 7 september 2015 kl. 23.40 (CEST)
Ryska
[redigera wikitext]I artikeln Balti Klint står Baltiysko-Ladozhskiy Ustup som ett alternativt namn. Jag antar att detta är ryska translittererat till engelska. Sådana namn kan i flera fall korrigeras (sh, ch, zh, kh->sj, tj, zj, ch, samt y->j eller ij så blir det oftast rätt), men jag vet inte om det går att programmera. Om inte, är det bättre att skippa sådana namn. Förgreningssidan Akh’ya är säkerligen någon bugg; jag misstänker (men kan ha helt fel) att stället på ryska heter Ахья, som på engelska är Akhya eller, om man är riktigt noggrann, Akh’ya. K9re11 (diskussion) 4 september 2015 kl. 18.58 (CEST)
- I GeoNames anges ryska som ett av Estlands inhemska språk. Därför tas ryska namn på estniska platser med i artiklar och grensidor. Lite störande att transkriberade namn fortfarande betecknas som "ryska" i GeoNames, men mycket svårt att på ett generellt sätt fixa med bot. Lsj (diskussion) 4 september 2015 kl. 20.17 (CEST)
- Då är det säkert bättre att skippa de ryska namnen, det är ju bättre med ingen information jämfört med felaktig information. K9re11 (diskussion) 4 september 2015 kl. 20.27 (CEST)
- Ja, det lär knappast göra några ester ledsna att ta bort ryskan ur artiklarna. Lite sent för grensidorna bara, men där gör det inte samma skada. Men problemet torde dyka upp igen i andra länder i det som ryssarna kallar "det nära utlandet". Lsj (diskussion) 4 september 2015 kl. 20.30 (CEST)
- Det var visst inte så enkelt heller. Vissa ryska namn står utan språkangivelse, och då "vet" inte boten att de är ryska, utan tror att det är stavningsvarianter av det estniska namnet. T.ex. Pimzha för Piusa. Lsj (diskussion) 4 september 2015 kl. 20.49 (CEST)
förekommer av något skäl den mindre lyckade länken till Åre (församling). Taxelson (diskussion) 4 september 2015 kl. 19.05 (CEST)
- Åre församling saknade nog geonames-id på Wikidata där, det är annars bästa sätter att se överenstämmelser mellan en artikel och en databaspost. -- 78.73.94.165 4 september 2015 kl. 19.17 (CEST)
- Javisst, och kanske (användbara) koordinater. Möjligen också någon oväntad kategorisering - vad vet jag. Jag bara buggrapporterar då tillgången till sådana är nödvändiga i de flesta komplexa programmeringprojekt. Sedan är det upp till Lsj att ta ställning till om det är något som kan/behöver åtgärdas :-) Taxelson (diskussion) 4 september 2015 kl. 19.38 (CEST)
- Ja, utan vare sig koordinater eller wikidata-objekt, och dessutom med ett annat artikelnamn än Geonames-namnet, har boten ingen vettig möjlighet att "veta" att Åre församling handlar om rätt plats. I sådana fall är dubletter tyvärr oundvikliga. Lsj (diskussion) 4 september 2015 kl. 20.12 (CEST)
- Frågan är om det för svenskt vidkommande finns fler "... (församling)" och liknande (socken, kommun, län, domsaga), och hur vi bör förfara med dessa då ju Sverige redan har full täckning för sådana entiteter genom Ygers och andras försorg. De heter ju, eller finns med på grensidan för, "...s församling" med sedvanlig genitivkomplikation för ortnamn på vokal. Kanske inte riktigt lönt att tynga botkoden med, men en plan för att åtgärda dessa systematiskt vore bra. Kanske effektivast att låta det bero tills grensidorna för Sverige är skapade och då kolla alla botskapade grensidor som överensstämmer med församlings och sockennamn med och utan prickar över a och o? Eller kanske en statisk projektsida med en stor tabell med församlingars etc namn i olika varianter, som efterhand som boten avancerar blir blålänkade och då kan fixas? Bättre förslag?
- Ja, utan vare sig koordinater eller wikidata-objekt, och dessutom med ett annat artikelnamn än Geonames-namnet, har boten ingen vettig möjlighet att "veta" att Åre församling handlar om rätt plats. I sådana fall är dubletter tyvärr oundvikliga. Lsj (diskussion) 4 september 2015 kl. 20.12 (CEST)
- Javisst, och kanske (användbara) koordinater. Möjligen också någon oväntad kategorisering - vad vet jag. Jag bara buggrapporterar då tillgången till sådana är nödvändiga i de flesta komplexa programmeringprojekt. Sedan är det upp till Lsj att ta ställning till om det är något som kan/behöver åtgärdas :-) Taxelson (diskussion) 4 september 2015 kl. 19.38 (CEST)
- Taxelson (diskussion) 4 september 2015 kl. 20.53 (CEST)
- Just svenska domsagor finns det inte så många, och de som finns ska vara rätt länkade i Wikidata. Det är främst kommuner, församlingar och socknar i Geonames om Sverige som har det här problemet. Det finns också samebyar med det här problemet, men de är också "fixade" om Lsj kör med en uppdaterad dump av Wikidata. Men domsagor, samebyar mm tillhör Geonames-kategorier som vi (eller rättare Lsj) har valt att exkludera. -- Innocent bystander 4 september 2015 kl. 21.01 (CEST)
- Taxelson (diskussion) 4 september 2015 kl. 20.53 (CEST)
Fgura (och Malta i allmänhet)
[redigera wikitext]På Diskussion:Fgura_(samhälle_i_Malta) har det framlagts ett antal kommentarer om både den orten specifikt och om Malta i allmänhet. Jag har inte personligen tittat i materialet för Malta (för att jag inte vet var man hittar det), men som bekant är ju Malta en önation. Ön består av två huvudöar. Dessa gemensamt kallas "Maltese Islands" på engelska, en artikelrubrik som på engelska Wikipedia omdirigeras till Malta. Därför känns det som att det blir tokigt när Geonames bara definierar en ort till att ligga på "Maltese Islands", då detta ju är hela Malta. När det inte är mer specifikt än så bör roboten undvika att nämna det.
Vidare, angående särskiljningsleden, är inte "i Malta" (som för övrigt kanske är sakligt korrekt men antagligen inte idiomatisk svenska) lite överdrivet? Så länge det inte finns andra ortnamn (och ortnamn på Malta är oftast unika eftersom det är ett relativt unikt språk) som konfliktar, borde inte särskiljningarna (ort) och (kommun) räcka? Om man nu alls behöver särskiljningsled. I svenska Wikipedias barndom låg alla kommunartiklar under antingen (kommun) eller huvudordet (utan kommun) medan tätorten med samma namn låg under (ort) eller (tätort). Några år senare ändrade vi ordningen till den nuvarande där orten i princip alltid är prioriterad på huvudordet och kommunen ligger under "x kommun". Varför måste vi då göra såhär för Malta (och rimligen andra länder) och alltid skapa en grensida med två artiklar, som handlar om kommunen och tätorten. Borde det inte räcka med hänvisningar till kommunen längst upp i artikeln om orten? /Grillo (diskussion) 5 september 2015 kl. 07.25 (CEST)
- I sådana här fall, där "orten" är en del av ett storstadsområde (administrativ gräns) finns väl heller ingen poäng med att skilja på ort och kommun, då det i praktiken är samma sak. Lite som att Solna inte utgörs av någon tätort. /Grillo (diskussion) 5 september 2015 kl. 07.38 (CEST)
- Det där med Maltese Islands blev fel, medges. Boten rörde ihop ögruppen med huvudön. Däremot blev det rätt på ön Gozo, se t.ex. Ras il-Wardija. Den här typen av fel är hur som helst lätta att fixa med bot.
- Har fixat Maltese Islands nu, så att det istället står att platserna ligger på ön Malta. Lsj (diskussion) 5 september 2015 kl. 21.32 (CEST)
- För de allra flesta svenska kommuner har vi separata artiklar för kommun och centralort, och ofta även en grensida. Så även för Solna: Solna (bebyggelse), Solna kommun, Solna (olika betydelser). Varför skulle Lsjbot inte följa det mönster som är vedertaget på svwp?
- Det där med Maltese Islands blev fel, medges. Boten rörde ihop ögruppen med huvudön. Däremot blev det rätt på ön Gozo, se t.ex. Ras il-Wardija. Den här typen av fel är hur som helst lätta att fixa med bot.
- Särskiljningsled kan man diskutera hur utförliga de ska vara, liksom vilket uppslag som ska ha företräde till ett namn. Boten är medvetet konservativt programmerad här, den särskiljer hellre för mycket än för lite, och ger sig absolut inte in på att försöka avgöra pommf. Finns det flera anspråk på samma namn gör boten en grensida.
- Lsj (diskussion) 5 september 2015 kl. 19.07 (CEST)
- Det där med "i Malta" kontra "på Malta"... jag minns redigeringskrig och långa diskussioner mellan "i" och "på" bl.a. Island. Jag tänker inte ge mig in i det minfältet med boten, utan kör konsekvent "i" alla länder, vilket är korrekt svenska om än inte alltid idiomatiskt. Lsj (diskussion) 5 september 2015 kl. 19.51 (CEST)
- Jag skulle inte säga att det finns konsensus för en artikel som Solna (bebyggelse). Den skapades av Yger 2014 och har i princip enbart redigerats av honom. Texten är i princip en ren kopia av det som redan finns i kommunartikeln. Jag tycker att det är onödig dubblering av info som redan finns på annan plats. Närliggande Sundbyberg följer ett annorlunda mönster... Eftersom vi av robotartiklarna inte kan förvänta oss någon information i närmare detalj, vad är det du tänker dig ska skilja mellan artikeln om Fguras kommun och Fguras bebyggelse (samhälle blir förresten då också ett missvisande särskiljningsled)? Förresten låg koordinaten som sagt i Tarxiens kommun...
- Det här med särskiljningsleden är ett skäl till att jag tycker att det här går helt för fort. Hade det funnits lite tid för manuella redigeringar mellan varje botkörning (som typ 1000 artiklar, en veckas redigeringstid osv) så hade sådana här problem kunnat lösas under den tiden. Nu blir det så många artiklar med så många småproblem att det blir svårt att överblicka. Och kom inte och säg att problem som handlar om fel i källan är lätta att lösa med robot, för så är det inte. Snarare blir källfel svårare att upptäcka när det inte är någon som tittar manuellt i källan. Då hade man exempelvis vid kontroll av koordinaten lätt upptäckt att det inte handlar om nåt "övergivet samhälle" plus det faktum att koordinaten låg helt fel. Man hade också lätt kunnat se om det var helt fel invånarantal, som tagits upp längre upp på den här sidan. Ang. koordinatfel har jag iaf ett konkret förslag: kontrollera koordinaten mot kommungränserna i Openstreetmap. /Grillo (diskussion) 6 september 2015 kl. 07.06 (CEST)
- Solna som tätort finns som begrepp, men har inte existerat i SCB's rapporter sedan första halvan av 1900-talet.
- Men det finns även andra varianter som är fullt möjliga som artikelbegrepp. Vill minnas att vi hade någon sffr om postorter för ett gäng år sedan. Sådana artiklar har inte blivit vanligare, men jag har sett länkar till sådant som Noraström. (Den länk som leder från Noraströms landskommun är fel, kommunhuset i Noraströms kommun låg enligt infödingarna i Rossvik.)
- Identifiera kommungränserna i OSM är nog inte så lätt. Det är redan svårt att koppla samman geonames-id med Wikipedia/Wikidata. Vad finns i OSM som gör att det går att koppla samman dess gränser med Geonames? -- Innocent bystander 6 september 2015 kl. 08.49 (CEST)
- @Grillo: Jag har hållit på sedan april på det sättet du förordar, med korta provserier som har nagelfarits. Sedan har provserierna raderats, botkoden reviderats, och artiklarna skapats om med ny kod. Det har varit en mycket lång process där även särskiljningsleden har granskats och reviderats flera gånger. Många andra användare har engagerat sig i att göra artiklarna bättre, och kommit med konstruktiva förslag och synpunkter. Lsj (diskussion) 6 september 2015 kl. 10.00 (CEST)
- Jag länkade till en kommungräns ovan. Jag kan inte koda. Vill någon skapa artiklar automatiskt är det rimligen den som måste se till att artiklarna uppnår våra grundkriterier. Går detta inte att garantera bör projektet förmodligen inte genomföras. Det är inte den som ifrågasätter om det går att göra som ska se till att det blir gjort. /Grillo (diskussion) 6 september 2015 kl. 10.41 (CEST)
- Lsj, vi som bara håller koll sporadiskt på vad som händer på svwp nuförtiden har ingen chans att hålla koll. Det kändes som att det här projektet startade för bara några dagar sedan (jag vet att det var längre än så) och nu helt plötsligt är det 2 miljoner-eufori. Artiklarna skapas i mycket högre takt än vad det är möjligt att granska dem. Jag VET att jag säkert uppfattas som en gnällspik men jag tycker det är oroväckande när inte tillräckligt många reagerar på vad jag upplever är en kvalitetssänkning. Kan vi inte garantera att artiklarna håller måttet (vilket de uppenbarligen inte gör) ska de inte heller skapas. /Grillo (diskussion) 6 september 2015 kl. 10.41 (CEST)
- Det jag sett är envisa diskussioner på Wikidata om huruvida det går att koppla Wikidata med OSM eller inte. Hittills har man kommit fram till att det inte går. Har du någon information i egenskap av OSM-användare som kan vara användbar?
- På den här sidan finns det en 400k tecken lång historik. Det är två gånger större än BB är idag, och ändå har inte alla diskussioner hållts här. Hur mycket mer kvalitetsgranskning vill du ha? -- Innocent bystander 6 september 2015 kl. 10.49 (CEST)
- Koordinaterna för kommunen Il-Fgura (kommun i Malta) ligger mitt kommunen, precis där OSM skriver "Fgura" på kartan. Koordinaterna för det "övergivna samhället" ligger några hundra meter därifrån, strax utanför kommungränsen. Nära de koordinaterna finns gamla ruiner - man kunde nästan tro att GeoNames ger korrekta koordinater för den övergivna förhistoriska platsen . Och ja, om man vill kunna påverka vad som händer så måste man faktiskt hänga med i vad som händer. Artiklar har skapats i många omgångar i kontrollerbar takt under sommaren. Vad kvalitet beträffar tycker jag nog de botskapade står sig ganska gott jämte de människoskapade konkurrenterna om 2M-titeln. Är Terry Farrell (#2000001) eller Joe Gomez (#2000004) verkligen skyhögt överlägsna Iro (berg) (#2000000)? Lsj (diskussion) 6 september 2015 kl. 11.40 (CEST)
- Koordinaterna pekar alltså på den gamla feniciska boplatsen. Varför beskriver då Wikipedia den platsen som en plats med 11 000 invånare? Det är såna här problem jag menar att roboten måste klara av att tolka. Eftersom jag förstår att det är orimligt menar jag att tanken på att robotskapa artiklar om orter inte fungerar. Detta är en invändning jag kom med i uppstarten av det här projektet. Jag var inte ensam om min skepticism gentemot Geonames (som egentligen inte är bättre som källa än Wikipedia eller IMDB), men trots detta genomfördes projektet. Jag förstår fortfarande inte varför det här projektet inte istället använt lokala statistiska myndigheter som källa. När sådana inte finns tillgängliga eller inte är pålitliga skapar man rimligen inga artiklar. /Grillo (diskussion) 6 september 2015 kl. 12.28 (CEST)
- Koordinaterna för kommunen Il-Fgura (kommun i Malta) ligger mitt kommunen, precis där OSM skriver "Fgura" på kartan. Koordinaterna för det "övergivna samhället" ligger några hundra meter därifrån, strax utanför kommungränsen. Nära de koordinaterna finns gamla ruiner - man kunde nästan tro att GeoNames ger korrekta koordinater för den övergivna förhistoriska platsen . Och ja, om man vill kunna påverka vad som händer så måste man faktiskt hänga med i vad som händer. Artiklar har skapats i många omgångar i kontrollerbar takt under sommaren. Vad kvalitet beträffar tycker jag nog de botskapade står sig ganska gott jämte de människoskapade konkurrenterna om 2M-titeln. Är Terry Farrell (#2000001) eller Joe Gomez (#2000004) verkligen skyhögt överlägsna Iro (berg) (#2000000)? Lsj (diskussion) 6 september 2015 kl. 11.40 (CEST)
- Lsj, vi som bara håller koll sporadiskt på vad som händer på svwp nuförtiden har ingen chans att hålla koll. Det kändes som att det här projektet startade för bara några dagar sedan (jag vet att det var längre än så) och nu helt plötsligt är det 2 miljoner-eufori. Artiklarna skapas i mycket högre takt än vad det är möjligt att granska dem. Jag VET att jag säkert uppfattas som en gnällspik men jag tycker det är oroväckande när inte tillräckligt många reagerar på vad jag upplever är en kvalitetssänkning. Kan vi inte garantera att artiklarna håller måttet (vilket de uppenbarligen inte gör) ska de inte heller skapas. /Grillo (diskussion) 6 september 2015 kl. 10.41 (CEST)
- Jag länkade till en kommungräns ovan. Jag kan inte koda. Vill någon skapa artiklar automatiskt är det rimligen den som måste se till att artiklarna uppnår våra grundkriterier. Går detta inte att garantera bör projektet förmodligen inte genomföras. Det är inte den som ifrågasätter om det går att göra som ska se till att det blir gjort. /Grillo (diskussion) 6 september 2015 kl. 10.41 (CEST)
Commonscat
[redigera wikitext]Ibland läggs det in en Commonscat-länk. Då ska det väl läggas in en "Externa länkar"-rubrik före. Svensson1 (diskussion) 5 september 2015 kl. 10.26 (CEST)
- Så sant så. Lsj (diskussion) 5 september 2015 kl. 11.31 (CEST)
Varför numrerade listor i förgreningssidorna?
[redigera wikitext]Finns det något särskilt övervägande för att det är numrerade listor och inte som annars är brukligt, punktlistor i de botskapade grensidorna. Frågan uppkommer när man slår ihop eller kompletterar en botskapad med en befintlig, som i t.ex Alva (som just nu är inkonsekvent). Taxelson (diskussion) 5 september 2015 kl. 10.57 (CEST)
- Jag avsåg denna verison av Alva. Uppenbarligen finns det olika uppfattningar om hur det borde se ut... Taxelson (diskussion) 5 september 2015 kl. 11.47 (CEST)
- Numren används i kartorna på grensidan. Lsj (diskussion) 5 september 2015 kl. 11.29 (CEST)
- Ja, förstås. Och då bör alltså nya geografiska saker antingen läggas till även i kartmallen (inte så lätt att göra för hand), eller läggas till som punkter (*) inte nummer (#). På detta kommer antagligen fler än jag att snubbla. Är det kanske läge för en instruktion som kommentar som syns bara i redigeringsläge? Taxelson (diskussion) 5 september 2015 kl. 11.38 (CEST)
- Går att göra en kommentar enkelt nog. Har du förslag på formulering? Lsj (diskussion) 5 september 2015 kl. 18.51 (CEST)
- Sådana texter tycker jag är lite svåra att få till, men ett första förslag kanske kunde vara ungefär: NOTERA: Om platser läggs till, tas bort eller ordningen på platserna ändras, bör också mallen Kartposition under samma rubrik korrigeras för att kartan ska förbli rättvisande. Taxelson (diskussion) 5 september 2015 kl. 19.01 (CEST)
- Tack. Inlagt i koden nu, kommer med i nästa omgång. Lsj (diskussion) 5 september 2015 kl. 19.55 (CEST)
- Sådana texter tycker jag är lite svåra att få till, men ett första förslag kanske kunde vara ungefär: NOTERA: Om platser läggs till, tas bort eller ordningen på platserna ändras, bör också mallen Kartposition under samma rubrik korrigeras för att kartan ska förbli rättvisande. Taxelson (diskussion) 5 september 2015 kl. 19.01 (CEST)
- Går att göra en kommentar enkelt nog. Har du förslag på formulering? Lsj (diskussion) 5 september 2015 kl. 18.51 (CEST)
- Ja, förstås. Och då bör alltså nya geografiska saker antingen läggas till även i kartmallen (inte så lätt att göra för hand), eller läggas till som punkter (*) inte nummer (#). På detta kommer antagligen fler än jag att snubbla. Är det kanske läge för en instruktion som kommentar som syns bara i redigeringsläge? Taxelson (diskussion) 5 september 2015 kl. 11.38 (CEST)
Platser med sammanhang
[redigera wikitext]I Port (egentligen Port (olika betydelser) men sammanslagen) skapades en artikel för kommunen Port, Ain och en för orten Port, Ain som har ändrats till röd länk Port, Ain (ort) eftersom det fanns olika geoname. Dessa två platser har sammanhang och en är delmängd till den andra. Orten har #* och då visas den som underordnad till kommunen. Jag tycker att allt som har denna typ av sammanhang bör visas på detta sätt. Mest för att skribenter ska tänka till vilken är det som åsyftas. En annan sak är om orten behövs eftersom vad jag kan se finns den inte på franska wiki. Maundwiki (diskussion) 21 januari 2016 kl. 23.10 (CET)
Narvskoye Vodokhranilishche
[redigera wikitext]Lsjbot har skapat artikeln Narvskoye Vodokhranilishche, vilket är det ryska namnet translittererat till engelska. GeoNames är på engelska, så det är naturligt att de translittererar till engelska, men varför de använder det ryska namnet har jag ingen aning om. I varje fall borde artikeln heta Narva Veehoidla (som nu är en omdirigering), eller ha något svenskt namn. K9re11 (diskussion) 5 september 2015 kl. 19.02 (CEST)
- Ja, det borde den. Tyvärr tycks det vara ett allmänt problem i GeoNames-filen för just Estland att platsnamnen inte är korrekt taggade med vilket språk de är på, så boten har inget bra sätt att "veta" att det GeoNames anger som huvudform är transkriberad ryska. Lsj (diskussion) 5 september 2015 kl. 19.46 (CEST)
Interwikilänkar
[redigera wikitext]På sidor som Agu (berg) och Province of West Equatoria finns länkar till cebuanospråkiga artiklar som ännu inte skapats. Har du för avsikt att skapa artiklar också på cebuano, och är länkarna tillfälligt där för att sedan flyttats till Wikidata, eller är det en bugg? K9re11 (diskussion) 5 september 2015 kl. 20.36 (CEST)
- Flyttarna till Wikidata sköts ganska väl av andra robotar. De kan dock inte hantera "röda" interwikilänkar.
- Det krävs en omständig ansökningsprocedur för att få köra robot på Wikidata. Nuvarande system tycker jag fungerar väl, så jag ser inga problem med att Lsj fortsätter på samma sätt.
- Artiklar som står själva, utan interwiki, tar det några veckor för robotarna innan de läggs in. Detta för att slippa radera på Wikidata i onödan om artiklarna snabbraderas inom 2-3 veckor från det att de skapas. Det här görs för att det finns vissa procedurer på vissa andra stora projekt, inte för att artiklarna kan raderas hursomhelst här. -- Innocent bystander 6 september 2015 kl. 08.56 (CEST)
- Lsjbot kör parallellt på svenska och cebuano. Notera att interwikilänkarna inte längre är röda, cebuano-artiklarna skapades också i natt. Jag lägger in iw-länkar mellan de två språken direkt, även om det kan ta några timmar eller dagar mellan ceb-och sv-körningarna -- mycket pålitligare att göra på det viset, jag kan vara säker på att länka ihop rätt artiklar. Lsj (diskussion) 6 september 2015 kl. 09.37 (CEST)
Platt OCH bergig ?
[redigera wikitext]Om Iro (berg) sägs att omgivningen är både platt och har ovanligt många namngivna berg. Likaså att omgivningen är platt och innehåller en punkt som är 600 meter högre. För mig känns det motsägelsefullt. --Ettrig (diskussion) 6 september 2015 kl. 12.16 (CEST)
- Har just svarat på din fråga på wp:BB. Lsj (diskussion) 6 september 2015 kl. 12.42 (CEST)
Algoritmen för platthet etc
[redigera wikitext]Jag hittar ingen beskrivning av din algoritm just nu - antagligen för att jag tittar för dåligt, och har kanse helt missat hur den fungerar, och ber i så fall om ursäkt för det. <100 m nivåskillnad inom en viss (vilken?) radie är platt. Vet inte om du då tittar på alla punkter inom det definierade området. Jag misstänker att Brösarp skulle riskera att kallas platt, och det är väl inte det intrycket den som varit där fått av platsen? Landskapet är ju synnerligen backigt! Jag funderar därför på om en framkomlig väg inte vore att ta fram förslagsvis fyra markprofiler utmed diagonalerna genom cirkeln med den beskrivna platsen i centrum (lämplig radie är jag inte klar över - 3 till 10 km beroende på platstyp?) i riktningarna N-S,NE-SW,E-W,SE-NW och sedan karaktärisera området utifrån dessa samples som "flackt", "backigt", "bergigt", "flackt med berg i SW" (etc), ["Flackt med markerad dalsänka"] (svårt att skilja från enstaka gropar), och "sluttar svagt|kraftigt åt [väderstreck]". Det man kan fånga i dessa markprofilsamples är terrängens småskaliga höjdvariation (låt säga 5-25 m) som ju är mycket betydelsefullt om man är omgivna av stigningar i storleksordningen 1% eller 30%. Jag inser förstås att det är mycket arbete med att koda en sådan algoritm. Taxelson (diskussion) 7 september 2015 kl. 08.53 (CEST)
- Tänkte lite vidare:
- Om jorden är rund och 90°=1*10^7 m så är 3" NS 3*10^7/(90*60*60)= 92,6 m. Detta är vad jag förstås avsåndet mellan de tillgängliga höjdpunkterna.
- Vi har alltså tillgång till en höjd/93 meter i NS, och 1/cos (lat) så många i WE. På skrå blir det förstås längre mellan punkterna. Mitt förslag är att man för att kunna göra en användbar tvärsnittskurva med så lagom mycket information som möjligt lägger ut punkterna efter en linje med t.ex 50 m mellanrum, och sedan interpolerar höjden för varje punkt med hjälp av ett viktat medelvärde för omkringliggande 4 tillgängliga punkter. Om radien på det undersökta området är måttligt, t.ex 5 km (diametern=10 km eller 0,1°) så bör man i detta sammanhang kunna bortse från jordens krökning och räkna med att punkterna ligger 1/cos (latitudcentrum) gånger så tätt i x-ledd jämfört med y-ledd. Att linjerna blir en aning krökta spelar ingen roll i detta sammanhang. De intressanta punkterna kan man hitta med t.ex följande skript (exempel finns i min sandlåda(s historik):
<?PHP
$y0=60.61;//
$x0=15.63;//exempel Falun
$xkoff=cos($y0*pi()/180);
$radie=1000; //radie på undersökningsområde i m
$dist=80; //distans i meter mellan punkterna där interpolerade höjdvärden ska tas fram
$ndiam=6; // antal diametrar som ska undersökas. ger bäring α=Π/$ndiam till andra diameterns startpunkt i NE etc.
$n=2*$radie/$dist;
//90 grader=10000 km --> 1 km=9/1000= 0.009 grader
$radieD=$radie*0.009/1000;
echo "<br/><textarea>{{geoLänk}}\n";
for($diamn=0; $diamn<$ndiam; $diamn++){
$alfa=$diamn*pi()/$ndiam; //startpunktens bäring
$ystart=$radieD*cos($alfa);
$xstart=$radieD*sin($alfa)/$xkoff;
$xdist=2*$xstart/$n;
$ydist=2*$ystart/$n;
for ($i=0; $i<$n+1; $i++){
$x[$diamn][$i]=$x0+$xstart-$i*$xdist;
$y[$diamn][$i]=$y0+$ystart-$i*$ydist;
echo "# {{coord|".round($y[$diamn][$i],7)."|".round($x[$diamn][$i],7)."|}}\n";
}
}
echo "</textarea>";
//Nästa steg är att hämta upp de fyra omkringliggande höjdpunkterna från källan och interpolera (beräkna det viktade medlvärdet) för önskad punkt.
?>
- Att räkna längs diametrar är en möjlig metod, men den använder bara en bråkdel av den tillgängliga informationen. Nuvarande algoritm har två komponenter:
- Räkna ut variansen kring medelhöjden för alla pixels inom en viss radie (10 km använder jag nu). Liten varians klassas som platt, medium som kuperad, och hög som bergig. Jag tror det mesta av diskussionen kring det här sydsudanska berget beror på att jag satte tröskelvärdet mellan "platt" och "kuperad" för högt. Men jag skäms inte alltför mycket för det -- förutom Iro och ett gäng andra bergknallar är terrängen i området platt som en pannkaka, framförallt söderut.
- Dela in omgivningen i åtta "tårtbitar", en i varje väderstreck (N, NO, O, SO...). Räkna ut medelhöjden i varje tårtbit. Använd dessa 8 medelhöjder, tillsammans med höjden för själva platsen, för att avgöra om terrängen är jämnt sluttande, konkav, eller konvex. Om terrängen är konkav klassas det som en dal, och konvex som en höjd. Terrängformens huvudriktning fås ur samma beräkning. Det kan bli såhär i en artikel: Lisec (berg i Makedonien, lat 41,75, long 21,53).
- Jag har funderat på flera sätt att utvecklas det här. En sak jag vill göra är att kolla terrängvariansen separat i varje tårtbit, för att kunna säga att "terrängen söder om X är platt, men norr om X är den kuperad" (vilket hade stämt bättre för Iro). En annan sak att göra är att för berg räkna ut inte bara höjd över havet utan även höjd över omgivande terräng (primärfaktor), liksom vilket berg som en utlöpare hör till, och vilka berg ett bergspass går mellan.
- Men innan jag gör något alls i den här riktningen vill jag se konsensus för att det faktiskt är ok att göra sådant här. Diskussionen på Bybrunnen om "egen forskning" finner jag både märklig och otrevlig, den lägger en våt filt över alla försök att skriva botartiklar som har någon substans i brödtexten (tack för ditt stöd där!). Innan den diskussionen har landat tänker jag inte lägga tid på att skriva kod som jag kanske inte får använda. Lsj (diskussion) 7 september 2015 kl. 20.12 (CEST)
- Tack för intressant beskrivning av metoden. Jag är väl präglad av min dendrokronologiska erfarenhet, där vi gillar att analysera serier med ett värde för varje år, och tvätta bort det mesta av den storskaliga informationen/långsiktiga trenderna, för att titta på överensstämmelser i den kortsiktiga variationen, år från år. Det är denna bias som gör att jag misstänker att din algoritm inte ser om ett landskap är småkulligt, som t.ex Brösarp och liknande. Men jag kan givetvis ha fel, då jag inte känner din metod tillräckligt (och min är bara ett utkast, som inte testats, ju).
- När det gäller bybrunnendiskussionen är resonemangen från somliga nedslående. För geografiska ämnen är olika slags kartdata nästan alltid den tillförlitligaste källan, men måste tolkas. Slår man ner på algoritmutvecklandet - d.v.s vad vi systematiskt tittar efter i kartdatat - så är det egentligen kartdata som källmaterial man underkänner, trots att det är en både säkrare och mer lättillgänglig källa än en textbaserad beskrivning. Eller handlar detta gnabb i verkligheten om att man möjligen kan acceptera berg, sjöar och småbyar om de ligger någorlunda nära det svenska, men inte millioner liknade artiklar för platser i Långtbortistan. Eller kanske är det spänningen mellan naturvetenskap och humaniora som kommer i dagern. Jag hoppas verkligen att alla-platserprojektet kan fortsätta även om jag säkert kommer att fortsätta vara kritisk och ifrågasätta detaljer! Taxelson (diskussion) 7 september 2015 kl. 21.57 (CEST)
- Att räkna längs diametrar är en möjlig metod, men den använder bara en bråkdel av den tillgängliga informationen. Nuvarande algoritm har två komponenter:
- Konstruktiv kritik som syftar till att förbättra artiklarna uppskattar jag, och tar gärna till mig. Men inte all kritik de senaste dagarna har varit konstruktiv... Jag tycker också det är mycket märkligt att en text med subjektiva omdömen om en plats skulle vara värd mer som källa än en transparent och reproducerbar analys av kartdata.
- Jag tror din dendrokronologiska prägling syns mest i att du föreslår en i grunden endimensionell analys av tvådimensionella data :) Min egen bakgrund i partikelfysik lyser säkert igenom på sitt sätt också. Annars har du helt rätt i att min metod har en bias till förmån för stora terrängmönster och bortser från småkrusningar. Värt att fundera på vad man kan göra åt det. Det vore både kul och matematiskt korrekt, men en hel del jobb, att göra en tvådimensionell fourieranalys av terrängen. Ett enklare sätt vore att göra statistik över höjdskillnaden mellan angränsande pixels, vilket skulle ha motsatt bias mot den nuvarande algoritmen. Skulle gå att generalisera till en allmän korrelationsfunktion mellan pixlar som funktion av avståndet mellan dem. Lsj (diskussion) 7 september 2015 kl. 22.14 (CEST)
- Borde det inte gå att ta medellutningen uträknat på de olika punkterna och använda? det borde ge samma värde för stora och små krusningar. Men dina metoder för att se generell lutning och konkava och konvexa ytor låter också intressant. --افيراتير (diskussion) 7 september 2015 kl. 22.36 (CEST)
- Wikipedianer har ett konstigt sätt att tolka globalt perspektiv och egenforskning. Att själv gå ut med ett mätinstrument och mäta höjden på ett berg är egenforskning. Om man däremot hämtar höjduppgifterna från en karta är det inte egenforskning utan avläsning av källbelagda uppgifter. Beträffande globalt perspektiv tolkar jag det som att man ska skriva artiklar som om man vore en världsmedborgare utan koppling till platsen/ämnet.
- Jag har inga problem med hur höjddatan används i artiklarna, men för framträdande berg vore primärfaktorn intressant. Hur man tar reda på den på något enkelt sätt har jag ingen aning om och propsar inte på att primärfaktorn ska tas fram. Nasko (✉) 7 september 2015 kl. 23.20 (CEST)
- För berg som är någorlunda stora jämfört med upplösningen i höjddata (90 meter horisontellt) är det ganska rättframt att räkna ut en ungefärlig primärfaktor ur höjddata. Jag tänker koda och lägga till det så snart vi har konsensus att det är ok med sådana här beräkningar. Lsj (diskussion) 8 september 2015 kl. 20.58 (CEST)
- Fixat Se Koonsebierg. Lsj (diskussion) 11 september 2015 kl. 22.02 (CEST)
- Lite från ingenstans, men... apropå diskussionen på Bybrunnen och ovan: vad människor i praktiken kallar platt kan väl vara rätt subjektivt (eller intersubjektivt, till och med). Min tanke när jag såg frågeställningen och diskussionen om ”platt“ var att man eventuellt skulle byta ordval.. ”terrängen har inga höga/stora/större variationer i höjd”, eller något annat som verkligen ligger nära uträkningen/bedömningen? Det ligger närmare källan, och ger mindre risk att uppfattas som missvisande, är min tanke. flinga 9 september 2015 kl. 00.00 (CEST)
- Ja, det vore kanske inte så dumt med formuleringar i den stilen. Närmare källan förvisso, dock med risk för att vara mera svårtolkat och högtravande. Värt ett försök. Lsj (diskussion) 9 september 2015 kl. 00.15 (CEST)
- Det var i alla fall en tanke, ett uppslag till ett möjligt hanteringssätt. flinga 9 september 2015 kl. 00.21 (CEST)
Mall:robotinfoga
[redigera wikitext]{{robotinfoga}}
, hänvisar till Användare:Lsjbot/Namnkonflikter, men där finns bara arter, inga geografiska namn. Taxelson (diskussion) 7 september 2015 kl. 10.25 (CEST)
- Oj, glömde lägga in i den nya koden att uppdatera Användare:Lsjbot/Namnkonflikter. Ska fixas. Lsj (diskussion) 7 september 2015 kl. 18.45 (CEST)
- Fixat nu. Användare:Lsjbot/Namnkonflikter fylls på i rask takt. Lsj (diskussion) 11 september 2015 kl. 18.06 (CEST)
Dubbel karta i Filipinerna
[redigera wikitext]Hungduan och de tre andra som jag tittade på har två instansieringar av samma lägeskarta. Jag tycker det är en skönhetsfläck. Skulle det vara lätt att ta bort? --Ettrig (diskussion) 7 september 2015 kl. 12.23 (CEST)
- Om båda har samma filnamn så är det ganska lätt. Just här tror jag boten lurade sig på att filnamnet i ena fallet skrivs med mellanslag, i det andra med understreck, fast det är samma fil. Lsj (diskussion) 7 september 2015 kl. 14.13 (CEST)
Samma ort i två artiklar ?
[redigera wikitext]La Paz Centro förgrenar till två artiklar om samma ort. Skillnaden är att i den ena anses den vara en ort med den i den andra artikeln är en kommunhuvudort. Jag har inte stött på ordet kommunhuvudort förut. Men min intuition säger att en kommunhuvudort är en ort. "Kommunhuvudort" är i så fall snarast en egenskap hos en ort och en relation mellan orten och en kommun. I så fall har vi här två artiklar som handlar om samma objekt. --Ettrig (diskussion) 7 september 2015 kl. 17.24 (CEST)
- Ja, det ser ut som att GeoNames hade två poster om samma ort i olika roller. Men de har inte exakt samma position, och inte samma befolkning, så det är inte alldeles lätt att med bot avgöra att de är samma. Om detta är ett vanligt misstag kan jag försöka skriva kod för det.
- I många länder har varje administrativ enhet en utpekad huvudort (typ de svenska residensstäderna i varje län), vilket jag ser som relevant information i artiklarna om dessa orter. GeoNames anger detta i typkoden för platsen (den kod som GeoNames använder för att ange vilken sorts plats någonting är, om det är ett berg, en sjö, en ort, etc.). Jag använder sedan den typkoden i inledningsmeningen till varje artikel, där det står "X är en Y i land Z". I normalfallet har GeoNames bara en post om varje ort, som får typkod PPLA* om den är huvudort i en provins, kommun etc., och annars klassas den som "vanlig" ort (typkod PPL).
- Notera för övrigt att "kommunhuvudort" i artikeln länkar till Nicaraguas administrativa indelning, en artikel som borde finnas för varje land (och finns för väldigt många). Det är inte tänkt att vi ska separata artiklar om alla länders alla sorters huvudorter. Lsj (diskussion) 7 september 2015 kl. 18.38 (CEST)
- En fundering jag haft är om det är Härnösand som är residensstad i Västernorrland, eller om det är Härnösands kommun? -- Innocent bystander 8 september 2015 kl. 15.46 (CEST)
- Nej, med din förklaring ovan (dubbelt i GeoNames) tror jag inte att detta problem är vanligt. I de fall det upptäcks kan det med fördel rättas till för hand. --Ettrig (diskussion) 8 september 2015 kl. 15.52 (CEST)
- En fundering jag haft är om det är Härnösand som är residensstad i Västernorrland, eller om det är Härnösands kommun? -- Innocent bystander 8 september 2015 kl. 15.46 (CEST)
Tumbura Airport
[redigera wikitext]Tumbura Airport är en grensida med två identiska länkar. Något verkar ha hakat upp sig. Taxelson (diskussion) 8 september 2015 kl. 14.41 (CEST)
- Jag flyttade nu artikeln till grensidans plats men återställde historiken, så problemet ändå kan studeras. Taxelson (diskussion) 8 september 2015 kl. 14.46 (CEST)
- Mystiskt. Hur kan en sådan dubblering bara inträffa någon enstaka gång? Ska titta på koden igen. Lsj (diskussion) 8 september 2015 kl. 21.32 (CEST)
- Flygplatsen fanns för ett par månader sedan dubblerad i GeoNames, ett fel som rättades i senaste uppdateringen. Dubbleringen kom med i grenlistan men inte i artikelskapandet. Lsj (diskussion) 9 september 2015 kl. 11.39 (CEST)
Dubblerade floder
[redigera wikitext]Jumbana (wadi och våtmark i sydsudan) har tre poster, där två är samma fast olika kategoriserade (wadie och våtmark). Den andra wadien verkar vara ett biflöde till den förra. Motsvarande problem hittade jag på på floden Gauja (olika betydelser) (se historik). Det är riktigt bökigt att veta om det är samma eller olika floder, när koordinaterna är så olika - och jag har ingen bra lösning, annat än att endera avstå från artikel/grensideskapande på just floder (trist), eller lägga någon slags varningsmall, så att man kan hitta grensidorna med potensiellt dubblerade flodartiklar, d.v.s om samma namn (inklusive alternativnamn) återkommer på poster för andra floder, men också "annat vått" som sjöar, dammar, och våtmarker, med ett inbördes avstånd på under t.ex 100 km. Det bör givetvis också kollas över nationsgränser, så att det finns någon möjlighet att slå ihop vid behov. Jag kan annars föreställa mig Svartån (olika betydelser) och svallvågorna i denna, om samma dubblettproblem skulle finnas för Svenska vattendrag... Taxelson (diskussion) 8 september 2015 kl. 15.20 (CEST)
- Motsvarande problem i Lerum (olika betydelser) och kanske i Logoma, fast med Logoma är koordinaterna i västra sydsudanfallet så dåliga så åtminstone inte jag riktigt vågar säga vilken flod som avses. Det kan vara samma (den större söder om, men också något annat, mindre biflöde runt omkring. Finns det förresten någon generell källa över avrinningsområden i världen som skulle kunna användas för att ge något lite mer kött på dessa magra artikelben, eller ännu hellre koordinattåg över flodsträckningar inom dessa? @Innocent bystander, Nasko:, Taxelson (diskussion) 8 september 2015 kl. 16.03 (CEST)
- För Sverige del finns det bra källor (SMHI) för avrinningsområdena, men för en pommf-ig indelning av vattendragen skulle jag inte använda SMHI. Källan är tekniskt korrekt, ur hydrologisk synvinkel. Men det riskerar bli väldigt snuttifierat, med nya unika vattendrag mellan varje sjö och med namn som får nackhåren att resa sig. -- Innocent bystander 8 september 2015 kl. 16.22 (CEST)
- Ville annars minnas att det var tvärt om - att vattendragsnamnen generaliserades för mycket av SMHI. Det jag i detta sammanhang dock tänkte på var om det funnes någon användbar databas att kolla koordinater från GeoNames emot, och se om de ligger utmed samma flod. Hade man tillgång till datalagret som visas här, skulle det ju gå att avgöra om 1. koordinaterna är rimliga och 2. om de hör till samma flod, och (kanske) 3 peka ut en sträckning och länka ihop med byar berg och sjöar utmed vattendragets sträckning, åtminstone mellan de punkter som geomanes förhoppningsvis pekar ut, och faktiskt är delsträckor med samma namn och till sist också länka ihop biflöden och flodsträckor som hydrologiskt hänger ihop men har olika namn. Taxelson (diskussion) 8 september 2015 kl. 16.42 (CEST)
- I Europa (EU + lite till) finns det en del data[12]. För resten av världen är det värre. Fria globala data med stora brister i omfattningen finns här. För Europa och Nordamerika borde det gå att hitta mycket data. Datan kan dock vara utspridd. SMHI:s data är bra, men en smula nördig. I princip allt som finns i det hydrologiska nätverket går att ladda ner och använda. Hög kvalitet på allt utom namngivningen av vissa sjöar och vattendrag. Nasko (✉) 8 september 2015 kl. 20.17 (CEST)
- EU-länken har en licens som tyvärr inte är Wikipedia-kompatibel. Natural Earth har jag tittat på, jag laddade ner och provkörde en del, och deras data skulle i princip gå att använda. Det svåra vore att på ett pålitligt sätt koppla ihop Natural Earths floder med GeoNames-poster. Hittills har jag generellt valt bort att använda GIS-data i projektet, mest som ett sätt att hålla det inom rimliga gränser - jag har inte obegränsat med fritid. Men kanske det går att göra något enkelt med floderna, håller med om att de artiklarna är ganska trista som de är. Någonting jag dock tänker fortsätta att välja bort är datakällor som inte är världsomspännande. Att ge sig in i att avkoda 200+ länders nationella data vore fullständigt ogörligt för en person på rimlig tid. Det ser jag snarare som en naturlig fortsättning efter det här projektet, att den som är specialintresserad av ett visst land använder det landets nationella data för att förbättra botartiklarna. Lsj (diskussion) 9 september 2015 kl. 11.02 (CEST)
- Allt det ifrågasättande som det blivit av att jag använt DEM-data uppmuntrar inte heller till att ta in ytterligare sorters datakällor i projektet. Lsj (diskussion) 9 september 2015 kl. 11.06 (CEST)
- I Europa (EU + lite till) finns det en del data[12]. För resten av världen är det värre. Fria globala data med stora brister i omfattningen finns här. För Europa och Nordamerika borde det gå att hitta mycket data. Datan kan dock vara utspridd. SMHI:s data är bra, men en smula nördig. I princip allt som finns i det hydrologiska nätverket går att ladda ner och använda. Hög kvalitet på allt utom namngivningen av vissa sjöar och vattendrag. Nasko (✉) 8 september 2015 kl. 20.17 (CEST)
- Ville annars minnas att det var tvärt om - att vattendragsnamnen generaliserades för mycket av SMHI. Det jag i detta sammanhang dock tänkte på var om det funnes någon användbar databas att kolla koordinater från GeoNames emot, och se om de ligger utmed samma flod. Hade man tillgång till datalagret som visas här, skulle det ju gå att avgöra om 1. koordinaterna är rimliga och 2. om de hör till samma flod, och (kanske) 3 peka ut en sträckning och länka ihop med byar berg och sjöar utmed vattendragets sträckning, åtminstone mellan de punkter som geomanes förhoppningsvis pekar ut, och faktiskt är delsträckor med samma namn och till sist också länka ihop biflöden och flodsträckor som hydrologiskt hänger ihop men har olika namn. Taxelson (diskussion) 8 september 2015 kl. 16.42 (CEST)
- För Sverige del finns det bra källor (SMHI) för avrinningsområdena, men för en pommf-ig indelning av vattendragen skulle jag inte använda SMHI. Källan är tekniskt korrekt, ur hydrologisk synvinkel. Men det riskerar bli väldigt snuttifierat, med nya unika vattendrag mellan varje sjö och med namn som får nackhåren att resa sig. -- Innocent bystander 8 september 2015 kl. 16.22 (CEST)
- Natural Earth har tyvärr bara data för de största floderna i världen, sådana som sannolikt redan har artiklar på svwp. Tveksamt om det är värt besväret att använda deras data. Här bredvid är en karta. Lsj (diskussion) 9 september 2015 kl. 22.42 (CEST)
- Det högst två promille av floderna i GeoNames som det finns data för i NaturalEarth. Det enda av Sydsudans tusentals vattendrag som finns där är Nilen. Lsj (diskussion) 9 september 2015 kl. 23.18 (CEST)
Lite erkänsla också
[redigera wikitext]Jag tycker det är mycket bra med den intensiva diskussionen som kommit upp på slutet och de många relevanta exemplen på tveksamheter som påpekats. Jag skulle då ändå också ta upp några erkännande jag tycker är värt ha med. Off list har jag tex fått detta från en i USA thanks for your leadership on the bot-driven experiments of large-scale article creation. Jag tycker också jag sett flera som gett erkänsla åt artiklarnas gedigenhet och att de är bättre än de flesta manuellt skapade stubbar. Också har jag inte set någon generell kritik av att Geonames används som utgångskälla. Och med klart mindre gnäll över att det är autmatgenerade, så känner jag det denna gång är mycket gott stöd för att med bot skapa stabila artiklar utifrån Geonames. Sedan upplever jag själv att det är mycket imponerande och framåtblickande med den nya nivån av intelligens du byggt in, även om det blivit gnöl över just hur platthet erhålls, och i den delen är det kanske en gränsfall om det är att gå för långt, meden att hitta avstånd till orter etc inte verkar ifrågasättas. Så även om kanske småjusteringar kan behövas tycker jag det är väldigt god uppbackning totalt, och är också glad du nu legat lågt någon dag så synpunkterna kunnat fångats in och dryftats.Yger (diskussion) 8 september 2015 kl. 18.40 (CEST)
- Instämmer med föregående talare, jag är imponerad av hur pass hög kvaliteten varit på artiklarna hittills och ser med spänning fram emot när Lsjbot hittar till Östasien!--ボスニア (diskussion) 8 september 2015 kl. 20.00 (CEST)
- Ja, trots att jag har själv viss skeptism måste jag säga att artiklarna ser bra ut, och ser fram emot att det blir Finlands tur. K9re11 (diskussion) 8 september 2015 kl. 20.57 (CEST)
- Och själv är jag glad över den katalanska produktionen. --Paracel63 (diskussion) 22 maj 2016 kl. 13.03 (CEST)
- Ja, trots att jag har själv viss skeptism måste jag säga att artiklarna ser bra ut, och ser fram emot att det blir Finlands tur. K9re11 (diskussion) 8 september 2015 kl. 20.57 (CEST)
Sydsudan
[redigera wikitext]Det verkar ha uppstått ett antal dubbletter bland Sydsudans counties, t.ex. Yei och Yei County. Hur ska vi ta itu med detta?--ボスニア (diskussion) 9 september 2015 kl. 03.04 (CEST)
- Detta är inte en dubblett utan två olika objekt, en ort och en administrativ enhet. Däremot anges den administrativa enheten som omväxlande country, kommun och län. Där saknas konsekvens. En annan enhet verkar däremot förekomma med olika stavningar, Terekeka respektive Terkaka. Där finns nog ett besvärande problem. Om samma plats förekommer med olika stavningsvarianter är det säkert mycket svårt att få boten att identifiera dubbletten. // jorchr 9 september 2015 kl. 06.46 (CEST)
- Boten ska vara konsekvent med benämningarna på administrativa enheter i varje land. I Sydsudan kallar boten enheterna på den nivån för "kommuner". I vissa fall ingår "County" i namnet på enheten, som i Yei County. Boten borde inte använda "län" om någonting i Sydsudan - har du exempel? Lsj (diskussion) 9 september 2015 kl. 10.44 (CEST)
- Jag har sett exempel på när svensk media kallat ett county i Florida för "kommun", så det är inget konstigt. -- Innocent bystander 9 september 2015 kl. 11.03 (CEST)
- Begreppet "län" används i Central Equatoria, men den är inte robotskapad. -- Innocent bystander 9 september 2015 kl. 11.14 (CEST)
- Och vad som står i handskapade artiklar tar jag inget ansvar för. Lsj (diskussion) 9 september 2015 kl. 11.22 (CEST)
- Begreppet "län" används i Central Equatoria, men den är inte robotskapad. -- Innocent bystander 9 september 2015 kl. 11.14 (CEST)
- Jag har sett exempel på när svensk media kallat ett county i Florida för "kommun", så det är inget konstigt. -- Innocent bystander 9 september 2015 kl. 11.03 (CEST)
- Terekeka och Terkaka kan vara en dublett i GeoNames. De är separata poster i GeoNames, och de har inte samma position (ett par mil isär), så jag ser ingen praktisk möjlighet för boten att "förstå" att de är samma, det är inte helt självklart för en människa heller. Lsj (diskussion) 9 september 2015 kl. 10.55 (CEST)
- Vi ska inte begära att Lsjbot upptäcker och korrigerar fel som finns i GeoNames. Däremot är det till fördel om Lsjbots arbete exponerar dem. Det kan kanske resultera i korrigeringar i GeoNames. --Ettrig (diskussion) 9 september 2015 kl. 11.55 (CEST)
- Boten ska vara konsekvent med benämningarna på administrativa enheter i varje land. I Sydsudan kallar boten enheterna på den nivån för "kommuner". I vissa fall ingår "County" i namnet på enheten, som i Yei County. Boten borde inte använda "län" om någonting i Sydsudan - har du exempel? Lsj (diskussion) 9 september 2015 kl. 10.44 (CEST)
University of Juba
[redigera wikitext]Du har gjort ett fantastiskt jobb med Projekt alla platser men jag ställer mig frågande till om byggnader är någonting som bör innefattas av projektet. Vad fyller det för funktion att ha med tex terränginformation kring byggnaden? Ingen information i artikeln behandlar själva Universitetet. Varför vill man veta höjd över havet, eller namnet på den högst närmaste kullen? Artikeln i sin nuvarande form är enligt mig totalt meningslös. Mason (diskussion) 9 september 2015 kl. 21.46 (CEST)
- Boten skapar inte generellt artiklar om enskilda byggnader. Det finns ganska många i GeoNames, men jag har valt bort de flesta som irrelevanta. Däremot är det ett par byggnadstyper som vi brukar betrakta som relevanta (universitet, flygplatser,...) som jag har tagit med. Dessa får samma standardpaket med information i artikeln som andra sorters platser. Om University of Juba som lärosäte finns tyvärr ingen information i GeoNames. Annars är väl artikeln ungefär lika meningsfull som de blygsamma artiklar vi har om andra afrikanska universitet, t.ex. University of Benin, Nigeria. Lsj (diskussion) 9 september 2015 kl. 22.49 (CEST)
- Min poäng som jag försöker framlägga är att den enda relevanta informationen University of Juba innehåller är just var i Sydsydan det ligger. University of Benin, Nigeria är väldigt kort men den har även information om vilket årtal Universitetet grundades och hur många studenter som går där. Jag skulle alltså säga att den artikeln procentuellt sätt innehåller betydligt mer relevant information. Allt efter de två första meningarna är, om inte fluff så i varje fall irrelevant till artikeln. Mason (diskussion) 10 september 2015 kl. 00.05 (CEST)
- WD-posten borde slås ihop med den som hör samman med en:University of Juba, men jag är inte lyckosam på WD. Antar att i stort sett alla universitet har artikel på någon annan språkversion, så detta borde göras systematiskt. Då ökar värdet betydligt, och det blir lätt att lägga till grundläggande information om lärosätet. Taxelson (diskussion) 10 september 2015 kl. 07.19 (CEST)
- Sammanfogat objekten. Betrakta Universitet som byggnader är ganska missriktat. Jag läser nu på Umeå universitet, men jag kommer sannolikt aldrig komma i närheten av någon annan byggnad än mitt eget hus och det lokala biblioteket. I Ö-vik hyr Umeå och Mittuniversiteten samma byggnad. Ska dessa två universitet sammanfogas? -- Innocent bystander 10 september 2015 kl. 08.16 (CEST)
- Jag kan sluta göra artiklar om universitet, om folk tycker att de inte är meningsfulla. Lsj (diskussion) 10 september 2015 kl. 10.23 (CEST)
- De är definitivt behövda, men de blir lite konstigt med geografiinformationen. Fast inte så konstigt att jag tycker de ska bort. Kanske kan utesluta viss info i just de artiklarna? --افيراتير (diskussion) 10 september 2015 kl. 12.25 (CEST)
- Jag tycker att det är mycket bra om de görs. Vi får en inramning, namnet, land, koordinater och egenskapen universitet. Ibland dessutom länkar till Wikipedia på andra språk. Det är mycket mer än ingenting. Egenskaper hos omgivande terräng är förstås inte det första man väntar sig om ett universitet. Men inte heller det är helt värdelöst. Och det är absolut inte skadligt. Vill också påminna om arbetsbesparingen för eventuell stubb-makare. För den som vill lägga in en bild eller tala om när universitetet grundades är det oerhört mycket lättare om det redan finns en stub. Kommer Lsjbot att lägga in artiklarna i Kategorier typ Kategori:Universitet och högskolor i Libanon? --Ettrig (diskussion) 10 september 2015 kl. 12.28 (CEST)
- Apropå ärendet på BOÅ: University of Lethbridge har i själva verket hyfsat med interwiki, det ser man om man slår upp universitet på enwp.[13] Detta gäller förmodligen även övriga robotskapade universitetsartiklar. Men det kräver en del arbete att ändra WD-objekten så att de pekar rätt. /Ascilto (diskussion) 15 april 2016 kl. 14.14 (CEST)
- Lägg in Geonames-ID (P1566) på Wikidata, så kommer eventuella dubbletter snart att vara identifierade. -- Innocent bystander 15 april 2016 kl. 14.28 (CEST)
- Det var jag som startade ärendet på "Begäran om åtgärder" på grund av de artiklar jag listade hade inget med själva ämnet att göra utan Lsjbot skapade dessa som orter, när de själva verket är läroverk, forskningsinstitut och universitetssjukhus. Jag har inga som helst problem om Lsjbot massproducerar såna men då måste det vara i ett eget projekt eftersom dessa artiklar ska handla om universitetet/forskningsinstitutet/universitetssjukhuset etc och inte om geografin om platsen där den ligger, då ska man istället gå in på stadens/kommunens egna artikel och läsa där om man är ute efter sån information. Det bästa vore om Lsj ta sig en titt på redan existerande artiklar om ämnet och se vad som brukar vara i dessa innan användaren tar beslutet om att massproducera. Som det är nu så bör artiklarna raderas i nuvarande form. För övrigt undrar jag varför Lsjbot inte alltid fixar interwikilänkar? Vissa artiklar har såna medan andra har inte det förutom den obligatoriska cebuano-länken trots att det specifika ämnet behandlas på andra språkversioner, se den redan nämnda University of Lethbridge och en:University of Lethbridge. DIEXEL (diskussion) 17 april 2016 kl. 19.01 (CEST)
- @DIEXEL: Angående universitetsartiklarnas vara eller inte vara, så har jag sagt mitt ovan, tänker inte säga mer om det.
- Lsjbot lägger in interwiki till befintliga artiklar när algoritmerna bedömer det som säkert nog att det faktiskt rör sig om samma sak. I början lades interwiki även in när det inte var lika väl belagt att det rörde sig om exakt samma sak. Det gjorde att vi fick felaktig interwiki lite för ofta. Och då det är enklare att sammanfoga än att splitta två objekt på Wikidata så är det nog att föredra att vi har det på det viset. -- Innocent bystander 18 april 2016 kl. 09.54 (CEST)
- Tack Innocent bystander för klargörande om interwiki. Beträffande artiklarnas vara eller inte vara har jag väsentligen samma syn som Ettrig uttrycker här ovan. Att en artikel om ett relevant ämne (vilket ett universitet normalt är) inte innehåller all den info man kunde önska är för övrigt ett mycket märkligt raderingsargument, som inte brukar vinna gehör i SFFR. Lsj (diskussion) 18 april 2016 kl. 12.17 (CEST)
- Man kan också ta en titt på Queen's University före och efter att jag infogade robotartikeln (som av någon orsak hamnat på annat namn). Jag tycker robotstubben var klart bättre än människostubben (hm, är det så man säger?). En del av infon är nog litet märklig eller märkligt formulerad, men t.ex. informationen om läget hjälper den som inte kan Kanadas geografi. --LPfi (diskussion) 18 april 2016 kl. 16.44 (CEST)
- Tack Innocent bystander för klargörande om interwiki. Beträffande artiklarnas vara eller inte vara har jag väsentligen samma syn som Ettrig uttrycker här ovan. Att en artikel om ett relevant ämne (vilket ett universitet normalt är) inte innehåller all den info man kunde önska är för övrigt ett mycket märkligt raderingsargument, som inte brukar vinna gehör i SFFR. Lsj (diskussion) 18 april 2016 kl. 12.17 (CEST)
- Det var jag som startade ärendet på "Begäran om åtgärder" på grund av de artiklar jag listade hade inget med själva ämnet att göra utan Lsjbot skapade dessa som orter, när de själva verket är läroverk, forskningsinstitut och universitetssjukhus. Jag har inga som helst problem om Lsjbot massproducerar såna men då måste det vara i ett eget projekt eftersom dessa artiklar ska handla om universitetet/forskningsinstitutet/universitetssjukhuset etc och inte om geografin om platsen där den ligger, då ska man istället gå in på stadens/kommunens egna artikel och läsa där om man är ute efter sån information. Det bästa vore om Lsj ta sig en titt på redan existerande artiklar om ämnet och se vad som brukar vara i dessa innan användaren tar beslutet om att massproducera. Som det är nu så bör artiklarna raderas i nuvarande form. För övrigt undrar jag varför Lsjbot inte alltid fixar interwikilänkar? Vissa artiklar har såna medan andra har inte det förutom den obligatoriska cebuano-länken trots att det specifika ämnet behandlas på andra språkversioner, se den redan nämnda University of Lethbridge och en:University of Lethbridge. DIEXEL (diskussion) 17 april 2016 kl. 19.01 (CEST)
- Lägg in Geonames-ID (P1566) på Wikidata, så kommer eventuella dubbletter snart att vara identifierade. -- Innocent bystander 15 april 2016 kl. 14.28 (CEST)
- Apropå ärendet på BOÅ: University of Lethbridge har i själva verket hyfsat med interwiki, det ser man om man slår upp universitet på enwp.[13] Detta gäller förmodligen även övriga robotskapade universitetsartiklar. Men det kräver en del arbete att ändra WD-objekten så att de pekar rätt. /Ascilto (diskussion) 15 april 2016 kl. 14.14 (CEST)
- Jag tycker att det är mycket bra om de görs. Vi får en inramning, namnet, land, koordinater och egenskapen universitet. Ibland dessutom länkar till Wikipedia på andra språk. Det är mycket mer än ingenting. Egenskaper hos omgivande terräng är förstås inte det första man väntar sig om ett universitet. Men inte heller det är helt värdelöst. Och det är absolut inte skadligt. Vill också påminna om arbetsbesparingen för eventuell stubb-makare. För den som vill lägga in en bild eller tala om när universitetet grundades är det oerhört mycket lättare om det redan finns en stub. Kommer Lsjbot att lägga in artiklarna i Kategorier typ Kategori:Universitet och högskolor i Libanon? --Ettrig (diskussion) 10 september 2015 kl. 12.28 (CEST)
- De är definitivt behövda, men de blir lite konstigt med geografiinformationen. Fast inte så konstigt att jag tycker de ska bort. Kanske kan utesluta viss info i just de artiklarna? --افيراتير (diskussion) 10 september 2015 kl. 12.25 (CEST)
- Jag kan sluta göra artiklar om universitet, om folk tycker att de inte är meningsfulla. Lsj (diskussion) 10 september 2015 kl. 10.23 (CEST)
- Sammanfogat objekten. Betrakta Universitet som byggnader är ganska missriktat. Jag läser nu på Umeå universitet, men jag kommer sannolikt aldrig komma i närheten av någon annan byggnad än mitt eget hus och det lokala biblioteket. I Ö-vik hyr Umeå och Mittuniversiteten samma byggnad. Ska dessa två universitet sammanfogas? -- Innocent bystander 10 september 2015 kl. 08.16 (CEST)
- WD-posten borde slås ihop med den som hör samman med en:University of Juba, men jag är inte lyckosam på WD. Antar att i stort sett alla universitet har artikel på någon annan språkversion, så detta borde göras systematiskt. Då ökar värdet betydligt, och det blir lätt att lägga till grundläggande information om lärosätet. Taxelson (diskussion) 10 september 2015 kl. 07.19 (CEST)
Luxemburg
[redigera wikitext]Ny provserie på gång: Kategori:Robotskapade Luxemburgartiklar. Största förändringen är att terrängalgoritmen är helt omarbetad efter den diskussion som blev kring det "platta" berget i Sydsudan. Nu tittar boten mer i detalj på terrängen i olika riktningar, och skriver mer nyanserat om hur det ser ut. Konkret delar den upp området runt platsen i 9 sektorer: en central liten cirkel och åtta "tårtbitar" därutanför, och beräknar höjdvariansen i varje sektor för sig, för att sedan jämföra dem. Lsj (diskussion) 11 september 2015 kl. 18.40 (CEST)
- Roboten vill få det till att Gostingen (ort i Luxemburg) ligger nära Luxemburg, men menar nog Luxemburg (stad).Nasko (✉) 11 september 2015 kl. 19.35 (CEST)
- Vad kul att vi fått sprätt på Luxemburgartiklarna! Har gått in och putsat litet och det ser bra ut. Många luxemburgska småorter har medeltida slott och borgar, så med tiden kommer artiklarna fyllas ut med kulturhistorisk information och bilder. Det enda jag reagerat på är att småstaden Oberkorn beskrevs som en del av en befolkad plats i första versionen, vilket jag snabbt ändrade på.--ボスニア (diskussion) 11 september 2015 kl. 20.02 (CEST)
- @Nasko: Ser ut att vara ett generellt fel, boten "tror" att artikeln om landet Luxemburg även handlar om staden, och länkar dit även när staden åsyftas. Ska gå att länka om per bot utan alltför mycket bestyr. Lsj (diskussion) 11 september 2015 kl. 20.27 (CEST)
- Ett annat problem jag upptäckt är att artiklarna inte är länkade till luxemburgska Wikipedia via interwiki, där man har en lika granulär uppdelning av artiklar som vi nu har. Har gjort detta manuellt, men det borde gå att kalibrera boten så att det går av sig själv. Hur som helst är det kul att pula med detta i mellantiden.--ボスニア (diskussion) 11 september 2015 kl. 23.51 (CEST)
- Tror det har att göra med problemet under #Konstig interwiki här ovan. Ska titta på det ett varv till. Lsj (diskussion) 12 september 2015 kl. 10.05 (CEST)
- Se också till att de svenska artiklarna följer de luxemburgska, så att kommun (Gemeng) länkas till kommun och centralort (Haaptuert) till centralort. Personligen tycker jag att det är onödigt med grensidor, det är bättre att centralorten får ha artikelnamnet kort och gott. Hur som helst är det jättekul att vi får full täckning på Luxemburg. Bra jobbat!--ボスニア (diskussion) 12 september 2015 kl. 16.08 (CEST)
- Över huvud taget verkar vara att uppgifter om en kommun hamnar i artikeln om kommunhuvudorten. Det är förmodligen fel i källorna, men tyvärr behöver boten kanske ta hänsyn till och kompensera för dylika systematiska fel. Det är kanske inte så lätt för en bot att utöva källkritik, men jag tycker det verkar kunna behövas. // jorchr 12 september 2015 kl. 16.28 (CEST)
- Det boten har gjort i det avseendet är att dubbelkolla i wikidata för de artiklar som finns där, och se till att de är korrekt kategoriserade. En artikel om en kommun iw-länkas bara om wikidata-objektet är kategoriserat som en kommun, och vice versa för orter. Det är ytterligare ett skäl till att väldigt många artiklar saknar iw, wikidata visade sig vara fullt av tveksamma klassningar. Men mer "källkritik" än så är svårt att åstadkomma med bot. Har du exempel bland de botskapade artiklarna på den sortens fel? Lsj (diskussion) 12 september 2015 kl. 16.45 (CEST)
- Om boten kunde läsa enkla luxemburgska uttryck i lbwiki så skulle man lätt kunna sortera mellan huvudorter och kommuner, tror jag.--ボスニア (diskussion) 12 september 2015 kl. 16.47 (CEST)
- Två problem med den tanken: (1) Den förutsätter att artiklarna är helt konsekvent och likformigt formulerade, vilket är osannolikt om de är handskapade, och (2) Den behöver kunna generaliseras med rimlig arbetsinsats till ca 200 andra språkversioner, för att hantera resten av världen. Det som skulle kunna gå är att använda kategoriseringen på lbwiki -- använda t.ex. lb:Kategorie:Gemengen zu Lëtzebuerg för att identifiera kommuner. Men språkversioner skiljer sig väldigt mycket i hur de kategoriserar.
- Beträffande grensidor och vilken artikel som borde ha huvudordet, så är det något jag inte tänker försöka avgöra med bot. Svårt nog för människor att komma överens om vad som är POMMF, så det minfältet låter jag inte boten trampa i. Så snart det finns flera artikelsubjekt som lystrar till samma namn skapar boten en grensida. Lsj (diskussion) 12 september 2015 kl. 17.26 (CEST)
- Att använda kategorin låter som en framkomlig väg, lbwiki verkar ha bra koll på dessa distinktioner.--ボスニア (diskussion) 12 september 2015 kl. 18.23 (CEST)
- Om boten kunde läsa enkla luxemburgska uttryck i lbwiki så skulle man lätt kunna sortera mellan huvudorter och kommuner, tror jag.--ボスニア (diskussion) 12 september 2015 kl. 16.47 (CEST)
- Det boten har gjort i det avseendet är att dubbelkolla i wikidata för de artiklar som finns där, och se till att de är korrekt kategoriserade. En artikel om en kommun iw-länkas bara om wikidata-objektet är kategoriserat som en kommun, och vice versa för orter. Det är ytterligare ett skäl till att väldigt många artiklar saknar iw, wikidata visade sig vara fullt av tveksamma klassningar. Men mer "källkritik" än så är svårt att åstadkomma med bot. Har du exempel bland de botskapade artiklarna på den sortens fel? Lsj (diskussion) 12 september 2015 kl. 16.45 (CEST)
- När man tittar på de botgenererade kommunhuvudorterna har de orimligt stor yta, vilken överensstämmer med de siffror som står i motsvarande kommuns faktaruta på lb-wikipedia. Jag tittade på orten/kommunen Biwer, men förmodar att det är genomgående. Befolkningsuppgifterna vekar ha samma fel, men där kan jag inte göra någon rimlighetsbedömning. // jorchr 12 september 2015 kl. 17.00 (CEST)
- Ok, jag ser problemet. Beror på att boten i vissa fall tittar på andra språkversioner via Wikidata, och hämtar uppgifter därifrån. Om vi tar Biwer som exempel: både wikidata, enwp, och frwp rör ihop kommun och huvudort i sina artiklar. T.ex. en:Biwer har kommunens befolkning i faktarutan och ortens befolkning i brödtexten - inte lätt för en stackars bot att reda ut. Och wikidata-posten för Biwer är kategoriserad både som stad och som kommun, så där får boten inte heller någon ledning. Samma problem gör att interwiki blir fel - ser att Biwer (kommunhuvudort) är iw-länkad till lb:Gemen Biwer. Lsj (diskussion) 12 september 2015 kl. 17.36 (CEST)
- Jo, jag inser att det finns förklaringar. Icke desto mindre blir slutresultatet ett ganska gravt systematiskt fel. Med tanke på detta: Kanske botens artiklar måste passera ett mänskligt öga för att upptäcka dessa fel innan artiklarna läggs ut skarpt i artikelrymden. Eller så behöver källorna granskas och justeras innan boten sprider uppgifterna vidare. // jorchr 13 september 2015 kl. 01.25 (CEST)
- Ett mänskligt öga har inte gjort någon större succé på enwp och wikidata i de här fallen, utan tvärtom har den mänskliga faktorn släppt igenom en enda röra där. Just systematiska fel åtgärdas bättre med stickprov och botfixande. Lsj (diskussion) 13 september 2015 kl. 10.40 (CEST)
Är det någon som har handfixat många Luxemburgartiklar? De systematiska fel som har noterats här gör att jag tänker radera och köra om hela uppsättningen, det är säkraste sättet att åtgärda systematiska fel. Men är det enstaka artiklar som någon lagt ner tid på kan jag undanta dem. Lsj (diskussion) 13 september 2015 kl. 10.43 (CEST)
- Ny körning pågår, där jag systematiskt låter de förvirrade wd-objekten länkas till artiklarna om kommunen, eftersom lbwiki länkar så för alla jag har kollat. Lsj (diskussion) 13 september 2015 kl. 18.12 (CEST)
Förgreningssidor
[redigera wikitext]På sidan Mont Saint-Jean står det i vildtexten till första bilden Mont Saint-Jean i Guadeloupe, (Frankrike). Jag skulle själv inte skriva både komma och parenteser. Detta stör dock inte mycket, men kunde tas i beaktande i kommande förgreningssidor. K9re11 (diskussion) 13 september 2015 kl. 18.38 (CEST)
- Ok, fixat i koden. Lsj (diskussion) 13 september 2015 kl. 18.47 (CEST)
- Är boten färdig med förgreningssidor så att det går att börja slå ihop när jag kommer till sidor som redan finns? Maundwiki (diskussion) 13 januari 2016 kl. 14.43 (CET)
- Varje enskild grensida är komplett när den skapas, det fylls inte på fler grenar efter hand. Däremot är inte alla grensidor skapade än. Inför skapandet av varje land skapar boten alla grensidor som berör det landet (men som även kan innehålla platser i andra länder). Lsj (diskussion) 13 januari 2016 kl. 16.44 (CET)
- Är boten färdig med förgreningssidor så att det går att börja slå ihop när jag kommer till sidor som redan finns? Maundwiki (diskussion) 13 januari 2016 kl. 14.43 (CET)
- Frågor från California (olika betydelser) enbart geografi. Med kanske för tidigt ute med tanke på Storbritannien?
- Hur vill du bli informerad att det redan fanns en artikel som ersätter en robotskapad röd länk?
- Det finns artikelförslag (röd) på förgreningsssidan men inget på den robotskapade. Om inga wikilänkar ta bort, om det finns wikilänkar till den icke skapade sidan lägg till men behöver roboten veta?
- Det finns en artikel, lägger till men behöver roboten veta?
- Kan en robot "fixa" allt med kartor genom att hämta från mallen coord? Även nya länder?
- California (olika betydelser 2) rensa e.g. enbart omdirigering eller behövs någon av kategorierna?
- Rödlänken visar vilket namn boten tänker använda när den skapar artikeln. Om artikeln redan finns under annat namn, så räcker det att göra rödlänken till en omdirigering till den befintliga artikeln. Då "märker" boten att artikeln finns.
- Om roboten inte har skapat en rödlänk på "sin" grensida, så planerar den inte att skapa en artikel om platsen. Då behöver den inte veta.
- Kan du förtydliga frågan? Lägger till vad, var?
- Förmodar att du syftar på handgjorda länkar i grensidor. Tekniskt möjligt, men skulle kräva ganska mycket programmering. Ingenting jag hade planerat att göra.
- Boten använder ibland kategorierna för att söka ut artiklar som behöver rättas av olika skäl. T.ex. hade Curaçao stavats fel i grensidorna, då använde jag Kategori:Robotskapade Curaçaoartiklar för att hitta berörda artiklar. Lsj (diskussion) 17 januari 2016 kl. 11.26 (CET)
- Rätt uppfattat av mig California (countyhuvudort)? Den robotskapade sidan bör ha detta som instruktion.
- OK
- Se t.ex California City, Kalifornien under USA i California (olika betydelser)
- Synd.
- Lämnar kvar alla kategorier efter att det blir en omdirigering, se California (olika betydelser 2). Om det är vad som behövs bör det också vara en instruktion på den robotskapade sidan.
- Maundwiki (diskussion) 17 januari 2016 kl. 13.20 (CET)
- Chalais Behöver boten sina artikelnamn som omdirigeringar? Föredrar ordningen med orten under kommunen utan label eftersom den inte syns på kartan. Maundwiki (diskussion) 5 februari 2016 kl. 18.14 (CET)
- Botens artikelnamn är vad boten använder för att länka mellan de botskapade artiklarna. Det kan t.ex. stå i artikeln om en sjö att orten X ligger vid den sjön. Därför behöver de finnas åtminstone som omdirigeringar. Däremot går det bra att ta bort kartpricken ur kartpositionsmallen. Lsj (diskussion) 5 februari 2016 kl. 18.55 (CET)
- Ska göra, men jag tror inte att det kommer att fungera allt eftersom fler infogar. Maundwiki (diskussion) 5 februari 2016 kl. 23.01 (CET)
- Botens artikelnamn är vad boten använder för att länka mellan de botskapade artiklarna. Det kan t.ex. stå i artikeln om en sjö att orten X ligger vid den sjön. Därför behöver de finnas åtminstone som omdirigeringar. Däremot går det bra att ta bort kartpricken ur kartpositionsmallen. Lsj (diskussion) 5 februari 2016 kl. 18.55 (CET)
- Chalais Behöver boten sina artikelnamn som omdirigeringar? Föredrar ordningen med orten under kommunen utan label eftersom den inte syns på kartan. Maundwiki (diskussion) 5 februari 2016 kl. 18.14 (CET)
Chambord
[redigera wikitext]I Chambord (olika betydelser) länkade kommun och ort i Département du Loir-et-Cher till förgreningssidan Chambord. Fixade kommunen men inte orten. Maundwiki (diskussion) 6 februari 2016 kl. 02.31 (CET)
- Hmmm... fick gräva lite i historiken här för att se problemet. Boten identifierar befintliga artiklar om en plats genom att kolla om en artikel med rätt namn också har rätt koordinater. Detta gör boten i förväg i en separat körning, som gjordes någon gång i höstas. Artikeln Chambord var då en omdirigering till Slottet i Chambord... som innehåller rätt koordinater. Lsj (diskussion) 6 februari 2016 kl. 10.14 (CET)
- OK men eftersom det noggrant skiljs på kommun och ort i Frankrike varför blev de samma och inte som Chambord, Eure två olika artikelnamn för orten och kommunen? Efter samma logik som Cham och Cham (Schweiz) där ort och kommun går till samma artikel? Jag lämnade det och antog att det blev så eftersom den fanns innan. Nu tror jag att alla dessa ortartiklar om "orten" i kommunen i Frankrike är overkill. Administrativ indelning är vad som kommer att behöva underhållas. Vi såg från distrikten i Sverige hur många mantimmar det tar. Ju mer jag har tittat i genames ju mindre tror jag på detaljer. I detta fall (Chambord, Loir-et-Cher) har kommunen 141 invånare och orten 208 i genames medan franska wiki har 154 för kommunen. Maundwiki (diskussion) 6 februari 2016 kl. 13.54 (CET)
Victoria
[redigera wikitext]Har den botskapade funnits och blivet borttagen? Fixade för en del men det finns mer. Maundwiki (diskussion) 9 februari 2016 kl. 15.22 (CET)
- Den botskapade Victoria (olika betydelser) finns kvar. Eller var det inte den du menade? Lsj (diskussion) 9 februari 2016 kl. 15.28 (CET)
- Såg inte eftersom den inte länkade till Victoria. Maundwiki (diskussion) 9 februari 2016 kl. 21.53 (CET)
Celles (olika betydelser)
[redigera wikitext]Boten wikilänkade "Celles, Cantal", kommun, Champagne-Ardenne, Département de la Haute-Marne, men det är fel. Skulle vara "Celles-en-Bassigny". "Celles, Cantal" är en kommun i departementet Cantal i regionen Auvergne i mitten av Frankrike. Såg det endast för att vid min infogning fick jag två "Celles, Cantal' (jag letar namn inte geokordinater) och då jämförde jag kartplatsen i artikeln och på förgreningssidan. Maundwiki (diskussion) 12 februari 2016 kl. 16.39 (CET)
Ny förgreningssida
[redigera wikitext]Artikeln Bigga flyttad till Bigga (ort) och Bigga är nu en förgrening. Klara boten av att inte wikilänka till Bigga för Bigga (ort) efter ändringen? Maundwiki (diskussion) 15 april 2016 kl. 14.29 (CEST)
- Eftersom boten redan är klar med Australien kommer den inte att skapa fler länkar till Bigga som skulle gått till Bigga (ort). Lsj (diskussion) 15 april 2016 kl. 16.59 (CEST)
Kirchberg (olika betydelser)
[redigera wikitext]Linje 31 [14] kulle i Tyskland till kommun i Frankrike. Jag har tagit bort i KirchbergMaundwiki (diskussion) 30 april 2016 kl. 20.36 (CEST)
Kategorier
[redigera wikitext]Kategorin Kategori:Skogar i Luxemburg är delkategori av sig själv. K9re11 (diskussion) 13 september 2015 kl. 18.54 (CEST)
- Ok, jag förstår problemet. Skogar (och allting annat) kategoriseras först efter distrikt, och sedan läggs distriktskategorierna under en landskategori. Och här heter distrikt och land samma sak... se t.ex. Haffboesch. Lsj (diskussion) 13 september 2015 kl. 19.56 (CEST)
- Det här blir lurigare än jag trodde, och leder till den mer allmänna frågan om hur särskiljningsled för kategorier ska hanteras. Tankar om detta? Lsj (diskussion) 13 september 2015 kl. 22.59 (CEST)
- Det är nog bäst att använda samma särskiljningsled som motsvarande artikel har, så blir namngivningen konsekvent rakt igenom. Om någon ogillar särskiljningsledet är det bara att byta namn på kategorin och ändra i artiklarna med lämpligt verktyg. Nasko (✉) 13 september 2015 kl. 23.14 (CEST)
- Ja, det låter klokt. Blir också tekniskt enklast och minst risk för nya buggar. Sedan får vi stå ut med ett och annat kategorinamn som inte får plats på en rad. Lsj (diskussion) 13 september 2015 kl. 23.17 (CEST)
- Inlagt i koden nu, så får vi se i nästa körning hur det fungerar. Lsj (diskussion) 19 september 2015 kl. 19.25 (CEST)
- Ja, det låter klokt. Blir också tekniskt enklast och minst risk för nya buggar. Sedan får vi stå ut med ett och annat kategorinamn som inte får plats på en rad. Lsj (diskussion) 13 september 2015 kl. 23.17 (CEST)
- Det är nog bäst att använda samma särskiljningsled som motsvarande artikel har, så blir namngivningen konsekvent rakt igenom. Om någon ogillar särskiljningsledet är det bara att byta namn på kategorin och ändra i artiklarna med lämpligt verktyg. Nasko (✉) 13 september 2015 kl. 23.14 (CEST)
Lite skräp
[redigera wikitext]Den här texten
Steinfort.
har jag tagit bort från Mamer (kommun). (Titta i första versionen.) --Ettrig (diskussion) 13 september 2015 kl. 22.13 (CEST)
- Tack. Måste vara en bugg i koden. Lsj (diskussion) 13 september 2015 kl. 22.49 (CEST)
- Ok, hittat buggen. Hade förbisett ett specialfall när en kommun bara gränsar till en enda annan kommun. Lsj (diskussion) 13 september 2015 kl. 22.52 (CEST)
Bugg i "högsta punkten"
[redigera wikitext]Har hittat en mycket irriterande bugg i algoritmen för att räkna fram högsta punkten i närheten av en plats. Ett teckenfel gör att norr och söder i vissa fall byter plats i riktningen till högsta punkten. Märkte inte detta i Luxemburg där det finns kullar i alla riktningar, utan kom på det när jag provkörde Bahamas och fick en högsta punkt mitt ute i havet. Luxemburg-artiklarna bör köras om en gång till. Lsj (diskussion) 13 september 2015 kl. 22.56 (CEST)
Myanmar
[redigera wikitext]I vissa förgreningssidor skriver Lsjbot Myanmar, men Burma är namnet som används om landet i dess artikel. K9re11 (diskussion) 14 september 2015 kl. 09.26 (CEST)
- Ok, tack. Ändrat i landsdatafilen. Lsj (diskussion) 14 september 2015 kl. 09.49 (CEST)
Platthet igen
[redigera wikitext]Artikeln Young Island (ö i Bahamas) säger att terrängen är varierad och att högsta punkten är 14 möh. Jag tolkar detta som att det är höjden som är varierad. Men en högsta höjd på 14 möh innebär att det knappast ens finns en liten kulle. Möjligen har här räknats in en intilliggande ö som är betydligt högre. Det är i så fall i konflikt med påståendet självt, som säger sig handla om terrängen i ön. Jag tror att detta dessutom är ett litet grammatiskt fel. Terräng finns i en kommun, men på en ö. --Ettrig (diskussion) 14 september 2015 kl. 10.52 (CEST)
- Ja, det var skumt. Får kolla hur det är uträknat. Öar har en delvis egen algoritm som räknar terräng exakt inom ön, inte inom en viss radie, och det kan ha växelverkat med den nya sektorsindelningen på ett olyckligt sätt. Young Island (ö i Bahamas) är första ön som körts med den nya algoritmen. Lsj (diskussion) 14 september 2015 kl. 11.08 (CEST)
- Har hittat problemet. Hade förbisett specialfallet med en ö som ryms i en enda sektor, och då hamnade den i default-kategorin "varierad". Lsj (diskussion) 15 september 2015 kl. 09.47 (CEST)
- Fixat i koden nu. Lsj (diskussion) 18 september 2015 kl. 20.41 (CEST)
- Har hittat problemet. Hade förbisett specialfallet med en ö som ryms i en enda sektor, och då hamnade den i default-kategorin "varierad". Lsj (diskussion) 15 september 2015 kl. 09.47 (CEST)
Diekirchs många roller
[redigera wikitext]Diekirch (distriktshuvudort) är nu omdirigeringssida till Diekirch som var en artikel om kommunen och som jag har gjort till en omdirigeringssida till Diekirch (olika betydelser). Vi fick alltså ingen Lsjbot-artikel om orten. Lsjbot-koden tycks förutsätta att artikelnamn utan specificering i sådana här situationer handlar om orten. Verkligheten i detta avseende är nog mycket divergent. I det här fallet skulle det ha varit bättre att göra båda. Den principen är bättre om man tycker att det är bättre med en dubblett än att en artikel saknas, och om artiklarna fördelar sig lika på orter och kommuner. Jag skulle gissa att det vanligaste är att samma artikel handlar om både kommunen och orten. Då skulle det vara en välgärning om Lsjbot skapar de två alternativen. Det skulle stimulera de kol-baserade aktörerna att dela upp materialet. Men detta tål att tänka på. --Ettrig (diskussion) 14 september 2015 kl. 15.29 (CEST)
- Vi hade långa diskussioner om detta i samband med att Lsjbot skapade artiklar om arter häromåret. Konsensus då var att Lsjbot borde vara konservativ, och hellre avstå fran att skapa om det är en möjlig dublett. Jag fick också mycket mer kritik för skapade dubletter än för oskapade luckor. Därför är jag fortsatt konservativ nu. Finns det en befintlig artikel med rätt namn som är en geografiartikel med någorlunda rätt koordinater så antar boten att det är en dublett. Lsj (diskussion) 14 september 2015 kl. 23.14 (CEST)
- Hmm... Det här är svårt. I exemplet jag utgick ifrån skapade boten en dublett (kommunen) och underlät att skapa den artikel som saknades (orten). Det konservativa förhållningssättet skulle inte ha skapat dubletten. Det skulle jag ha tyckt var sämre. Problemet uppstår (uppenbarligen) för att samma namn ofta används både om en ort och om en kommun. Det är kanske bäst att jag ligger lågt, så att ni inte blir mer konsekventa och vi går miste om ännu fler geografistubbar än med nuvarande bot-kod. --Ettrig (diskussion) 15 september 2015 kl. 09.15 (CEST)
- Det är möjligt att konsensus skulle bli ett annat för geografi. Finns det fler åsikter om detta? PS: Skriv inte "ni", din åsikt väger väl så tungt som andras. Lsj (diskussion) 15 september 2015 kl. 09.41 (CEST)
- Jag har jobbat en del med artartiklarna (främst växter) och det är betydligt mindre jobb att slå ihop två dubbletter än att skapa en missad artikel. Dock tycker jag Lsjbot överlag har gjort ett bra jobb med att hitta befintliga artiklar. Problemet med flera entiteter (kommun, stad, distrikt osv) med samma namn borde dock vara större inom geografi så där kanske man i högre grad bör skapa än för arterna. --افيراتير (diskussion) 15 september 2015 kl. 09.50 (CEST)
- Jag lutar åt samma håll. Inom artprojektet är väl risken att det skulle finnas en artikel som handlar om en art, ett släkte och/eller en familj på samma gång, eller att det inte (även med bot) skulle gå att avgöra vilken nivå artikeln handlar om, väl närmast obefintlig? För orter/kommuner är det snarare regel. Så jag skulle föredra att de artiklar som borde finnas skapas, och att de märks upp som potentiella dubbletter när det inte är uppenbart att det är samma. En annan möjlighet vore kanske att sådana artiklar som med viss sannolikhet är dubbletter placeras i annan namnrymd, och därifrån kan kopieras in. När Nasko skapade sjöartiklarna kompletterade han oftast befintlig text om de sjöar som redan hade artiklar, med det boten producerade. Något likande vore önskvärt här, och skulle kanske kunna lösas just med att det kompletterande materialet lades på någon lämplig undersida, med en notering på artikelns diskussionssida (gärna med en mall så att artiklarna med sådana noteringar lätt kan återfinnas), så att det efter hand kan fogas ihop. Taxelson (diskussion) 15 september 2015 kl. 10.17 (CEST)
Lägger in i botkoden möjligheten att skapa artiklar även för misstänkta dubletter. Artiklarna läggs då i en egen mapp (Användare:Lsjbot/Dubletter/artikelnamn) och förses med {{Robotinfoga}}
med tillhörande kategorisering. De läggs också till i Användare:Lsjbot/Namnkonflikter. Lsj (diskussion) 19 september 2015 kl. 19.23 (CEST)
Homonymen Bourscheid
[redigera wikitext]Det finns (minst) två kommuner som heter Bourscheid. Så säger artikeln Bourscheid. Den refererar till båda dessa kommuner med Bourscheid (kommun). I Nicaragua har jag för mig att jag hittade mönstret Bourscheid (kommun i Frankrike). Det skulle väl vara bra även här? Men nu kommer jag på att någon gjorde artiklar om alla (3000) kommunerna i Frankrike. Så det är mystiskt att jag inte hittar den Franska. Jo, men det gör jag ju: Bourscheid, Moselle. --Ettrig (diskussion) 15 september 2015 kl. 15.50 (CEST)
- Det där ser ut som en bugg. Ska titta på det. Lsj (diskussion) 15 september 2015 kl. 21.14 (CEST)
- Har hittat buggen. Boten använder platstypskoderna i Geonames för att avgöra om saker behöver särskiljning - har två platser olika typkod görs ingen ytterligare särskiljning. Nu är det så olyckligt att i Luxemburg är en kommun typ ADM3, medan i Frankrike är en kommun typ ADM4. Därför rördes de ihop. Tyvärr skulle det innebära ett mycket omfattande arbete att åtgärda detta generellt, med omskapande av mängder med grensidor och en del artiklar. Ska undersöka hur vanligt problemet är - kanske räcker att flagga problemartiklarna för manuell hantering? Lsj (diskussion) 19 september 2015 kl. 19.36 (CEST)
- Har kört igenom hela världen nu. Finns ungefär 5000 fall där det blir samma typ av fel, vilket är lite för många för att överlåta till handfixning när det faktiskt går att botfixa. En biprodukt av samma körning är en lista med 38000 artiklar på väg att få samma typ av fel som Hesperange som du skrev om nyss, men de blir svårare att botfixa. Lsj (diskussion) 19 september 2015 kl. 22.47 (CEST)
- Har ändrat i botkoden så att den dels garderar för det här problemet i skapandet av särskiljningsled, och dels mallar och loggar alla grensidor med den här typen av problem. Lsj (diskussion) 20 september 2015 kl. 19.46 (CEST)
- Finns de i en kategori eller annan lista som vi kan se? --Ettrig (diskussion) 20 september 2015 kl. 20.36 (CEST)
- Det blir både Kategori:Robotskapade anomalier och en lista i Användare:Lsjbot/Anomalier. Men än så länge är dessa tomma, jag har inte kört den nya koden. Lsj (diskussion) 20 september 2015 kl. 21.36 (CEST)
œ => transkription och eller omdirigering
[redigera wikitext]Vi har nu artikeln Gœsdorf (kommun). Jag förväntade mig Goesdorf i artikelnamnet och omdirigering från Gœsdorf. Tänkte jag fel? --Ettrig (diskussion) 15 september 2015 kl. 16.11 (CEST)
- I och med att Lsjbot kommer att skapa en del artiklar med alla möjliga bokstäver vore detta säkert ett bra tillfälle att diskutera i allmänhet frågan. Såvitt jag förstått bör latinska namn skrivas i originalform, förutom æ,œ, ß och sådana, samt vietnamesiska tecken (ả, ò, ạ, ộ, ệ med mera). Jag själv anser det vara konstigt att skriva t.ex. Łódź (det är ganska få som kan gissa att det uttalas ungefär wud͡ʒ), medan vietnamesiska tecken lämnas bort. Men oberoende av min åsikt vore det bra om konsensus skulle nås innan Lsjbot kommer i farten med allehanda ställen med konstiga bokstäver. K9re11 (diskussion) 15 september 2015 kl. 17.22 (CEST)
- Vi hade en diskussion om artikelnamn och omdirigeringar för ett tag sedan här. Konsensus som jag uppfattade det var att artikeln namnges med svensk namnform om sådan finnes, annars med "internationell" namnform om den är med latinsk skrift (inklusive eventuella diakritiska tecken), eller annars transkriberad från andra skriftsystem. Om artikelnamnet innehåller annat än rena A-Z-bokstäver skapas en omdirigering från det "rena" ASCII-namnet. Jag minns ingen i den diskussionen som förespråkade att ASCII-namnet skulle ha företräde framför ett korrekt skrivet namn. Såvitt jag kan finna är det normalt bruk på svwp att låta originalstavningen vara artikelnamn - artikeln om Łódź heter just så, medan Lodz är en omdirigering. Lsj (diskussion) 15 september 2015 kl. 21.11 (CEST)
- Jag vill förtydliga att jag anser absolut att man skall skriva Łódź. Men jag anser också att man borde skriva Hải Dương och Heerstraße, och förundrar mig över att dessa skrivs Hai Duong och Heerstrasse medan Łódź har de korrekta tecknen. K9re11 (diskussion) 15 september 2015 kl. 21.17 (CEST)
- Ok, då är vi överens, och det är också så Lsjbot arbetar. Att det sedan finns inkonsekvenser i de människoskapade artiklarna är ett problem som boten tyvärr inte kan göra mycket åt. Mallen
{{människoskapad}}
har en funktion att fylla . Lsj (diskussion) 15 september 2015 kl. 21.37 (CEST)
- Ok, då är vi överens, och det är också så Lsjbot arbetar. Att det sedan finns inkonsekvenser i de människoskapade artiklarna är ett problem som boten tyvärr inte kan göra mycket åt. Mallen
Samhällen i Canton de Wiltz
[redigera wikitext]Varför nämns just följande samhällen i Canton de Wiltz: Eschdorf, Bavigne? Möjligen är det de största som inte utgör kommunhuvudort. Det är inte ett felaktigt påstående, men kan lätt (och felaktigt?) uppfattas som avsett att ange de största eller intresantaste. --Ettrig (diskussion) 15 september 2015 kl. 19.21 (CEST)
- De samhällen som räknas upp är samtliga där GeoNames explicit anger att de ligger i kantonen. Tyvärr är GeoNames påtagligt inkomplett i det avseendet. Kanske man skulle förydliga i texten? Lsj (diskussion) 15 september 2015 kl. 21.00 (CEST)
I och på
[redigera wikitext]Lsjbot har skapat kategorin Kategori:Orter i Malta, trots att det finns kategorin Kategori:Orter på Malta. Jag antar att det beror på att boten är programmerad för att söka efter Kategori:Orter i landet, om den inte finns, skapa. Men för vissa ställen heter det ju på och inte i. Jag antar att detta är något som måste betraktas skilt för varje land. För övrigt innehåller kategorin Orter i Malta 56 underkategorier, alla med 1 eller 2 sidor. Om det är mera på kommande är det bra med dessa kategorier, men att ha en skild kategori med bara en artikel är annars kanske inte så bra. K9re11 (diskussion) 15 september 2015 kl. 19.31 (CEST)
- Det ska vara orter i land och orter på ö. Malta är lite besvärligt eftersom huvuddelen av landet är ön Malta men inte hela. Ännu besvärligare är dock Island som i princip enbart består av ön. Enklast är dock att konsekvent köra med i eftersom exempelvis Surtsey ligger i Island men inte på Island. Samma sak med exempelvis Marsalforn som ligger i Malta men på Gozo. --افيراتير (diskussion) 15 september 2015 kl. 20.47 (CEST)
- Precis som Averater säger. Länder ska vara "i", och boten kategoriserar per land, inte per ö.~Att det dessutom finns en annan kategori för platser på ön Malta är inget som boten "tänker på". Notera att det i åtskilliga Maltaartiklar står i brödtexten både att det ligger i Malta (landet), och att de ligger på Malta (ön) . Lsj (diskussion) 15 september 2015 kl. 20.59 (CEST)
Lång sida
[redigera wikitext]Sidan Farajala är ganska lång, 47 187 byte. Det vore säkert bra att inte lämna så många tomma fält (t.ex. sju stycken other name). K9re11 (diskussion) 16 september 2015 kl. 20.52 (CEST)
- För de flesta sorters platser har jag hittat "avskalade" versioner av Geobox med enbart relevanta parametrar, men tyvärr inte för skogar och ytterligare ett par platstyper. Skulle kunna städa lite i den default-geobox som de platserna får. Lsj (diskussion) 18 september 2015 kl. 18.35 (CEST)
Sortering av indelningar
[redigera wikitext]Kategori:Indelningar i Luxemburg har två subkategorier Diekirch och Grevenmacher. Några stickprov säger att kommunerna har sorterats i kategorier som heter som de distrikt de ligger i. Men hierarkin stämmer inte. Indelningar i Luxemburg används ibland som om det handlar om landet och för det mesta som om det handlar om Distriktet. --Ettrig (diskussion) 17 september 2015 kl. 19.23 (CEST)
- Samma bugg som diskuterades i avsnitt #Kategorier här ovan. Kategorierna behöver särskiljningsled. Lsj (diskussion) 18 september 2015 kl. 18.33 (CEST)
Liten luring
[redigera wikitext]Schengen (olika betydelser) säger (som vanligt) att det är en ort och en kommun. Men Commune de Schengen, som kommunen kallas, har Lsjbot gjort till en omdirigering till Schengen, som någon för hand har gjort till en artikel både om orten och kommunen. Så det är riktigt (om än lite sorgligt) att Lsjbot inte har gjort sina stubbar om detta område. Men olika betydelser blev ju helt onödigt och ganska inkonsekvent. Men någon skada gör det nog inte, när jag tänker efter. --Ettrig (diskussion) 17 september 2015 kl. 20.00 (CEST)
- En helt logisk konsekvens av att den svenska artikeln var kopplad till ett Wikidata-objekt som var kopplad till Geonames post 2960107 som handlar om kommunhuvudorten. -- Innocent bystander 18 september 2015 kl. 09.22 (CEST)
- Som sagt, ingen skada skedd. Grensidor använder vi när läsaren behöver hjälp att orientera sig bland två eller flera sidor. Det behovet finns inte här. Det framgår av de data som Lsjbot "ser". Jag anar en inkonsekvens: Lsjbot "tycker" att orter och kommuner är olika saker. Jag antar att den "ser" i GeoNames vilken kategori respektive namn tillhör. Här har den upptäckt att dessa två objekt beskrivs av samma artikel. Det föranleder skapandet av omdirigerings-sidan. Att det då inte behövs någon förgreningssida följer logiskt. Det skulle kunna läggas in i koden. Men jag tycker att värdet av att göra det undantaget är försumbart. --Ettrig (diskussion) 18 september 2015 kl. 15.57 (CEST)
- Lösningen blir nu istället att sådana här konstigheter loggas i Användare:Lsjbot/Anomalier. Lsj (diskussion) 29 september 2015 kl. 16.14 (CEST)
- Som sagt, ingen skada skedd. Grensidor använder vi när läsaren behöver hjälp att orientera sig bland två eller flera sidor. Det behovet finns inte här. Det framgår av de data som Lsjbot "ser". Jag anar en inkonsekvens: Lsjbot "tycker" att orter och kommuner är olika saker. Jag antar att den "ser" i GeoNames vilken kategori respektive namn tillhör. Här har den upptäckt att dessa två objekt beskrivs av samma artikel. Det föranleder skapandet av omdirigerings-sidan. Att det då inte behövs någon förgreningssida följer logiskt. Det skulle kunna läggas in i koden. Men jag tycker att värdet av att göra det undantaget är försumbart. --Ettrig (diskussion) 18 september 2015 kl. 15.57 (CEST)
Gœsdorf igen och igen
[redigera wikitext]Lsjbot har skapat Gœsdorf (kommun) och Commune de Goesdorf. Förhoppningsvis beror detta på ett fel i GeoNames. Kan det möjligen alternativt vara en bot-bug? --Ettrig (diskussion) 18 september 2015 kl. 08.23 (CEST)
- Ser inte ut som en bot-bug. Den förstnämnda ligger i Canton de Wiltz enligt Geonames, medan den andra inte ligger i någon ADM2 alls. Det mest sannolika är nog att de är dubletter. -- Innocent bystander 18 september 2015 kl. 08.31 (CEST)
- Du menar dubletter i GeoNames? --Ettrig (diskussion) 18 september 2015 kl. 08.56 (CEST)
Samma fenomen finns för paret Redange-sur-Attert (kommun) och Commune de Redange/Attert. Jag tycker mig se ett mönster att man missar dubbleringen i GeoNames när namnen är mycket olika. --Ettrig (diskussion) 18 september 2015 kl. 08.30 (CEST)
- Tror det är lugnast att inte pilla i botkoden här, det blir svårt att få detta pålitligt rätt. Enligt diskussion här ovan nyligen är det bättre att vi är säkra på att få med allt; en och annan dublett är ett pris värt att betala. Lsj (diskussion) 18 september 2015 kl. 18.30 (CEST)
Clervaux (kommun)
[redigera wikitext]Jag tycker att Clervaux (kommun) ser ut som en bug. Den omdirigerar till kantonen. --Ettrig (diskussion) 18 september 2015 kl. 15.28 (CEST)
- Men buggen ligger nog även här i att det finns felaktiga Geonames-ID på Wikidata. -- Innocent bystander 18 september 2015 kl. 15.32 (CEST)
- Hur tänker du då? När jag tittar i GeoNames finner jag (Clervaux 6693297 ADM3) och (Canton de Clervaux 2960683 ADM2), olika namn, olika unik identiferare och olika objektkategorier. --Ettrig (diskussion) 18 september 2015 kl. 16.27 (CEST)
- Ja, men kantonartikeln länkar till Wikidata som i sin tur länkar till Geonames-ID 6693297 som handlar om kommunen. Lsjbot tror därför att Clervaux (kanton) handlar om en kommun. Det är därför logiskt för Lsjbot att omdirigera Clervaux (kommun) till den artikeln. Ja, det är fel, men felet kommer sannolikt från de kolbaserade användarna, sannolikt någon på enwp. Som du säger, det hade ofta varit bättre om vi sluppit dem! -- Innocent bystander 18 september 2015 kl. 16.35 (CEST)
- Ok, det låter som en logisk förklaring. Boten kollar så att det wd-objekt som hör till ett geonames-objekt hör till rätt kategori (Wd: Instance-of), men kategorisystemet på wikidata är så heterogent att detta bara kan göras ganska grovt - boten skiljer på orter och administrativa enheter på wikidata, men att skilja en ADM2 från en ADM3 i wikidata på något konsekvent och landsoberoende sätt ser jag inga förutsättningar för. Lsj (diskussion) 18 september 2015 kl. 18.28 (CEST)
- Ja, jag vill minnas att det finns exempel där två enheter har samma beteckning, men ligger på olika nivåer beroende på om man är inom ett storstadsområde eller inte. Ta bara County och City-begreppen i USA som ett välkänt exempel. I City of New York är County en nivå under staden, medan tex San Fransisco har City och County på samma nivå och standarden är att en city ligger under ett county. -- Innocent bystander 18 september 2015 kl. 20.45 (CEST)
- Ok, det låter som en logisk förklaring. Boten kollar så att det wd-objekt som hör till ett geonames-objekt hör till rätt kategori (Wd: Instance-of), men kategorisystemet på wikidata är så heterogent att detta bara kan göras ganska grovt - boten skiljer på orter och administrativa enheter på wikidata, men att skilja en ADM2 från en ADM3 i wikidata på något konsekvent och landsoberoende sätt ser jag inga förutsättningar för. Lsj (diskussion) 18 september 2015 kl. 18.28 (CEST)
- Ja, men kantonartikeln länkar till Wikidata som i sin tur länkar till Geonames-ID 6693297 som handlar om kommunen. Lsjbot tror därför att Clervaux (kanton) handlar om en kommun. Det är därför logiskt för Lsjbot att omdirigera Clervaux (kommun) till den artikeln. Ja, det är fel, men felet kommer sannolikt från de kolbaserade användarna, sannolikt någon på enwp. Som du säger, det hade ofta varit bättre om vi sluppit dem! -- Innocent bystander 18 september 2015 kl. 16.35 (CEST)
- Hur tänker du då? När jag tittar i GeoNames finner jag (Clervaux 6693297 ADM3) och (Canton de Clervaux 2960683 ADM2), olika namn, olika unik identiferare och olika objektkategorier. --Ettrig (diskussion) 18 september 2015 kl. 16.27 (CEST)
Vi har absolut ett fel i WD: Artikeln i WD om kantonen pekar på GeoNames för kommunen OCH artikeln i WD om kommunen (och orten (town)) pekar på artikeln om kantonen. Detta kan förklara att Lsjbot tycker att Clervaux (kommun) är en kanton. Men det förklarar inte att Lsjbot tycker att Clervaux (kommun) är kantonen Canton de Clervaux (kanton i Luxemburg). Den förklaringen finns i Lsjbots kod. men jag lyckas inte gissa den. Oavsett vilken denna källa är så borde Lsjbot kunna ändras så att den upptäcker denna diskrepans och flaggar för den. Vi får då en metod att upptäcka och rätta fel i WD. Jag låter detta fel i WD vara kvar ett tag till eftersom det kan vara av värde som underlag för den här undersökningen. --Ettrig (diskussion) 19 september 2015 kl. 08.46 (CEST)
- Det är här så rörigt efter alla ändringar att jag är tveksam till om jag är man nog till att reda ut det.
- Vad gäller Canton de Clervaux så tror jag den kan raderas. Den ser ut att bygga på att Geonames blandar ihop begreppen i vissa språk. -- Innocent bystander 19 september 2015 kl. 09.40 (CEST)
- Lsjbot letar i WD efter poster som har samma Geonames-ID som den artikel den håller på med. Om sådan finns, så kollar boten om det redan finns en artikel på svenska kopplad till den WD-posten. I så fall antar boten att det är en befintlig artikel om samma plats, och låter bli att skapa en dublett, utan skapar istället en omdirigering från artikeln den höll på med till den WD-kopplade artikeln. På det viset bör omdirigeringen från Clervaux (kommun) till Canton de Clervaux (kanton i Luxemburg) ha kommit till. Posten i WD om kommunen (och orten (town)) pekar inte på Geonames-posten om kantonen, utan på Geonames-posten om kantonhuvudstaden, som boten har länkat korrekt till Clervaux (kantonhuvudstad). Sedan innehåller den WD-posten en salig blandning av språklänkar till artiklar om staden eller kommunen eller båda två på olika språk. Lsj (diskussion) 19 september 2015 kl. 10.55 (CEST)
Chaumont
[redigera wikitext]På förgreningssidan Chaumont (har infogat) finns flera orter men motsvarande kommun saknas. T.ex. finns artikeln Chaumont-la-Ville fourth-order administrative division Geonames ID 6612598 på sv.wiki men boten skapade Chaumont-la-Ville (ort) populated place Geonames ID 3025880. Visste boten att Chaumont-la-Ville fanns och om så varför finns den inte på förgreningssidan? Är det anledningen till robotanomali? Oavsett det så tycker jag att befokningsskillnaden är för liten mellan dessa två objekt to motivera att det ska finnas en artikel om orten, kommunen 125 orten 110 invånare. Maundwiki (diskussion) 25 januari 2016 kl. 17.02 (CET)
- Boten bör ha "förstått" att den befintliga kommunartikeln handlar om rätt kommun. Men då borde kommunen ju förvisso ha kommit med i grensidan. Kan vara så att bara orten, men inte kommunen, har "Chaumont" (utan -la-Ville) som alternativ namnform. Ska kolla när jag kommer hem. Lsj (diskussion) 25 januari 2016 kl. 17.34 (CET)
- Det var som jag trodde. Bara orten, men inte kommunen, har "Chaumont" (utan -la-Ville) som alternativ namnform i GeoNames. Därför finns bara orten med i grensidan Chaumont. Lsj (diskussion) 25 januari 2016 kl. 19.03 (CET)
- Vargenau från Frankrike som har lagt in förgreningssidor för kommuner i Frankrike har inte lagt in kommuner som har tillägg som -la-Ville i dessa. Jag tror att det behövs på sv.wiki och därmed behöver förgreningssidan komplementeras. Puh! Behöver sv.wiki två artiklar för dessa små kommuner med orter i Frankrike? Se även redigeringskommentar [15]. Har säkert diskuterats tidigare. Vad syftar robotanomali på i denna förgreningssida? Maundwiki (diskussion) 25 januari 2016 kl. 20.40 (CET)
- Anomalin torde vara att två platser i listan har (nästan) samma koordinater, vilket ort och kommun brukar ha. Vi har tidigare diskuterat principfrågan att ort och kommun bör ha separata artiklar, men har inte sagt något om någon storleksgräns. Lsj (diskussion) 25 januari 2016 kl. 20.47 (CET)
- Är det baserat på storleken av svenska kommuner t.ex Uppsala tätorten och kommunen skiljer ganska mycket. Mina frågor kommer från hur att underhålla. Kommuner är inte för evigt. Klarar en bot att uppdatera X kommun uppgick i Y kommun och platsen X ligger nu i Y kommun? I ett längre perspektiv är allt detta färskvara. Botkörningen ger en bild av nu och sedan måste allt underhållas. Kan botar generera geodata "ändringar Q4 2015", lägga till t.ex. en kategori i berörda artikelar och skriva ändringen på diskussionssidan om den inte kan lägga i text av artikeln. Detta innebär inte att du måste göra detta men med alla botgenerarde artiklar som finns bör botar uppdatera eller skapa flaggor för att skribenter ska lätt se att det behöver uppdateras. Jag följer inte mycket av diskuterandet så det kan redan finnas en plan men jag tror att det bör beslutas för varje land. Maundwiki (diskussion) 26 januari 2016 kl. 14.19 (CET)
- Nej, det baserar snarare på att tätort och kommun är olika sorters företeelser. En kommun är en abstrakt administrativ enhet, som inte behöver ha ens ett fysiskt territorium (se Gemensamma Distriktet). En tätort är en fysisk ansamling av hus där det bor folk. Inte alls samma sak, även om de ibland nära nog sammanfaller både för små och stora kommuner - tätorten Malmö fyller ganska exakt Malmö kommuns territorium. Lsj (diskussion) 26 januari 2016 kl. 14.43 (CET)
- Nja, skattekommun i Sverige kan nog inte tillämmpas i Frankrike eller Användardiskussion:Lsjbot/Projekt alla platser#Nicaragua och jag tror inte det är vad som avses i dessa fall. Här i Frankrike har kommunen en väl avgränsad yta medan orten verkar ha fått en kvadrat som enbart innehåller en del av den centrala bebyggelsen. Till mig verkar det som om detta bör diskuteras och hanteras per land. Maundwiki (diskussion) 26 januari 2016 kl. 18.11 (CET)
- Uppdatering är nog värt en egen diskussion. Lsj (diskussion) 26 januari 2016 kl. 14.44 (CET)
- Nej, det baserar snarare på att tätort och kommun är olika sorters företeelser. En kommun är en abstrakt administrativ enhet, som inte behöver ha ens ett fysiskt territorium (se Gemensamma Distriktet). En tätort är en fysisk ansamling av hus där det bor folk. Inte alls samma sak, även om de ibland nära nog sammanfaller både för små och stora kommuner - tätorten Malmö fyller ganska exakt Malmö kommuns territorium. Lsj (diskussion) 26 januari 2016 kl. 14.43 (CET)
- Är det baserat på storleken av svenska kommuner t.ex Uppsala tätorten och kommunen skiljer ganska mycket. Mina frågor kommer från hur att underhålla. Kommuner är inte för evigt. Klarar en bot att uppdatera X kommun uppgick i Y kommun och platsen X ligger nu i Y kommun? I ett längre perspektiv är allt detta färskvara. Botkörningen ger en bild av nu och sedan måste allt underhållas. Kan botar generera geodata "ändringar Q4 2015", lägga till t.ex. en kategori i berörda artikelar och skriva ändringen på diskussionssidan om den inte kan lägga i text av artikeln. Detta innebär inte att du måste göra detta men med alla botgenerarde artiklar som finns bör botar uppdatera eller skapa flaggor för att skribenter ska lätt se att det behöver uppdateras. Jag följer inte mycket av diskuterandet så det kan redan finnas en plan men jag tror att det bör beslutas för varje land. Maundwiki (diskussion) 26 januari 2016 kl. 14.19 (CET)
- Anomalin torde vara att två platser i listan har (nästan) samma koordinater, vilket ort och kommun brukar ha. Vi har tidigare diskuterat principfrågan att ort och kommun bör ha separata artiklar, men har inte sagt något om någon storleksgräns. Lsj (diskussion) 25 januari 2016 kl. 20.47 (CET)
- Vargenau från Frankrike som har lagt in förgreningssidor för kommuner i Frankrike har inte lagt in kommuner som har tillägg som -la-Ville i dessa. Jag tror att det behövs på sv.wiki och därmed behöver förgreningssidan komplementeras. Puh! Behöver sv.wiki två artiklar för dessa små kommuner med orter i Frankrike? Se även redigeringskommentar [15]. Har säkert diskuterats tidigare. Vad syftar robotanomali på i denna förgreningssida? Maundwiki (diskussion) 25 januari 2016 kl. 20.40 (CET)
- Det var som jag trodde. Bara orten, men inte kommunen, har "Chaumont" (utan -la-Ville) som alternativ namnform i GeoNames. Därför finns bara orten med i grensidan Chaumont. Lsj (diskussion) 25 januari 2016 kl. 19.03 (CET)
Apostrofen i Vallée de l’Ernz
[redigera wikitext]Vallée de l’Ernz innehåller en konstig apostrof. (Det är alltså inte samma som i Vallée de l'Ernz.) När jag försöker att själv skriva detta namn i en wikilänk så blir den röd. Om jag kopierar det röda namnet till sökrutan så får jag träff. När jag klickar på den röda länken och försöker skap en omdirigeringssida så tycker WP att jag gör en omdirigering till sig själv. Jag föreslår att Lsjbot ersätter denna apostrof med den vanliga. Det är den som används till exempel i denna kommuns namn i engelska WP. --Ettrig (diskussion) 19 september 2015 kl. 16.30 (CEST)
- Detta är lite knepigt, eftersom geografiska namn ganska ofta ska innehålla konstiga tecken av olika slag. Att generellt byta ut ’ mot ' är jag därför lite tveksam till. Men boten borde ha skapat en omdirigeringssida från namnet med vanlig apostrof - kanske den också stupar på att wikipediasystemet tycker att det vore en självomdirigering? Låter faktiskt som en bugg i wiki-mjukvaran, att den inte hanterar dessa tecken konsekvent. Nu har jag iallafall för hand lyckats skapa en fungerande omdirigering så att namnet med vanlig apostrof är blått. Lsj (diskussion) 19 september 2015 kl. 16.51 (CEST)
- Kanske värt att anmärka att ’ används åtminstone i finska och tyska Wikipedia, t.ex. de:Xi’an och fi:Xi’an. Jag tycker själv det är helt bra att använda det tecknet, men såvitt jag förstått brukar man inte göra så i svenskspråkiga Wikipedia. K9re11 (diskussion) 19 september 2015 kl. 17.27 (CEST)
Rundgång Diekirch (olika betydelser). Maundwiki (diskussion) 19 september 2015 kl. 16.40 (CEST)
- Tack. Boten gjorde ursprungligen en omdirigering till den då existerande artikeln Diekirch. Sedan visade det sig vara en rejäl härva kring olika betydelser av Diekirch, (liksom flera andra luxemburgska kommuner/orter), se #Diekirchs många roller här ovan, och huvudordet Diekirch gjordes till en (omdirigering till) grensida. Att det då blev rundgång förbisågs tyvärr. Lsj (diskussion) 19 september 2015 kl. 16.42 (CEST)
Hesperange
[redigera wikitext]Hesperange (olika betydelser) har två länkar till samma artikel, hävdande olika betydelser. --Ettrig (diskussion) 19 september 2015 kl. 22.32 (CEST)
- Ser ut som samma typ av fel som vi har sett ganska många exempel på i Luxemburg -- kommun och kommunhuvudort hålls inte isär på bl.a. Wikidata, och boten "tror" att båda platserna ska länkas till det hopblandade. Svårt att få boten att göra rätt (och vad är "rätt", när WD är fel?), men att börja skapa parallellartiklar även när boten "tror" att det redan finns en artikel (som diskuterats här ovan) gör det åtminstone lättare att åtgärda felen. Lsj (diskussion) 19 september 2015 kl. 22.44 (CEST)
- Ja, orsakerna är kanske samma. Men yttringen är lite speciell här. Lsjbot skapar en grensida som bara innehåller två länkar och de länkarna är till samma sida. Jag tänker mig att det vore förhållandevis enkelt att lägga in ett test på detta fenomen. Rimligen har Lsjbot alla fakta tillgängliga just när grensidan tillverkas. Det testet skulle kunna fylla på i en lista med konstigheter, som vi kolföreningar får titta på. Usch, det här börjar bli alldeles för likt lönejobbet. --Ettrig (diskussion) 20 september 2015 kl. 00.25 (CEST)
- En procedur som flaggar de problem vi diskuterade kring #Homonymen Bourscheid här ovan skulle enkelt kunna fånga upp även Hesperange. Lsj (diskussion) 20 september 2015 kl. 10.30 (CEST)
- Boaco (olika betydelser) --Ettrig (diskussion) 20 september 2015 kl. 07.57 (CEST)
- Ja, orsakerna är kanske samma. Men yttringen är lite speciell här. Lsjbot skapar en grensida som bara innehåller två länkar och de länkarna är till samma sida. Jag tänker mig att det vore förhållandevis enkelt att lägga in ett test på detta fenomen. Rimligen har Lsjbot alla fakta tillgängliga just när grensidan tillverkas. Det testet skulle kunna fylla på i en lista med konstigheter, som vi kolföreningar får titta på. Usch, det här börjar bli alldeles för likt lönejobbet. --Ettrig (diskussion) 20 september 2015 kl. 00.25 (CEST)
- Ett ytterligare problem är att även svwp blandar ihop kommun och tätort i många fall (se t.ex. Uleåborg), och då har jag svårt att se annat än att det är korrekt av boten att länka dit för båda betydelserna. Lsj (diskussion) 19 september 2015 kl. 22.49 (CEST)
- Blandar ihop? Vi måste respektera att man kan vilja ha kommun och ort i samma artikel. Uppenbarligen är det väldigt många som vill det. Men det ställer verkligen till problem i wikilänkcentret (WD). Kan vi komma på någon bra rutin för att hantera dessa relationer i WD när en del språkversioner har kombo-artiklar och andra har uppdelade artiklar? Jag har inte kunnat komma på någon. --Ettrig (diskussion) 20 september 2015 kl. 00.25 (CEST)
- Ja, blandar ihop. Kommun och ort är olika företeelser. Många vill uppenbarligen blanda ihop dem, men precis som du säger ställer detta till med problem. Jag ser tyvärr heller inte någon lösning. Lsjbot håller isär begreppen i sin egen verksamhet, och det ska den fortsätta med, men det är hopplöst med iw-länkningen. Lsj (diskussion) 20 september 2015 kl. 10.30 (CEST)
- Det finns fasta regler för hur sådant på WD. Kombo-artiklar ska länka till varandra, kommunartiklar ska länka till varandra och ortartiklar ska länka till varandra. De ska aldrig blandas. Vill vi ha en interwiki från en kombo-artikel till en ren kommun eller en ren ort-artikel får vi göra det lokalt enligt den gamla stilen eller med hjälp av en modul som kompletterar saknade interwiki automatiskt. -- Innocent bystander 20 september 2015 kl. 13.27 (CEST)
- Hade varit trevligt om de reglerna hade följts... En kombo-post på WD borde då aldrig någonsin länka till ett Geonames-objekt, och språklänkarna borde aldrig blanda komboartiklar med rena artiklar, men så sker i var och varannan artikel nu. Lsj (diskussion) 20 september 2015 kl. 14.38 (CEST)
- Efterlevnaden är ytterst dålig, ja! Mycket för att de användare på WD som aktivt jobbar med detta, bara en liten fraktion av de användare på alla projekt som blandar dem. Jag höll själv på med detta aktivt under några månader, varefter jag frustrerat gav upp. Nästan allt arbete återställdes efter några månader av WD-newbies. -- Innocent bystander 20 september 2015 kl. 14.56 (CEST)
- Jag börjar också överväga att ge upp att försöka WD-länka orter och kommuner. När det är fel på WD är det hopplöst för boten att få det rätt, och jag börjar tröttna på alla diskussioner som varje fel leder till. Lsj (diskussion) 20 september 2015 kl. 15.01 (CEST)
- Efterlevnaden är ytterst dålig, ja! Mycket för att de användare på WD som aktivt jobbar med detta, bara en liten fraktion av de användare på alla projekt som blandar dem. Jag höll själv på med detta aktivt under några månader, varefter jag frustrerat gav upp. Nästan allt arbete återställdes efter några månader av WD-newbies. -- Innocent bystander 20 september 2015 kl. 14.56 (CEST)
- Hade varit trevligt om de reglerna hade följts... En kombo-post på WD borde då aldrig någonsin länka till ett Geonames-objekt, och språklänkarna borde aldrig blanda komboartiklar med rena artiklar, men så sker i var och varannan artikel nu. Lsj (diskussion) 20 september 2015 kl. 14.38 (CEST)
- Det finns fasta regler för hur sådant på WD. Kombo-artiklar ska länka till varandra, kommunartiklar ska länka till varandra och ortartiklar ska länka till varandra. De ska aldrig blandas. Vill vi ha en interwiki från en kombo-artikel till en ren kommun eller en ren ort-artikel får vi göra det lokalt enligt den gamla stilen eller med hjälp av en modul som kompletterar saknade interwiki automatiskt. -- Innocent bystander 20 september 2015 kl. 13.27 (CEST)
- Ja, blandar ihop. Kommun och ort är olika företeelser. Många vill uppenbarligen blanda ihop dem, men precis som du säger ställer detta till med problem. Jag ser tyvärr heller inte någon lösning. Lsjbot håller isär begreppen i sin egen verksamhet, och det ska den fortsätta med, men det är hopplöst med iw-länkningen. Lsj (diskussion) 20 september 2015 kl. 10.30 (CEST)
- Blandar ihop? Vi måste respektera att man kan vilja ha kommun och ort i samma artikel. Uppenbarligen är det väldigt många som vill det. Men det ställer verkligen till problem i wikilänkcentret (WD). Kan vi komma på någon bra rutin för att hantera dessa relationer i WD när en del språkversioner har kombo-artiklar och andra har uppdelade artiklar? Jag har inte kunnat komma på någon. --Ettrig (diskussion) 20 september 2015 kl. 00.25 (CEST)
WD-baserad Modul-lösning för att ha interwiki mellan två artiklar som inte delar objekt
[redigera wikitext]lad:Módulo:Interwiki är jag mannen bakom (i princip). Den är kopierad från något jag satte ihop på Wikisoruce. Den modulen gör det möjligt att ha interwiki mellan "Långbortisburgs kommun och tätort" på ett projekt och "Långtbortisburgs kommun" på ett annat, trots att de inte delar objekt på WD. Ändringar på WD i dessa objekt ändras i princip i realtid och man slipper lägga in den gamla typen av interwikilänkar, som robotarna idag ändå struntar i att uppdatera. På ladwiki används den främst i artiklar där man på ladwiki har två artiklar, en med latinskt skrift och en med någon annat skript som jag inte minns vilket det är. -- Innocent bystander 20 september 2015 kl. 15.21 (CEST)
San José de los Remates, folkmängd
[redigera wikitext]San José de los Remates visar ett ytterligare problem med sammanblandningen av ort och kommun. Artikeln säger tydligt att den handlar om orten. Men den befolkningssiffra som anges gäller för kommunen. I det här fallet är skillnaden ungefär en faktor 4. --Ettrig (diskussion) 20 september 2015 kl. 08.27 (CEST)
I själva verket är enwiki ganska förvirrad i denna fråga. Så här säger en:Template:Infobox settlement: This template should be used to produce an Infobox for human settlements (cities, towns, villages, communities) as well as other administrative districts, counties, provinces, etcetera - in fact, any subdivision below the level of a country. Denna mall innehåller ett fält för urban befolkning. Men det framgår inte om det avser befolkningen i största orten, administrativt centrum eller alla orter över en viss storlek (vilken storlek då, i så fall). Jag tror att vi helt enkelt måste avstå från att använda denna källa för befolkningssiffror för orter. --Ettrig (diskussion) 20 september 2015 kl. 08.45 (CEST)
- I det här fallet handlar åtminstone WD-posten entydigt om orten. Tyvärr innehåller inte WD någon befolkningssiffra, och då går boten vidare till de största språkversionerna och försöker hitta en "population"-parameter i en infobox. Den gör likadant även med area. Detta kan bli fel när artiklarna inte helt matchar. Jag gjorde en systematisk jämförelse mellan GeoNames och vad boten plockar upp från wiki för ett tag sedan, se #Är GeoNames pålitligt? här ovan. Tanken var att testa GeoNames, men det blir ju ett test även av wiki-siffrorna. I de allra flesta fall var GeoNames och wiki hyfsat överens, men det fanns en minoritet som var fel, ibland pga sådana här sammanblandningar, men ibland också rena fel i endera källan.
- En kritisk punkt här är att många orter saknar befolkningssiffra i GeoNames, och då finns bara wiki-siffran att tillgå. Om boten inte har någon befolkningssiffra alls för en ort så avstår den från att skapa en artikel. Det blir betydligt färre ort-artiklar om boten inte använder wiki-siffrorna. Frågan är hur många korrekta artiklar vi vill avstå från för att slippa en felaktig? Lsj (diskussion) 20 september 2015 kl. 10.21 (CEST)
- Jag tycker det är OK med ort-artiklar utan befolkningssiffra. Men det är bättre med en ortartikel med kommunens befolkningssiffa än ingen artikel alls. Möjligen skulle det vara bättre med urban population än total population (för en ort, när urban population finns). --Ettrig (diskussion) 21 september 2015 kl. 09.08 (CEST)
- Har ändrat i koden så att boten ska plocka upp urban population för orter och total population för administrativa enheter, om båda uppgifterna finns på den wiki som den plockar från. Orter utan befolkningssiffra är jag lite tveksam till, GeoNames innehåller flera miljoner byhålor med tvivelaktig relevans, och jag använder avsaknad av befolkningssiffra för att sortera bort dem. Lsj (diskussion) 21 september 2015 kl. 10.14 (CEST)
Format för area i geobox
[redigera wikitext]@Lsj: Decimaltecken ska vara punkt i parametervärden i mallen Geobox. Mallen formaterar det sedan till komma för rätt visning enligt lokala regler, till exempel komma på svwp. Rätt decimaltecken, punkt alltså, behövs för att automatiska beräkningar av till exempel befolkningstäthet ska fungera som avsett. Se min ändring här. --Larske (diskussion) 20 september 2015 kl. 08.39 (CEST)
- Ok, fixat i koden. Tänkte inte på det där med automatiska beräkningar. Tack för att du påminde mig. Lsj (diskussion) 20 september 2015 kl. 10.09 (CEST)
Lsjbot förstör layouten av mallkoden i Geobox
[redigera wikitext]@Lsj: Det ser ut som om Lsjbot generellt förstör layouten i mallkoden för Geobox genom att ta bort radmatningar framför de avsnittsskiljande kommentarerna, till exempel <!-- *** Länder, regioner mm *** -->. Jag tycker det blir svårare att läsa mallkoden när dessa kommentarer inte står på egen rad. Är detta avsiktligt eller ett rent misstag? --Larske (diskussion) 20 september 2015 kl. 08.46 (CEST)
- Det beror nog på vissa tekniska begränsningar i DotNetWikiBot. Jag har själv haft problemet att sådant som ligger mellan <!-- och --> försvinner. -- Innocent bystander 20 september 2015 kl. 09.44 (CEST)
- Boten börjar med en tom Geobox-mall, som innehåller korrekta radframmatningar. Sedan använder den DotNetWikiBots rutiner för mallhantering för att fylla den, och någonstans i den processen försvinner uppenbarligen radframmatningarna. Hade problem också med att den första namnlösa parametern som anger typ av plats misshandlades av DNWB, något som jag löste "brute force" genom att återställa den explicit i slutet av processen. Skulle förmodligen gå att göra något liknande med kommentarerna. Lsj (diskussion) 20 september 2015 kl. 10.02 (CEST)
Varför är "Simmertal (församlingshuvudort)" med i listan? Ingen position matchar positionen för [16]]. Plus "Simmern (furstendöme)" [17], en ätt? Inlagd först och har wikilänkar. Maundwiki (diskussion) 20 september 2015 kl. 14.17 (CEST)
- Positionen för "Simmertal (församlingshuvudort)" matchar positionen för Simmertal på enwp (notera decimalgrader vs. grad/minut/sekund). Men här finns rejäla problem med särskiljningsleden, relaterade till den bugg som orsakade #Homonymen Bourscheid här ovan. Lsj (diskussion) 20 september 2015 kl. 14.35 (CEST)
- Ingen match för position av engelska artikeln Simmern inte Simmertal. Maundwiki (diskussion) 20 september 2015 kl. 22.56 (CEST)
- Då missuppfattade jag din fråga. GeoNames anger Simmern som en alternativ namnform för Simmertal, därför finns den med på grensidan för Simmern. De engelska artiklarna en:Simmern och en:Simmern, Westerwaldkreis matchar två av de andra platserna i listan. För övrigt tror jag ätten borde heta Pfalz-Simmern på svenska (jfr de:Pfalz-Simmern), vi brukar oftast använda tyska namnformer för pfalzgrevar. Lsj (diskussion) 20 september 2015 kl. 23.36 (CEST)
- ... och när jag sparar märker jag att Pfalz-Simmern är en blålänk, den fanns visst redan :) Lsj (diskussion) 20 september 2015 kl. 23.42 (CEST)
- omdirigering till Lista över huset Wittelsbach och sektionen "Linjen Pfalz-Simmern" som är en list av namn, tveksam om omdirigeringen ska vara kvar. Tyska artikeln Pfalz-Simmern förklarar släkten. Jag sökte via interwiki och omdirigeringar finns inte i interwiki. Maundwiki (diskussion) 21 september 2015 kl. 00.22 (CEST)
- Ingen match för position av engelska artikeln Simmern inte Simmertal. Maundwiki (diskussion) 20 september 2015 kl. 22.56 (CEST)
Hobscheid
[redigera wikitext]I Septfontaines (kommun) (disk • historik • logg) finns en länk till Hobscheid (kommun) i brödtexten. Vad syftar denna till? -- Innocent bystander 23 september 2015 kl. 16.10 (CEST)
Septfontaines (kommun) innehåller påståendet "Hobscheid." eller dylikt. Detta är en förkrymt beskrivning av vilka kommuner den gränsar till. Men den här gången beror det inte på att Septfontaines gränsar till bara en kommun. För den gränsar till tre kommuner i samma kanton och minst två kommuner i andra kantoner. Möjligen nämner GeoNames bara en kommun. Ska kolla det. --Ettrig (diskussion) 23 september 2015 kl. 16.15 (CEST)
(Till bystander: Under rubriken Lite skräp, ovan, diskuteras ett mycket likartat problem. --Ettrig (diskussion) 23 september 2015 kl. 16.18 (CEST)
Det är WD som har en ofullständig lista med grannar. --Ettrig (diskussion) 23 september 2015 kl. 16.20 (CEST)
- Ja, uppgifterna om "grannar" tas från WD. Buggen som gjorde att det bara står "Hobscheid" är fixad i koden. Ska göra ett svep snart och fixa både det och annat i de befintliga artiklarna. Lsj (diskussion) 23 september 2015 kl. 17.03 (CEST)
- Jag anade att det rörde sig om grannar då man ser de två orterna när man zoomar ut, men det stod inget alls i artikeln som förklarade sammanhanget.
- En varning, använd INTE vänort på Wikidata. Det är en av de sämst källbelagda propertys som finns där. För det första så länkar man ofta fel artikel, och nästan aldrig går uppgiften att bekräfta. Sammantaget brukar man få ta bort eller justera över 75% av dessa påståenden. -- Innocent bystander 23 september 2015 kl. 17.40 (CEST)
- Ok, bra att veta. Tar bort vänorter från min "att göra"-lista :) Jag börjar bli ganska besviken på Wikidata, trodde det var bättre kvalitet där. Lsj (diskussion) 23 september 2015 kl. 22.55 (CEST)
- När mer eller mindre allt är "importerat från Wikipedia" så.... -- Innocent bystander 24 september 2015 kl. 07.34 (CEST)
- Ok, bra att veta. Tar bort vänorter från min "att göra"-lista :) Jag börjar bli ganska besviken på Wikidata, trodde det var bättre kvalitet där. Lsj (diskussion) 23 september 2015 kl. 22.55 (CEST)
Namn på ett 2 919 meter högt berg?
[redigera wikitext]- inkopierat från WP:FF#Namn på ett 2 919 meter högt berg?
Ber er ta del av Diskussion:Logotuli#Finns det ett namn på ett 2 919 meter högt berg? --Allexim (diskussion) 24 september 2015 kl. 21.29 (CEST)
- Uppenbarligen inte i Geonames i alla fall. Verkar som det stora bergsmassivet med många ännu högre berg ligger i den riktningen. Kan det vara så att denna punkt ligger mycket nära gränsen för den ruta/cirkel där höjddata har analyserats? Om man i så fall ligger på kanten av ett stort bergsmassiv, så kanske boten riskerar att fånga någon ganska obetydlig puckel, medan de berg en mänsklig användare skulle fastna för ligger lite utanför den valda radien? Om det är skriptat så, borde man kanske se till att det finns ett tydligt krön, så att det inte bara är radiens längd som ger en godtycklig punkt på bergssluttningen (eller hittar en liten puckel på sidan av ett större berg straxt utanför radien). Känns lite halvknepigt att koda, men värt att iaf fundera på om det inte är löst redan. (kanske det i själva verket faktiskt finns ett påtagligt berg just där, som bara råkar saknas i Geonamnes - i så fall är det förstås intet problem). @Allexim: Taxelson (diskussion) 24 september 2015 kl. 21.55 (CEST)
- Boten "tittar" inom en radie som är betydligt mer än 2,4 km - tror det var 20 km. Inom den cirkeln väljs den punkt som är högst över den lokala horisonten (och mer än några få pixels bort, så att en annan del av samma kulle inte räknas). Skulle vara ganska lätt att koda så att boten om den får en höjdpunkt precis på kanten av cirkeln ökar radien något och försöker igen. Men om det är ett problem, så skulle vi ha många "högsta punkten" som ligger nästan 20 km bort, och det har jag inte sett. Lsj (diskussion) 24 september 2015 kl. 22.55 (CEST)
- OK, då verkar min oro obefogad! För Allexims fråga behövs helt enkelt en annan kartbok än GeoNames! En typisk uppgift för någon icke-bot, alltså! Taxelson (diskussion) 24 september 2015 kl. 23.10 (CEST)
- Boten "tittar" inom en radie som är betydligt mer än 2,4 km - tror det var 20 km. Inom den cirkeln väljs den punkt som är högst över den lokala horisonten (och mer än några få pixels bort, så att en annan del av samma kulle inte räknas). Skulle vara ganska lätt att koda så att boten om den får en höjdpunkt precis på kanten av cirkeln ökar radien något och försöker igen. Men om det är ett problem, så skulle vi ha många "högsta punkten" som ligger nästan 20 km bort, och det har jag inte sett. Lsj (diskussion) 24 september 2015 kl. 22.55 (CEST)
Rumelange (kommunhuvudort)
[redigera wikitext]Rumelange (kommunhuvudort) raderades av Lsj och har sedan inte återskapats. Är detta en bug eller ett databasfel? Det känns likt tidigare diskussioner, men inte exakt samma. Orten (PPL) finns i GeoNames, annars skulle namnet inte ha dykt upp alls, förstås. Men här är alltså Lsj och Lsjbot inte överens. Lsjbot har skapat (väl?) artikeln och lagt in den i grensida Rumelange. Men Lsj har tagit bort artikeln och lämnat kvar referensen i grensidan. --Ettrig (diskussion) 27 september 2015 kl. 08.00 (CEST)
- Efter den raderingen omskapade jag artiklarna men lät grensidorna vara de gamla. Ska fixa grensidorna också, men har inte hunnit dit ännu (måste generera om artikelnamnen för hela världen till grensidorna, och det har varit mycket annat att fixa också...). I mellantiden kan där finnas inkonsekvenser. Osäker på vart just Rumelange tog vägen, behöver kolla det när jag kommer hem (är på tjänsteresa nu, sitter på Arlanda och skriver). Lsj (diskussion) 27 september 2015 kl. 17.15 (CEST)
0 är en kort sträcka
[redigera wikitext]Enligt artikeln Ville de Luxembourg (kommun i Luxemburg) ligger denna kommun 0 km sydost om huvudstaden Luxemburg. Det är ett sant, men för en läsare som inte förstår programmerarens situation måste de upplevas mycket märkligt. Det skulle ju gå att filtrera bort 0 (som man måste göra vid division). Det blir nog inte så många, men kanske några hundra ändå. --Ettrig (diskussion) 27 september 2015 kl. 13.21 (CEST)
- Ja, noll avstånd borde naturligtvis filtreras bort, det hade jag förbisett. Kanske man kan ha en annan formulering, så att om avståndet är mindre än x km skriver boten att platsen "ligger i huvudstaden...". Lsj (diskussion) 27 september 2015 kl. 17.10 (CEST)
Samma artikel i mer än en gren i grensida
[redigera wikitext]Bertrange säger (bland annat) att Bertrange (kommun) ligger i Frankrike. Detta påstående är felaktigt. Möjligen detekteras detta problem av det filter vi redan har diskuterat. Men jag är osäker. --Ettrig (diskussion) 27 september 2015 kl. 15.52 (CEST)
Jo, det är samma som under rubriken Hesperange, ovan. --Ettrig (diskussion) 27 september 2015 kl. 15.57 (CEST)
- Kommer att åtgärdas när jag gör om alla grensidorna inom en snar framtid. Lsj (diskussion) 27 september 2015 kl. 17.17 (CEST)
- När jag kommer till en botskapad grensida som behöver tillägg eller ändringar så gör jag det. Innebär kommentaren "göra om alla grensidor" att boten inte tar med dessa ändringar? Maundwiki (diskussion) 30 september 2015 kl. 13.41 (CEST)
Tom specificering
[redigera wikitext]Betzdorf är en grensida. Den hänvisar bland annat till Betzdorf () i Tyskland. Här är det väl något som fattas? --Ettrig (diskussion) 27 september 2015 kl. 19.24 (CEST)
- Ja, det är ett rent misstag i min datafil med länders beteckningar på administrativa enheter. Fixat i filen, blir fixat på wiki när jag gör om grensidorna. Lsj (diskussion) 27 september 2015 kl. 19.56 (CEST)
Förväxling av Distrikt och Kommun/ort Grevenmacher
[redigera wikitext]Grevenmacher (olika betydelser) och alla kommunartiklar och ort-artiklar som Lsjbot skapat för kommuner i Grevenmacher (distrikt) säger att distriktet beskrivs i artikeln Grevenmacher. (Tror jag, har inte undersökt alla.) --Ettrig (diskussion) 27 september 2015 kl. 20.24 (CEST)
- Det här är ett problem som är svårt att komma runt. Boten letar ju efter befintliga artiklar om en plats (för att inte skapa dubletter), och här hittar den Grevenmacher. Boten kollar då om den befintliga artikeln dels har rätt koordinater, och dels handlar om rätt typ av plats (administrativ enhet). I det här fallet stämmer båda sakerna, och boten drar slutsatsen att artikeln redan finns och låter bli att skapa (och låter bli att leta vidare, så den hittar aldrig Grevenmacher (distrikt)), och länkar till den befintliga artikeln.
- En partiell lösning är det vi har diskuterat tidigare här ovan, att boten skapar artiklar även när den "tror" att artikeln redan finns, men lägger dessa på ett särskilt ställe utanför huvudnamnrymden. Så tänker jag göra i nästa körning. Det kräver ju manuell efterbearbetning, men åtminstone finns det då något att utgå ifrån, och en lista skapas med de artiklar som behöver manuell kontroll. Lsj (diskussion) 28 september 2015 kl. 08.15 (CEST)
- Användare:Larske ändrade snabbt dessa länkar efter förfrågan på Wikipedia:Begäran om robothjälp. Min tolkning är att detta är ett förhållandevis lätthanterligt problem. --Ettrig (diskussion) 28 september 2015 kl. 13.42 (CEST)
- Ja, varje enskilt fall är lätt att fixa. Men det måste nog ske fall för fall tyvärr. Lsj (diskussion) 28 september 2015 kl. 14.14 (CEST)
- Användare:Larske ändrade snabbt dessa länkar efter förfrågan på Wikipedia:Begäran om robothjälp. Min tolkning är att detta är ett förhållandevis lätthanterligt problem. --Ettrig (diskussion) 28 september 2015 kl. 13.42 (CEST)
- Problemen bör bli hanterbara om du genererar checklistan och trappar upp i lagom takt. I värsta fall ger du upp. I näst värsta fall blir det mer programmeringsarbete än du hade hoppats. Men troligtvis blir felen tillräckligt få och oskyldiga för att du ska kunna köra på. --Ettrig (diskussion) 28 september 2015 kl. 14.55 (CEST)
Platsnamn: engelska eller lokala?
[redigera wikitext]Under rubriken #Narvskoye Vodokhranilishche togs upp ett problem i GeoNames för Estland: Geonames anger som default en engelsk namnform, och i Estland är detta ofta en engelsk transkribering av det ryska namnet, vilket är mindre lämpligt som svenskt artikelnamn. En möjlig lösning är att boten, för de orter som har wd-koppling, plockar upp artikelnamnet från estniska wikipedia och använder deras namn som artikelnamn på svwp. Är detta en lämplig lösning, och i så fall i vilka länder? Lsj (diskussion) 29 september 2015 kl. 11.48 (CEST)
- Det här låter mycket svårt. Jag skulle personligen föredra att genomgående använda estniska namn för "platser" i Estland. Men det är nog inte okontroversiellt. Många av orterna har övervägande rysktalande befolkning. --Ettrig (diskussion) 29 september 2015 kl. 12.29 (CEST)
- Med tanke på att jag själv är glad över att svenska namn används i de flesta språk för ställen som Karis, som har svensk majoritet, förstår jag problemet. Å andra sidan är estniska enda officiella språk i Estland, och då GeoNames transkriberar enligt engelskan är det nog bättre med estniska namn. K9re11 (diskussion) 29 september 2015 kl. 13.09 (CEST)
- Ok. Jag tänker göra detta i de tre baltiska länderna. Är det fler länder som bör få samma specialbehandling? Lsj (diskussion) 30 september 2015 kl. 20.08 (CEST)
- Kanske Uzbekistan? Jag har den uppfattningen att de använder det latinska alfabetet. Jag har dock ingen aning hur mycket ryska används där. Sedan vet jag inte hur standarden är med uzbekiska, transkriberade namn verkar användas en del. K9re11 (diskussion) 30 september 2015 kl. 20.28 (CEST)
- Ja, det gör de numera, och mitt intryck när jag var där är att de medvetet distanserar sig från ryska namnformer. Sedan är jag föralldel inte säker på Oʻzbekiston är mer POMMF på svenska än Uzbekistan. Lsj (diskussion) 30 september 2015 kl. 21.08 (CEST)
Noternas detaljeringsgrad
[redigera wikitext]Varje artikel innehåller ju ett antal noter, som bland annat mycket kort anger vilka data boten använt för att räkna ut olika saker. Frågan har väckts bl.a. på Diskussion:Logotuli om inte dessa noter borde vara betydligt mer explicita. Detta går att göra enkelt nog, men noterna skulle då bli längre än brödtexten i en normal artikel - wp:OVIKT. Alternativt kunde man i noterna länka till utförligare förklaringar i en projektundersida, eller rentav länka till själva botkoden. Tankar om detta? Lsj (diskussion) 29 september 2015 kl. 16.27 (CEST)
- Jag tror inte omfattningen av noterna berörs av ngn OVIKT-policy. Så notapparatens storlek är nog inget problem i sig.
- Men min åsikt är att vi nog inte ska göra artiklarna till läroböcker i programmering.
- Inte ens inom datavetenskap har jag sett mycket mer än schematiska beskrivningar av algoritmerna i själva artiklarna, så låt det stanna i projekt/användarnamnrymden. -- Innocent bystander 30 september 2015 kl. 08.01 (CEST)
- Jag håller på att skapa Användare:Lsjbot/Algoritmer, och låter noterna hänvisa dit. Lsj (diskussion) 10 oktober 2015 kl. 10.04 (CEST)
Värt besväret att identifiera bergskedjor?
[redigera wikitext]Har funderat en del på hur boten skulle kunna identifiera vilken bergskedja ett berg hör till. Det är ganska klurigt, och skulle kräva en omfattande programmeringsinsats, och skulle bli långt ifrån 100% pålitligt. Men för en hygglig andel av de 40 000 bergskedjorna (och "kullkedjorna") i GeoNames skulle det nog gå att ordna en lista med vilka berg som hör dit. Hur hög prioritet tycker ni att detta borde ha? Lsj (diskussion) 29 september 2015 kl. 21.59 (CEST)
- Det låter vågat, har du tittat något på P361 i tex Q583? Det visar ju tex att det inte är självklart att något sådant som Mont Blanc är en del av Alperna. -- Innocent bystander 30 september 2015 kl. 07.49 (CEST)
- Jag ser ingen realistisk möjlighet att göra det för stora och vagt avgränsade bergskedjor som Alperna. De hanteras bättre manuellt. Men ganska ofta handlar det om mer blygsamma bergsmassiv, och då skulle det kunna vara hanterbart. Det är hur som helst mindre kända bergskedjor som jag tycker är mer intressant att få med i artiklarna, sådana som en manuell artikelfixare kanske inte tänker på att de ens finns. Lsj (diskussion) 30 september 2015 kl. 08.07 (CEST)
- Boten arbetar normalt med kartrutor på 3*3 grader, tänkte det kunde vara en lagom storlek även för detta. I så fall kunde den klara t.ex. Vogeserna eller Black Hills, men inte större. Lsj (diskussion) 30 september 2015 kl. 08.16 (CEST)
- Snidar på en algoritm där jag återanvänder botkoden som identifierar öar. Jag tar höjddata och "fyller på vatten" till en lagom virtuell havsnivå, lite under bergskedjans höjd. Ett någorlunda isolerat bergsmassiv bör bli en ö på en sådan virtuell karta, och kan sedan hanteras som andra öar. Lsj (diskussion) 3 oktober 2015 kl. 22.29 (CEST)
- Ok, bergskedjorna fungerar nu. Så här blir det i Sverige: Användare:Lsjbot/Svenska bergskedjor. Först i varje punkt står namnet på bergskedja, sedan dess längd i km, och därefter en lista med ingående bergs och kullar. Ser det ok ut? Noterar att GeoNames gärna använder samiska namn i Norrland, men det är väl knappast fel. Lsj (diskussion) 4 oktober 2015 kl. 17.41 (CEST)
- Det ser ut som du identiferat befintliga bergskedjor i de fall jag kollat, undantaget är Aapua som är en artikel om en småort. Och den kopplade geonames-id'n där är om en PPL. -- Innocent bystander 4 oktober 2015 kl. 18.25 (CEST)
- Enda jag själv kan något om är Kinnekulle. Där tycker jag det känns krystat att kalla den för en bergskedja. Dessutom tror jag de flesta hävdar att enbart berget är längre än 6 km vilket är angivet som bergskedjans längd. Och är det verkligen lämpligt att ange längderna på bergskedjorna i nanometer :) ? --افيراتير (diskussion) 4 oktober 2015 kl. 18.57 (CEST)
- I den här listan har jag varken brytt mig om att särskilja olika platser med samma namn eller formatera längderna, så häng inte upp er på sådant. Två Aapua finns med i Geonames, en småort och en bergskedja (eller "kullkedja", kod HLLS) som ligger intill varandra. Vad Kinnekulle beträffar är även den klassad som HLLS i GeoNames. De två "bergen" som ska ingå i Kinnekulle är olika delar av berget. Håller med om att 6 km känns lite kort för Kinnekulle. Kanske jag fyllde på för högt med havsvatten? Jag använder en iterativ process där havsytan höjs i steg tills bergskedjan verkligen blir en ö separat från andra bergskedjor. I ett såpass platt landskap som det är kring Kinnekulle kan det kanske slå konstigt? Lsj (diskussion) 4 oktober 2015 kl. 19.30 (CEST)
- Startade med en lägre "havsvattennivå", och fick nu ett Kinnekulle som är 11 km långt, vilket verkar rimligt när jag jämför med en karta. Små förändringar i övrigt; även Kolmården blev ett gott stycke längre. Lsj (diskussion) 4 oktober 2015 kl. 22.06 (CEST)
- I den här listan har jag varken brytt mig om att särskilja olika platser med samma namn eller formatera längderna, så häng inte upp er på sådant. Två Aapua finns med i Geonames, en småort och en bergskedja (eller "kullkedja", kod HLLS) som ligger intill varandra. Vad Kinnekulle beträffar är även den klassad som HLLS i GeoNames. De två "bergen" som ska ingå i Kinnekulle är olika delar av berget. Håller med om att 6 km känns lite kort för Kinnekulle. Kanske jag fyllde på för högt med havsvatten? Jag använder en iterativ process där havsytan höjs i steg tills bergskedjan verkligen blir en ö separat från andra bergskedjor. I ett såpass platt landskap som det är kring Kinnekulle kan det kanske slå konstigt? Lsj (diskussion) 4 oktober 2015 kl. 19.30 (CEST)
- Enda jag själv kan något om är Kinnekulle. Där tycker jag det känns krystat att kalla den för en bergskedja. Dessutom tror jag de flesta hävdar att enbart berget är längre än 6 km vilket är angivet som bergskedjans längd. Och är det verkligen lämpligt att ange längderna på bergskedjorna i nanometer :) ? --افيراتير (diskussion) 4 oktober 2015 kl. 18.57 (CEST)
- Det ser ut som du identiferat befintliga bergskedjor i de fall jag kollat, undantaget är Aapua som är en artikel om en småort. Och den kopplade geonames-id'n där är om en PPL. -- Innocent bystander 4 oktober 2015 kl. 18.25 (CEST)
- Ok, bergskedjorna fungerar nu. Så här blir det i Sverige: Användare:Lsjbot/Svenska bergskedjor. Först i varje punkt står namnet på bergskedja, sedan dess längd i km, och därefter en lista med ingående bergs och kullar. Ser det ok ut? Noterar att GeoNames gärna använder samiska namn i Norrland, men det är väl knappast fel. Lsj (diskussion) 4 oktober 2015 kl. 17.41 (CEST)
- Snidar på en algoritm där jag återanvänder botkoden som identifierar öar. Jag tar höjddata och "fyller på vatten" till en lagom virtuell havsnivå, lite under bergskedjans höjd. Ett någorlunda isolerat bergsmassiv bör bli en ö på en sådan virtuell karta, och kan sedan hanteras som andra öar. Lsj (diskussion) 3 oktober 2015 kl. 22.29 (CEST)
Botkod
[redigera wikitext]Har nu lagt ut botkoden här för den som är intresserad: Wikipedia:Projekt DotNetWikiBot Framework/Lsjbot/Make-Geonames. Lsj (diskussion) 29 september 2015 kl. 23.24 (CEST)
- Över 500000 bytes. En normalt komplex körning har sällan mer än några tusen bytes kod. Det visar omfattningen av det här! -- Innocent bystander 30 september 2015 kl. 07.44 (CEST)
- Det visar återigen att det faktiskt är en människa bakom, inte bara en robot som spammar ut artiklar. /Hangsna (diskussion) 30 september 2015 kl. 10.52 (CEST)
- Botkoden för artprojektet var betydligt större i byte (2,1M). Men det beror på att jag då hårdkodade mycket data direkt i källkoden - i de där 2,1M ingår 1,7M hårdkodade auktorsförkortningar, t.ex. Den egentliga icke-triviala botkoden är ungefär 50% större för platsprojektet än för artprojektet. Lsj (diskussion) 1 oktober 2015 kl. 09.28 (CEST)
- Det visar återigen att det faktiskt är en människa bakom, inte bara en robot som spammar ut artiklar. /Hangsna (diskussion) 30 september 2015 kl. 10.52 (CEST)
Fortsatt utveckling
[redigera wikitext]Sedan den tvåmiljonte artikeln skapades för några veckor sedan har en stor mängd synpunkter kommit in på de botskapade artiklarna. Jag har arbetat med att förbättra koden, men har inte gått tillbaka och fixat varje fel för sig i de befintliga artiklarna. Har fått en del klagomål på att det går för sakta, men jag tar hellre ett helhetsgrepp och åtgärdar allt på en gång, det blir pålitligare. Den här listan kan ses som mitt svar till dem som klagat.
Planen är nu:
- Åtgärda alla kända buggar och problem i koden.
- Förbättra koden på ett par områden, bl.a. kring berg, bergskedjor och bergspass.
- Generera om alla särskiljningsled med ny kod.
- Provköra med ny kod ett antal kända problemartiklar för att verifiera att den nya koden faktiskt löser problemen.
- Göra om alla de hittills skapade grensidorna med ny kod (p.g.a. nya särskiljningsled), med undantag för sådana som redan har fixats av inloggade människor.
- Göra om alla de hittills skapade artiklarna med ny kod, med undantag för sådana som redan har fixats av inloggade människor.
- Gå vidare med nya länder. Pågår
Sammanlagt har jag gjort närmare 800 ändringar i botkoden under september, enligt diff. Här är de viktigaste:
- Befolkning:
- Ny inställning för om boten ska välja befolkningssiffra från GeoNames eller från wiki, när båda finns.
- Sätter "population_density" till "auto" i geoboxen i relevanta fall.
- Om möjligt används infobox-parameter för "population_urban" (och motsvarande på andra språk) när boten tar befolkningsuppgifter från wiki för tätorter.
- Spärrat så att enbart tätorter och administrativa enheter får befolkning angivet i artikeln, inte andra platstyper även om det skulle stå en befolkningssiffra i wd eller geonames. Se #Konstig interwiki.
- Spärrat så att tätorter inte får en area. Alldeles för ofta plockades en felaktig area upp från wd-länkning som rörde ihop tätort och kommun.
- Spärrat så att övergivna platser inte får ha befolkning.
- Spärrat så att texten "Det finns inga samhällen i närheten." inte skrivs ut om det finns bortgallrade samhällen i närheten, vilket kunde hända tidigare (hände med den tvåmiljonte artikeln).
- Dubletthantering:
- Ny inställning för om boten ska skapa artiklar även om potentiell dublett finns.
- Diverse ändringar i dubletthanteringen så att dublettartiklar ska kunna skapas.
- Loggande och mallande av potentiella dubletter. Användare:Lsjbot/Namnkonflikter.
- Parameter som anger var dublettartiklar ska läggas.
- Hantering om befintlig botskapad artikel finns:
- Ny inställning för om befintliga artiklar får skrivas över.
- Kod för att avgöra om en artikel är handpålagd av inloggade människor, eller bara redigerad av botar eller ip-nummer.
- Hantering av själva överskrivningen.
- Kod för att hålla reda på artikelnamn i tidigare körningar, så att namnändringar och nya särskiljningsled inte leder till dubletter. Istället skapas omdirigeringar mellan nya och gamla namn.
- Berg:
- Kod för att räkna ut ett bergs primärfaktor och bredd vid basen, och lägga in detta i både Geobox och brödtext.
- Kod för att matcha bergsnamn i Geonames mot höjdkartan från ViewfinderPanoramas.
- Kod för att koppla utlöpare till det berg de löper ut ifrån, och skriva in detta i artikeln om utlöparen.
- Kod för att koppla bergspass till de två berg som passet går mellan, och skriva in detta i artikeln om passet.
- Kod för att hantera bergskedjor.
- Finns den lägsta höjdkurva kring bergskedjan som inte innefattar en annan bergskedja, och inte går utanför kartan.
- Finn vilka berg och kullar som finns inom den höjdkurvan.
- Skriv i artikeln om bergskedjan vilka berg som ingår, och vilket som är högst.
- Skriv i artikeln om varje berg vilken bergskedja det tillhör.
- Kategorisera berg efter bergskedja.
- Terräng:
- Helt gjort om algoritmen för att räkna ut platthet etc. Nu är den mer nyanserad och tar hänsyn till om terrängen runt platsen inte är likformig. Det kan därför bli en kombination av flera terrängbeskrivningar: "Terrängen runt X är i huvudsak platt, men åt norr är den kuperad."
- Ändringar i koden för att hitta om en plats är nära havet, så att den tar större hänsyn till små näraliggande vikar.
- Fixat buggar i koden för att räkna ut om något är i en dal eller på en höjd.
- Kodat om så att ju mer kuperad terräng i allmänhet, desto mer djup krävs för att kalla något "dal", och motsvarande för höjder och sluttningar.
- Interwiki och wikidata:
- Kod för att hålla reda på vad artiklar heter i andra språkversioner som boten kör på, för att korrekt iw-länka mellan dessa.
- Tagit bort kod som förberedde för att ta uppgift om vänorter från wd.
- Kod för att i specialfall köra över botens algoritm för wikidatakoppling med handmatchade kopplingar (används bl.a. för Luxemburgs kommuner).
- Kod för att för utvalda länder plocka platsnamn från landets "hemmawiki". Används i Baltikum för att slippa engelska transkriberingar av ryska namn.
- Avstånd från huvudstaden (se #0 är en kort sträcka):
- Kod för att räkna fram ett avstånd till huvudstaden som är så litet att platsen kan sägas vara i huvudstaden. Tröskelavståndet får bero på huvudstadens befolkning, från 1.5 km för småstäder till en dryg mil för riktigt stora städer.
- Artikeltexten blir "X ligger... i huvudstaden Y." om X är en "punktplats" utan area.
- Artikeltexten blir "Huvudstaden Y ligger i X." om X är en administrativ enhet som sammanfaller med huvudstadens position. (Tröskelavståndet ovan är designat för att nätt och jämnt slippa "Stockholm ligger i Solna kommun.")
- Särskiljning:
- Kod för specialfallet att Geonames-poster har samma platstypsnamn men ändå olika platstypskod, eller tvärtom. (se #Homonymen Bourscheid).
- Kod för att ge kategorier särskiljningsled (samma som motsvarande artikel) - se #Kategorier.
- Grensidor:
- Kod för att hålla reda på om två poster i samma grensida länkar till samma artikel.
- Not i wikikoden till grensidor om att hålla ordning på numreringen. Se #Varför numrerade listor i förgreningssidorna?.
- Kod för att hantera specialfall där en viss plats ska ha annan platstypsbeteckning än standard. Används t.ex. i ett land indelat i provinser men där enstaka enheter på provinsnivå inte kallas "provins" utan har annan status.
- Lagt in en minimiarea på 0,1 km2 för att sjöar och öar alls ska få en angiven area. Mindre areor än så går inte att räkna fram pålitligt p.g.a. begränsad upplösning i tillgängliga kartdata.
- Kod för att byta ut ovanliga citattecken mot vanliga (se #Konstiga artikelnamn)
- Kod för att spara höjddata i en cache, så att boten slipper läsa in stora datafiler om och om igen när den gör många näraliggande platser.
- Kod för att logga diverse konstigheter i Användare:Lsjbot/Anomalier.
- Korrigerat talformat, så att det korrekt blir svenskt talformat i löptext men engelskt talformat i Geobox.
- Korrigerat språkangivelse när flera namnformer på samma språk räknades upp.
- Kod för att samla statistik om diverse aspekter av botens höjdberäkningar.
- Lagt till en länk till botkoden i alla noter som handlar om beräkningar.
- Kod och datafiler för att kunna ha separata tidszonsnamn på olika kontinenter.
- Fixat radbrytningar i Geobox som förstörs av DotNetWikiBot-bugg.
- Diverse små buggfixar.
- Diverse refaktorering av koden.
Har jag glömt bort något som borde göras?
Lsj (diskussion) 2 oktober 2015 kl. 20.46 (CEST)
- Ytterligare en påminnelse om vilket enormt arbete du utför. Så blir också resultatet oerhört värdefullt. --Ettrig (diskussion) 2 oktober 2015 kl. 23.18 (CEST)
- Instämmer. Jag har inte läst igenom listan, men jag tycker boten ska sluta skapa förgreningssidor som Boulaide och istället lägga huvudorten under namnet och skapa Boulaide (olika betydelser).--ボスニア (diskussion) 4 oktober 2015 kl. 00.59 (CEST)
- Vilken av flera platser med samma namn som har företräde till huvudordet är något människor ofta är oense om. Att försöka avgöra sådant med bot tänker jag inte ens försöka. Det jag kan göra däremot är att låta boten flagga alla sådana grensidor och lägga dem i en åtgärdslista, så att de kan få mänsklig uppmärksamhet. Lsj (diskussion) 4 oktober 2015 kl. 10.34 (CEST)
- Fixat i koden. Nu ska även Boulaide hamna i Användare:Lsjbot/Anomalier. Lsj (diskussion) 4 oktober 2015 kl. 11.06 (CEST)
- Vilken av flera platser med samma namn som har företräde till huvudordet är något människor ofta är oense om. Att försöka avgöra sådant med bot tänker jag inte ens försöka. Det jag kan göra däremot är att låta boten flagga alla sådana grensidor och lägga dem i en åtgärdslista, så att de kan få mänsklig uppmärksamhet. Lsj (diskussion) 4 oktober 2015 kl. 10.34 (CEST)
- Instämmer. Jag har inte läst igenom listan, men jag tycker boten ska sluta skapa förgreningssidor som Boulaide och istället lägga huvudorten under namnet och skapa Boulaide (olika betydelser).--ボスニア (diskussion) 4 oktober 2015 kl. 00.59 (CEST)
Huvudort, men i annan kommun
[redigera wikitext]Hur ser det ut i de fall där huvudorten i en region/kommun inte ligger inom själva kommunen. Det är tex inte ovanligt i polska "gmina wiejska" att kommunkontoret ligger i en stad i grannkommunen. pl:Powiat słupski är ett exempel där Powiatens huvudort ligger i Słupsk, som utgör en egen Powiat. Jämför på 1960-talet när Stockholm var residensstad i Stockholms län, trots att Stockholm låg "utanför" länet. -- Innocent bystander 4 oktober 2015 kl. 09.23 (CEST)
- Vi hade uppe detta tidigare under rubriken #GeoNames ovan. Jag kollade några exempel i GeoNames då, och de var korrekt hanterade i databasen med länkar mellan kommun och (extern) huvudort. Bör därmed bli rätt även i artiklarna. Men jag har inte systematiskt gått igenom alla. Lsj (diskussion) 4 oktober 2015 kl. 10.30 (CEST)
I eller på
[redigera wikitext]Hej! Det är nog tveksamt om det verkligen är tveksamt om "i" eller "på" ska användas framför t.ex. Malta, jag har försökt kicka igång en diskussion om detta här. Du kan väl hålla ett öga på den, om det skulle bli någon förändring? Marfuas (diskussion) 6 oktober 2015 kl. 22.09 (CEST)
- På ön, i landet har jag trott det var? På ön ligger berget X, berget X ligger alltså i landet. /Hangsna (diskussion) 6 oktober 2015 kl. 22.11 (CEST)
- Jepp, diskussionen har varit uppe förr. En ö kan inte samtidigt vara en republik, med mindre man bygger ön av själva invånarna. -- Innocent bystander 6 oktober 2015 kl. 22.13 (CEST)
- Boten ska konsekvent använda "i" när landet åsyftas, och "på" när ön åsyftas. Se t.ex. Balzan (kommun) där båda prepositionerna används på olika ställen i texten. Frågan har även varit uppe tidigare på den här sidan, se #I och på ovan. Lsj (diskussion) 6 oktober 2015 kl. 23.25 (CEST)
- Problemet uppstår ju bara om en administrativ enhet och en ö/halvö/ögrupp sammanfaller (det kanske kan drabba ett berg också, även om jag inte kan komma på något, Monte Carlo kanske?). I alla fall borde boten (och alla andra skribenter) använda "i" när det är det administrativa aspekten av ön/halvön/ögruppen/landet som dominerar, och "på" när det är den geografiska aspekten av ön/halvön/ögruppen/landet som dominerar. Jag antar att det sammanfaller med din intention. Och man borde kanske göra precis som Språkriktighetsboken rekommenderar, vilket är att skriva ut den administrativa enheten om det låter yxigt eller tvetydigt annars. "Góehira är en princip för kommunal självförvaltning i republiken Irland". (Här är det rätt självklart att det ska vara "i", den administrativa aspekten av Irland är totalt dominerande.) Eller "Dingli är en huvudort på primärkommunnivå i republiken Malta". (Här är det jämnare, men den administrativa aspekten överväger, tror jag.) Men på denna plats och på denna plats låter det ju som att det finns principiella tveksamheter som öppnar för godtycke, vilket det inte gör om man förlitar sig på språkvårdsmyndigheterna. Och jag är lite tveksam till prepositionsvalet i första meningen i Dingli_(kommunhuvudort). Det är ointuitivt med "i" där, det kanske kan lösas om man skriver ut "i republiken Malta". Och det gör att det kolliderar mindre med "på ön Malta" ett par meningar längre fram. Hasta la vista! Marfuas (diskussion) 7 oktober 2015 kl. 12.46 (CEST)
- @Marfuas: Offtopicvarning: "primärkommunnivå", var det ett höftskott, eller har du någon infomation som motsäger det som sägs i Maltas kommuner? -- Innocent bystander 7 oktober 2015 kl. 16.09 (CEST)
- Nej, det här handlar helt och hållet om språk. "Primärkommunnivå" var bara en illustration, på samma sätt som Góehira (det finns ju ingenting som heter så). Marfuas (diskussion) 7 oktober 2015 kl. 22.04 (CEST)
- @Marfuas: Offtopicvarning: "primärkommunnivå", var det ett höftskott, eller har du någon infomation som motsäger det som sägs i Maltas kommuner? -- Innocent bystander 7 oktober 2015 kl. 16.09 (CEST)
- När det gäller admin-enheter på lägre nivå anges dessa normalt explicit av boten - "Den ligger i kommunen Dingli," - men för länder tyckte jag inte det behövdes. Låter fånigt att säga om allting att "X ligger i kungariket Sverige." Men kanske jag borde göra ett undantag just för östater. Enklast vore att skriva "i landet Malta" etc, så slipper boten hålla reda på statsskicket i en massa länder. Eller är det värt besväret att skilja på "i republiken Malta" kontra "i kungariket Tonga"? Lsj (diskussion) 7 oktober 2015 kl. 14.55 (CEST)
- Och hur göra med platser "i det självstyrande brittiska utomeuropeiska territoriet Falklandsöarna" och liknande? Lsj (diskussion) 7 oktober 2015 kl. 15.00 (CEST)
- Jag tycker det känns onödigt med "i konungariket Sverige" (problemet gäller ju bara öar). Och "det självstyrande territoriet Falklandsöarna" är kanske lite väl otympligt, i just det fallet kanske det kan fungera med "i territoriet Falklandsöarna"? Du kanske kan ta det bit för bit och lösa problemen (om det nu ens är några problem) allteftersom? Marfuas (diskussion) 7 oktober 2015 kl. 22.04 (CEST)
- Jag lägger in maskineri i koden för att stoppa in "republiken" etc i inledningsmeningen för de länder där vi tycker det behövs. Tacksam för synpunkter på vilka länder vi tycker det behövs för. Lsj (diskussion) 7 oktober 2015 kl. 22.52 (CEST)
- Är det verkligen i enlighet med principen om minsta möjliga förvåning att skriva i Malta? Och när man utökar artikeln, ska man då fortsätta att benämna landet med dessa tre ord: i republiken Malta? Blir inte det lite omständigt? Utopiantos (diskussion) 7 oktober 2015 kl. 23.06 (CEST)
- Detta med "i" kontra "på" östater har diskuterats åtminstone 15 gånger tidigare som jag hittar med bara en snabb sökning: [18], plus två gånger om bara på den här diskussionssidan. Vi har t.o.m. en särskild artikel om ämnet I eller på. Konsensus saknas. Att uttryckligen säga "i republiken Malta" och "på ön Malta" är kanske omständligt, men mindre omständligt än att diskutera frågan 15 varv till. Lsj (diskussion) 7 oktober 2015 kl. 23.18 (CEST)
- Är det verkligen i enlighet med principen om minsta möjliga förvåning att skriva i Malta? Och när man utökar artikeln, ska man då fortsätta att benämna landet med dessa tre ord: i republiken Malta? Blir inte det lite omständigt? Utopiantos (diskussion) 7 oktober 2015 kl. 23.06 (CEST)
- Jag lägger in maskineri i koden för att stoppa in "republiken" etc i inledningsmeningen för de länder där vi tycker det behövs. Tacksam för synpunkter på vilka länder vi tycker det behövs för. Lsj (diskussion) 7 oktober 2015 kl. 22.52 (CEST)
- Jag tycker det känns onödigt med "i konungariket Sverige" (problemet gäller ju bara öar). Och "det självstyrande territoriet Falklandsöarna" är kanske lite väl otympligt, i just det fallet kanske det kan fungera med "i territoriet Falklandsöarna"? Du kanske kan ta det bit för bit och lösa problemen (om det nu ens är några problem) allteftersom? Marfuas (diskussion) 7 oktober 2015 kl. 22.04 (CEST)
- Och hur göra med platser "i det självstyrande brittiska utomeuropeiska territoriet Falklandsöarna" och liknande? Lsj (diskussion) 7 oktober 2015 kl. 15.00 (CEST)
- Problemet uppstår ju bara om en administrativ enhet och en ö/halvö/ögrupp sammanfaller (det kanske kan drabba ett berg också, även om jag inte kan komma på något, Monte Carlo kanske?). I alla fall borde boten (och alla andra skribenter) använda "i" när det är det administrativa aspekten av ön/halvön/ögruppen/landet som dominerar, och "på" när det är den geografiska aspekten av ön/halvön/ögruppen/landet som dominerar. Jag antar att det sammanfaller med din intention. Och man borde kanske göra precis som Språkriktighetsboken rekommenderar, vilket är att skriva ut den administrativa enheten om det låter yxigt eller tvetydigt annars. "Góehira är en princip för kommunal självförvaltning i republiken Irland". (Här är det rätt självklart att det ska vara "i", den administrativa aspekten av Irland är totalt dominerande.) Eller "Dingli är en huvudort på primärkommunnivå i republiken Malta". (Här är det jämnare, men den administrativa aspekten överväger, tror jag.) Men på denna plats och på denna plats låter det ju som att det finns principiella tveksamheter som öppnar för godtycke, vilket det inte gör om man förlitar sig på språkvårdsmyndigheterna. Och jag är lite tveksam till prepositionsvalet i första meningen i Dingli_(kommunhuvudort). Det är ointuitivt med "i" där, det kanske kan lösas om man skriver ut "i republiken Malta". Och det gör att det kolliderar mindre med "på ön Malta" ett par meningar längre fram. Hasta la vista! Marfuas (diskussion) 7 oktober 2015 kl. 12.46 (CEST)
- Boten ska konsekvent använda "i" när landet åsyftas, och "på" när ön åsyftas. Se t.ex. Balzan (kommun) där båda prepositionerna används på olika ställen i texten. Frågan har även varit uppe tidigare på den här sidan, se #I och på ovan. Lsj (diskussion) 6 oktober 2015 kl. 23.25 (CEST)
- Jepp, diskussionen har varit uppe förr. En ö kan inte samtidigt vara en republik, med mindre man bygger ön av själva invånarna. -- Innocent bystander 6 oktober 2015 kl. 22.13 (CEST)
Algoritmbeskrivning
[redigera wikitext]Jag har börjat beskriva botens algoritmer i Användare:Lsjbot/Algoritmer, och hänvisar dit i noterna till nya artiklar. Är förklaringarna där begripliga och lagom utförliga? Lsj (diskussion) 12 oktober 2015 kl. 23.26 (CEST)
Olika betydelser
[redigera wikitext]Borde de två varianterna av Berovo som Lsjbot skapat ha hänvisningar till Berovo (olika betydelser)? (Att det blev en dublett klagar jag INTE på.) --Ettrig (diskussion) 15 oktober 2015 kl. 06.52 (CEST)
- Jo, sådana hänvisningar finns inlagt i botkoden nu (se #Andra betydelse ovan) och kommer med i framtida artiklar. Tyvärr kördes Berovo innan jag gjorde det tillägget. Bör bli fixat när jag åtgärdar diverse småplock i de befintliga botartiklarna snart. En av Berovo-varianterna är f.ö. handskapad. Lsj (diskussion) 15 oktober 2015 kl. 07.45 (CEST)
- Vi har nog samma bild av läget. Här kommer ändå ett förtydligande för säkerhets skull: Berovo var handskapad. Den säger att den handlar om orten, men ger också lite info om kommunen. Lsjbot har skapat Berovo (kommunhuvudort). Det är en dubblett till Berovo. Jag tycker att det är bra att Berovo (kommunhuvudort) har skapats. Genom att i den tillföra material från den handskapade artikeln kan vi göra en bättre artikel än vi hade innan. Före sammanslagningen gör dubblerandet väldigt liten skada. Jag var dock förvånad att det blev så här. Jag har flera gånger med sorg noterat att en mycket liten stub tycks ha blockerat Lsjbot från att göra sin fina motsvarande stub. --Ettrig (diskussion) 15 oktober 2015 kl. 11.40 (CEST)
- Borde Berovo (olika betydelser) flyttas till Berovo? Maundwiki (diskussion) 15 oktober 2015 kl. 11.47 (CEST)
- @Ettrig: När boten identifierar dubletter så söker den efter koordinater i artikeln. Och Berovo saknar koordinater, därför blir den inte igenkänd som dublett.
- @Maundwiki: Nej, inte än. Låt mig göra om dessa artiklar först med boten, det är många småsaker att fixa. Och har man väl börjat med handpåläggning håller boten sig borta. Lsj (diskussion) 15 oktober 2015 kl. 12.41 (CEST)
- Borde Berovo (olika betydelser) flyttas till Berovo? Maundwiki (diskussion) 15 oktober 2015 kl. 11.47 (CEST)
- Vi har nog samma bild av läget. Här kommer ändå ett förtydligande för säkerhets skull: Berovo var handskapad. Den säger att den handlar om orten, men ger också lite info om kommunen. Lsjbot har skapat Berovo (kommunhuvudort). Det är en dubblett till Berovo. Jag tycker att det är bra att Berovo (kommunhuvudort) har skapats. Genom att i den tillföra material från den handskapade artikeln kan vi göra en bättre artikel än vi hade innan. Före sammanslagningen gör dubblerandet väldigt liten skada. Jag var dock förvånad att det blev så här. Jag har flera gånger med sorg noterat att en mycket liten stub tycks ha blockerat Lsjbot från att göra sin fina motsvarande stub. --Ettrig (diskussion) 15 oktober 2015 kl. 11.40 (CEST)
Syntaxfel 34 i kartor
[redigera wikitext]Se min bots små bidrag samt den enorma listan i databasen för syntaxfel. Tack. Josve05a (prata med mig) 18 oktober 2015 kl. 00.18 (CEST)
- Stopp lite här! Det finns en poäng med villkorskonstruktionen - se #Bhutan ovan. Om det finns syntaxfel i den så må det fixas, men att ta bort den helt är inte rätt väg. Lsj (diskussion) 18 oktober 2015 kl. 09.57 (CEST)
- Checkwiki kallar tydligen allt möjligt för "syntaxfel". I det här fallet är det tydligen blotta förekomsten av "#if:" som kallas "syntaxfel", även när syntaxen är helt korrekt! Lsj (diskussion) 18 oktober 2015 kl. 10.12 (CEST)
- Går det att komplettera mallen med en parameter, exempelvis alternativkarta, och lägga in if-satsen där istället? Det skulle ge en enklare kod i artiklarna. Jag har inte riktigt satt mig in i vad if-satsen löser så jag har inte riktigt koll på lämplig parameter, men tänker att en dylik lösning borde kunna fungera. --افيراتير (diskussion) 18 oktober 2015 kl. 10.36 (CEST)
- I och med att #if-satsen ligger inne i Geobox-mallen, så ser jag inte riktigt vad det är som stör med den. Det hade varit annorlunda om den legat direkt i brödtexten. -- Innocent bystander 18 oktober 2015 kl. 10.45 (CEST)
- Jag har lyckats lägga till bilder i infoboxar på både arabiska och japanska. Det hade jag nog inte klarat om de innehållit så mycket mer kod än de redan gör. Ju enklare vi kan hålla koden desto bättre. Men visst, samma kod i brödtexten hade varit mycket värre. --افيراتير (diskussion) 18 oktober 2015 kl. 10.48 (CEST)
- @Averater, Josve05a: Det if-satsen gör är att klara av två olika typer av kartmallar, dels sådana med reliefkarta (bild1) och dels sådana med endast en planklarta (bild). Om reliefkartan finns så används den, annars används plankartan. Detta val kan inte göras automatiskt inne i Geobox-mallen eftersom man ibland vill ha plankartan även om det skulle finnas en reliefkarta. Men med en parameter "preferred map" som kompletterar parametern "map" skulle det gå bra att flytta if-satsen in i Geobox-mallen. En annan variant är att Lsjbot på annat sätt, en tabell på nån robotundersida, får information om vilka länder/områden som har reliefkarta och vilka som inte har det och med ledning av detta använda antingen bild1 eller bild från aktuell Kartposition-mall. Men i så fall måste koden köras om när någon kompletterar med en reliefkarta för något land och det verkar onödigt. Att rensa bort "onödig kod" som Josvebot har gjort är OK men bara för länder där det finns en reliefkarta (bild1). För andra länder är koden väsentlig med nuvarande lösning. --Larske (diskussion) 18 oktober 2015 kl. 11.37 (CEST)
- Jag har nu kontrollerat i efterhand och det verkar sm om inget problem har skapats av min bot. (Den tog inte bort onödig kod, allt den gjorde var att lägga till
subst:
> i början av "#if"). Kommer kontrollera att resultatet blir den samma innan ändrar även i framtiden. Josve05a (prata med mig) 18 oktober 2015 kl. 11.46 (CEST)- Din bot har såvitt jag kan se tagit bort den flexibilitet att automatiskt övergå till en bättre karta om sådan läggs till, som Larske nämner nedan. Lsj (diskussion) 18 oktober 2015 kl. 12.01 (CEST)
- Jag har nu kontrollerat i efterhand och det verkar sm om inget problem har skapats av min bot. (Den tog inte bort onödig kod, allt den gjorde var att lägga till
- I och med att #if-satsen ligger inne i Geobox-mallen, så ser jag inte riktigt vad det är som stör med den. Det hade varit annorlunda om den legat direkt i brödtexten. -- Innocent bystander 18 oktober 2015 kl. 10.45 (CEST)
- Går det att komplettera mallen med en parameter, exempelvis alternativkarta, och lägga in if-satsen där istället? Det skulle ge en enklare kod i artiklarna. Jag har inte riktigt satt mig in i vad if-satsen löser så jag har inte riktigt koll på lämplig parameter, men tänker att en dylik lösning borde kunna fungera. --افيراتير (diskussion) 18 oktober 2015 kl. 10.36 (CEST)
- Rätt lösning är att se till att de kartor man vill använda finns innan man lägger in dem i artiklarna. Då behöver man ingen villkorssats. 90.229.134.107 18 oktober 2015 kl. 11.26 (CEST)
- Nuvarande lösning använder befintliga kartor, men gör att när "bättre" kartor kommer i framtiden som kommer dessa att användas utan att man behöver ändra alla artiklar. Bättre betyder här inte bättre för alla tillämpningar, i vissa fall vill man kanske ha kvar den enklare plankartan. Men visst finns det andra sätt att göra det på, se mitt inlägg ovan. --Larske (diskussion) 18 oktober 2015 kl. 11.37 (CEST)
- Ett annat sätt kan vara att programera om mallen. Att jag skriver "bild1" och den inte finns, avänd plankartan som fallback. Så att boten bara behöver lgga till "bild1" på alla artiklar, och sen om en sådan karta skapas så används den automatiskt. Bättre att ha programeringskod i mallar, än i artiklar direkt. Vill ni ka denna kod, skapa en mall som har den och använd den i stället för denna kod i artiklarna. Josve05a (prata med mig) 18 oktober 2015 kl. 11.51 (CEST)
- Josve05a Nej, vi vill nog inte att Geobox ska lära sig för mycket om parametrar i andra mallar. Geobox måste, via parametervärden, få veta både vad reliefkartan heter och vad plankartan heter, filnamnen alltså. Geobox får inte förväntas veta filnamnet på plankartan på något annat sätt! Tänk på att Geobox ska kunna användas med andra kartor än sådana som hämtas från någon viss mall. Läs mitt inlägg ovan om hur detta kan lösas. --Larske (diskussion) 18 oktober 2015 kl. 11.59 (CEST)
- @Larske: Tänkte inte på Geobox, utan på mallar som
{{Kartposition Sydsudan}}
. Koda om dem istället för att ha en massa kod i artiklarna. -Josve05a (prata med mig) 18 oktober 2015 kl. 12.03 (CEST)- @Josve05a: OK, då förstår jag vad du menar. Ja, det är också möjligt att i alla dessa mallar införa en parameter, "reliefkarta om den finns", som gör att man väljer reliefkartan (bild1) om den finns och annars plankartan (bild). @Lsj: Kanske något som Lsjbot kan göra som en förberedelse inför körningen av varje nytt land. --Larske (diskussion) 18 oktober 2015 kl. 12.17 (CEST)
- Ja, om någon mer mallkunnig gör ändringen i en av mallarna så kan Lsjbot lägga in samma ändring i alla de andra. Men jag tycker inte det är rätt att vi ska behöva ändra i 250 mallar bara för att kringgå en bugg i checkwiki. Och ja, att kalla ett syntaktiskt korrekt uttryck för "syntaxfel" är en bugg och ingenting annat. Lsj (diskussion) 18 oktober 2015 kl. 12.52 (CEST)
- @Lsj: Jag har stoppat in hanteringen av parametervärdet "reliefkarta_om_den_finns" i mallarna
{{Kartposition Angola}}
och{{Kartposition Anguilla}}
för att visa på hur man kan göra för de två fallen att reliefkarta finns respektive inte finns. Här nedan ges två exempel där det ger olika typer av kartor. När någon kompletterar Anguilla-mallen med en reliefkarta får man samtidigt uppdatera switch-satsen i mallen så att det blir som i Angolamallen, dvs parametervärdet "reliefkarta_om_den_finns" ger samma karta som parametervärdet "bild1" ger istället för som nu samma karta som "bild" ger, men alla Anguilla-artiklar där man använder det nya parametervärdet kan lämnas utan åtgärd eftersom de inte behöver uppdateras för att visa reliefkartan.
- @Lsj: Jag har stoppat in hanteringen av parametervärdet "reliefkarta_om_den_finns" i mallarna
- Ja, om någon mer mallkunnig gör ändringen i en av mallarna så kan Lsjbot lägga in samma ändring i alla de andra. Men jag tycker inte det är rätt att vi ska behöva ändra i 250 mallar bara för att kringgå en bugg i checkwiki. Och ja, att kalla ett syntaktiskt korrekt uttryck för "syntaxfel" är en bugg och ingenting annat. Lsj (diskussion) 18 oktober 2015 kl. 12.52 (CEST)
- @Josve05a: OK, då förstår jag vad du menar. Ja, det är också möjligt att i alla dessa mallar införa en parameter, "reliefkarta om den finns", som gör att man väljer reliefkartan (bild1) om den finns och annars plankartan (bild). @Lsj: Kanske något som Lsjbot kan göra som en förberedelse inför körningen av varje nytt land. --Larske (diskussion) 18 oktober 2015 kl. 12.17 (CEST)
- @Larske: Tänkte inte på Geobox, utan på mallar som
- Josve05a Nej, vi vill nog inte att Geobox ska lära sig för mycket om parametrar i andra mallar. Geobox måste, via parametervärden, få veta både vad reliefkartan heter och vad plankartan heter, filnamnen alltså. Geobox får inte förväntas veta filnamnet på plankartan på något annat sätt! Tänk på att Geobox ska kunna användas med andra kartor än sådana som hämtas från någon viss mall. Läs mitt inlägg ovan om hur detta kan lösas. --Larske (diskussion) 18 oktober 2015 kl. 11.59 (CEST)
- Ett annat sätt kan vara att programera om mallen. Att jag skriver "bild1" och den inte finns, avänd plankartan som fallback. Så att boten bara behöver lgga till "bild1" på alla artiklar, och sen om en sådan karta skapas så används den automatiskt. Bättre att ha programeringskod i mallar, än i artiklar direkt. Vill ni ka denna kod, skapa en mall som har den och använd den i stället för denna kod i artiklarna. Josve05a (prata med mig) 18 oktober 2015 kl. 11.51 (CEST)
- Nuvarande lösning använder befintliga kartor, men gör att när "bättre" kartor kommer i framtiden som kommer dessa att användas utan att man behöver ändra alla artiklar. Bättre betyder här inte bättre för alla tillämpningar, i vissa fall vill man kanske ha kvar den enklare plankartan. Men visst finns det andra sätt att göra det på, se mitt inlägg ovan. --Larske (diskussion) 18 oktober 2015 kl. 11.37 (CEST)
- Checkwiki kallar tydligen allt möjligt för "syntaxfel". I det här fallet är det tydligen blotta förekomsten av "#if:" som kallas "syntaxfel", även när syntaxen är helt korrekt! Lsj (diskussion) 18 oktober 2015 kl. 10.12 (CEST)
- [[File:{{Kartposition Angola|reliefkarta_om_den_finns}}|50px]] ger eftersom det finns en reliefkarta för Angola.
- [[File:{{Kartposition Anguilla|reliefkarta_om_den_finns}}|50px]] ger eftersom det inte finns någon reliefkarta för Anguilla.
--Larske (diskussion) 18 oktober 2015 kl. 16.14 (CEST)
- Ok, tack Larske. Jag lägger in den ändringen nu i alla kartpositionsmallarna. Lsj (diskussion) 18 oktober 2015 kl. 18.56 (CEST)
- Det är inte en bugg i CHECKWIKI. Att ha programeringskod i artiklar kan ge ett bra resultat, men bör undvikas. Det är därför vi har just mallar. Så databasen fungerar so den ska. Bara för resultatet blir ok, bertyder inte det att det att det inte är något problem med det. (T.ex att skriva
<i></i>
fungerar men det bör unvikas.) Josve05a (prata med mig) 18 oktober 2015 kl. 12.57 (CEST)- Om det inte är syntaktiskt fel, ska det inte klassificeras som syntaxfel! Man kan tycka att det är olämpligt av andra skäl, men använd då en annan etikett. Lsj (diskussion) 18 oktober 2015 kl. 15.57 (CEST)
- Detta är faktiskt ett svwp-problem. Vi klassar alla fel som listas i den databasen under beteckningen "syntaxfel", mdan det egentligen är det "checkwiki-fel", det är bara vi som säger att de är syntaxfel. Josve05a (prata med mig) 18 oktober 2015 kl. 17.40 (CEST)
- Det är vårt val att följa checkwiki eller inte. På Wikisource finns också checkwiki, men vi har där helt andra prioriteringar och de flesta "syntaxfelen" sk-ter vi i. -- Innocent bystander 18 oktober 2015 kl. 17.46 (CEST)
- Detta är faktiskt ett svwp-problem. Vi klassar alla fel som listas i den databasen under beteckningen "syntaxfel", mdan det egentligen är det "checkwiki-fel", det är bara vi som säger att de är syntaxfel. Josve05a (prata med mig) 18 oktober 2015 kl. 17.40 (CEST)
- Om det inte är syntaktiskt fel, ska det inte klassificeras som syntaxfel! Man kan tycka att det är olämpligt av andra skäl, men använd då en annan etikett. Lsj (diskussion) 18 oktober 2015 kl. 15.57 (CEST)
- Det är inte en bugg i CHECKWIKI. Att ha programeringskod i artiklar kan ge ett bra resultat, men bör undvikas. Det är därför vi har just mallar. Så databasen fungerar so den ska. Bara för resultatet blir ok, bertyder inte det att det att det inte är något problem med det. (T.ex att skriva
Jag tycker Larskes förslag med prefered_map låter bra. --افيراتير (diskussion) 18 oktober 2015 kl. 13.05 (CEST)
- @Averater: En (mindre?) nackdel med det är att man måste ange två parametrar, både map och preferred_map, för att hålla mallarna oberoende av varandra. Med ändringar i Kartmallarna som Josve05a föreslog och som jag testat ovan slipper man det. --Larske (diskussion) 18 oktober 2015 kl. 16.14 (CEST)
- Men är inte det i praktiken vad man gör med if-satsen? Ett utfall för om den finns och ett utfall om den inte finns. --افيراتير (diskussion) 18 oktober 2015 kl. 16.31 (CEST)
- Jo, men #if-satsen ger utslag i checkwiki, men det gör den inte om den byggs in i mallen. -- Innocent bystander 18 oktober 2015 kl. 16.37 (CEST)
- @Innocent bystander: Korrekt svar, men på en annan fråga . Det vi jämförde nu var komplexiteten i mallanropen, inte vad CHECKWIKI ger för resultat. --Larske (diskussion) 18 oktober 2015 kl. 19.50 (CEST)
- @Averater: Jovisst, det har du rätt i. Men med den lösning som nu implementerats i alla Kartpositionsmallarna av Lsj så räcker det med en parameter. --Larske (diskussion) 18 oktober 2015 kl. 19.50 (CEST)
- Jo, men #if-satsen ger utslag i checkwiki, men det gör den inte om den byggs in i mallen. -- Innocent bystander 18 oktober 2015 kl. 16.37 (CEST)
- Men är inte det i praktiken vad man gör med if-satsen? Ett utfall för om den finns och ett utfall om den inte finns. --افيراتير (diskussion) 18 oktober 2015 kl. 16.31 (CEST)
"Kommun" i namn
[redigera wikitext]Som exempel finns kommunen Čučer-Sandevo (kommun i Makedonien) skapad av Lsjbot. Enligt Lsjbot har den namnen
- Opsjtina Čučer-Sandevo
- Општина Чучер-Сандево
- Opština Čučer-Sandevo
- Čučer-Sandevo
- Чучер-Сандево
Jag har reducerat detta till
- Čučer-Sandevo
- Чучер-Сандево
Jag har helt enkelt tagit bort det makedonska ordet för kommun ur namnet. Efter att ha gjort så på ganska många kommuner har jag börjat tveka. Ingår ordet kommun till exempel i namnet för Falu kommun? Eller är det en bestämning som sätts efter namnet? Om man klickar till Falu kommuns weblänk så säger kommunen hemsida "FALUN". Men jag tror att de flesta svenska kommuner anger med "kommun", till exempel Arboga kommun. Det viktigaste är kanske inte vad som är rätt utan vad som blir tydligast. Kanske borde man både skriva ut alla namnformerna och förklara att opsjtina betyder kommun. I så fall kunde det kanske läggas långt ned i texten. En utredning av alla tänkbara namnformer är väl inte det som de flesta läsare efterfrågar? Finns det någon konvention för svenska Wikipedia som jag bör ansluta till? Jag pratar nu inte om vad Lsjbot ska göra utan om vad en manuell tillsnyggning helst skulle bestå av. --Ettrig (diskussion) 18 oktober 2015 kl. 17.34 (CEST)
- För flertalet kommuner finns det också en tätort med snarlikt namn (Arboga kontra Arboga kommun etc.). Gäller nog även i Makedonien. I sådana fall tycker jag det är mindre lyckat att ta bort de namnformer som innehåller "kommun" ("opstina" etc). Lsj (diskussion) 18 oktober 2015 kl. 17.46 (CEST)
- Det är nog lite olika i olika länder. Som jag förstått att det fungerar i Polen, så finns där kommuner av samma typ som Arboga, som är uppkallade efter huvudorten. MEN, huvudorten är då också ofta en kommun i sig. I kommuner av "Sundbyberg"-typ är de två kommunernas funktioner sammanfogade i den enda. I rena "glesbygds"-kommuner finns bara den ena kommunen. -- Innocent bystander 18 oktober 2015 kl. 17.54 (CEST)
Geobox
[redigera wikitext]Jag kom och tänka på att artiklarna använder Geobox-mallen, men vore det inte bättre att använda Georuta? Såvitt jag förstått kommer Lsjbots geografiartiklar att bilda om inte majoriteten, åtminstone en betydande andel av alla våra geografiartiklar, och det är ju inte alls bra om man behöver kunna engelska för att redigera infoboxarna. Sedan finns också den aspekten att alla inte vill syssla med engelskspråkiga infoboxar. Att personer med engelskakunskaper som inte kan svenska kan redigera artiklarna är en fördel, men viktigare vore nog att svenskspråkiga skulle ha lätt att redigera dem. K9re11 (diskussion) 26 oktober 2015 kl. 15.39 (CET)
- Jag personligen tycker det är svårare med översatta mallar eftersom man då inte alltid vet vad parameternamnet är på svenska. --افيراتير (diskussion) 26 oktober 2015 kl. 16.55 (CET)
- Å andra sidan är det ju mycket svårare, till och med omöjligt, att använda engelska mallar om man inte kan engelska. K9re11 (diskussion) 26 oktober 2015 kl. 16.58 (CET)
- Vilket också gäller när sådana som inte kan svenska ska hjälpa till och uppdatera här. Jag har struntat i vissa språk när jag lagt in bilder men ofta har jag lyckats även på språk där jag inte förstår ett enda tecken om de har vettiga mallar. Jag tror de som har så svårt med engelskan att de inte kan klura ut vad parametrarna betyder också har mycket svårt att över huvud taget redigera koden i en mall. --افيراتير (diskussion) 26 oktober 2015 kl. 17.31 (CET)
- Instämmer med Averater. Tror internationella användare som inte kan svenska bidrar med mer mallfixande i botartiklar än svenska användare som inte alls kan engelska. Idag är en stor del av redigeringarna på cebwp internationella användare som putsar på botartiklarna där och ger värdefulla bidrag utan att kunna cebuano. För mig finns också den praktiska aspekten att jag kör boten på flera språk, och det skulle innebära väldigt mycket extraarbete om mallarna såg alltför olika ut på olika språk. Därför har jag valt Geobox som fungerar likadant och ser likadan ut på alla språk jag kör på, precis som Taxobox för artprojektet. Av samma skäl använder jag inte heller de specialmallar som finns för diverse sorters geografiska platser, typ
{{Ortsfakta Danmark}}
. Lsj (diskussion) 26 oktober 2015 kl. 17.46 (CET)
- Instämmer med Averater. Tror internationella användare som inte kan svenska bidrar med mer mallfixande i botartiklar än svenska användare som inte alls kan engelska. Idag är en stor del av redigeringarna på cebwp internationella användare som putsar på botartiklarna där och ger värdefulla bidrag utan att kunna cebuano. För mig finns också den praktiska aspekten att jag kör boten på flera språk, och det skulle innebära väldigt mycket extraarbete om mallarna såg alltför olika ut på olika språk. Därför har jag valt Geobox som fungerar likadant och ser likadan ut på alla språk jag kör på, precis som Taxobox för artprojektet. Av samma skäl använder jag inte heller de specialmallar som finns för diverse sorters geografiska platser, typ
- När man sitter och programmerar är det ytterst förvirrande att hantera svenska termer. För när åtminstone jag programmerar, så sitter jag inte och gör det på svenska. Det finns inget värre än att sitta med ett Spreadsheet i Excell eller motsvarande i OpenOffice och den är installerad på svenska. -- Innocent bystander 26 oktober 2015 kl. 19.07 (CET)
- Kulturskymning! --Paracel63 (diskussion) 22 maj 2016 kl. 13.11 (CEST)
Då det finns en omdirigering
[redigera wikitext]Hur är det tänkt att fungera om en artikel om en plats ska skapas, men så finns det redan en omdirigering med det namnet? Skrivs omdirigeringen över? Svensson1 (diskussion) 30 oktober 2015 kl. 21.36 (CET)
- Människoskapade omdirigeringar skrivs inte över, däremot botskapade. Lsj (diskussion) 30 oktober 2015 kl. 21.40 (CET)
- Skapar inte Lsjbot någonting om den platsen om det finns en människoskapad omdirigering eller skapar Lsjbot en artikel med ett lite avvikande namn? Svensson1 (diskussion) 30 oktober 2015 kl. 21.52 (CET)
- Om det redan finns en människoskapad artikel om en plats skapar Lsjbot numera en artikel i en användarundersida (t.ex. Användare:Lsjbot/Dubletter/Sarpang). Dessa kategoriseras sedan i Kategori:Robotidentifierade potentiella dubletter. Bör fungera även om den befintliga artikeln är en omdirigering till en artikel om platsen. Om omdirigeringen däremot leder till en artikel om något helt annat, så skapas artikeln i huvudnamnrymden men med särskiljningsled. Lsj (diskussion) 30 oktober 2015 kl. 22.17 (CET)
- Skapar inte Lsjbot någonting om den platsen om det finns en människoskapad omdirigering eller skapar Lsjbot en artikel med ett lite avvikande namn? Svensson1 (diskussion) 30 oktober 2015 kl. 21.52 (CET)
- I den kategorin finns Agal (olika betydelser) som har en inledande mall som säger att den ska infogas i sig själv. Jag hittar inte motsvarande artikel i Användare:Lsjbot/Dubletter. Hur kan den vara röd? --Ettrig (diskussion) 31 oktober 2015 kl. 09.21 (CET)
- Mallen var märklig, måste vara en bugg någonstans. Grensidor läggs annars inte under Användare:Lsjbot/Dubletter, utan precis som tidigare borde det blivit Agal (olika betydelser 2) om det redan fanns en grensida. Här har boten korrekt skrivit över den befintliga botskapade grensidan, men den borde då ha skippat att lägga in en mall. Lsj (diskussion) 31 oktober 2015 kl. 10.46 (CET)
- Har hittat buggen i koden. Lsj (diskussion) 31 oktober 2015 kl. 10.51 (CET)
- Kör om nattens grensidor nu, för att ta bort de onödiga mallarna. Lsj (diskussion) 31 oktober 2015 kl. 13.02 (CET)
- Har hittat buggen i koden. Lsj (diskussion) 31 oktober 2015 kl. 10.51 (CET)
- Mallen var märklig, måste vara en bugg någonstans. Grensidor läggs annars inte under Användare:Lsjbot/Dubletter, utan precis som tidigare borde det blivit Agal (olika betydelser 2) om det redan fanns en grensida. Här har boten korrekt skrivit över den befintliga botskapade grensidan, men den borde då ha skippat att lägga in en mall. Lsj (diskussion) 31 oktober 2015 kl. 10.46 (CET)
- I den kategorin finns Agal (olika betydelser) som har en inledande mall som säger att den ska infogas i sig själv. Jag hittar inte motsvarande artikel i Användare:Lsjbot/Dubletter. Hur kan den vara röd? --Ettrig (diskussion) 31 oktober 2015 kl. 09.21 (CET)
Jag har kopierat texten från ...Dubletter/Friars Hill till Friars Hill. Var det rätt gjort? Hur avförs en sådan artikel från dublettlistan? --Ettrig (diskussion) 1 november 2015 kl. 10.14 (CET)
- Man behöver dessutom manuellt ta bort <nowiki></nowiki> kring kategorier och interwiki (inlagt för att inte kategorisera artiklar utanför huvudnamnrymden). Dublettkategoriseringen försvann när du tog bort robotinfoga-mallen. Ur Användare:Lsjbot/Namnkonflikter behöver artiklar avföras manuellt. Det väcker frågan om sidan .../Namnkonflikter behövs -- det kanske räcker med kategoriseringen? Lsj (diskussion) 1 november 2015 kl. 10.46 (CET)
- Jag har använt namnkonfliktsidan för att hitta dubletter att slå ihop när jag harf ork för det. Då får jag växterna för sig eftersom jag inte bryr mig så mycket om resten. Men det kanske är lättare med kategorierna? --افيراتير (diskussion) 1 november 2015 kl. 11.02 (CET)
Vad är det här Användare:Lsjbot/Dubletter/El&? Länken till GeoNames känns inte vid av GeoNames. --Ettrig (diskussion) 3 november 2015 kl. 22.32 (CET)
- Samma problem som dryftats i Diskussion:Elšani. Lsj (diskussion) 5 november 2015 kl. 15.50 (CET)
Process för Dubletter
[redigera wikitext]Dubletterna är artiklar som ska åtgärdas. Vi behöver etablera en process för att åtgärda och avföra dubletter.
- Åtgärda artikeln
- Konstatera att ingen åtgärd behövs
- Kopiera helt
- Kombinera gamla och nya
- Ta bort dublett-artikeln
- Ta bort länkarna ur listan
Det jag fastnat på är att ta bort dublett-artikeln. Det får jag väl inte göra? Tänkte mig inte för, utan tog bort Användare:Lsjbot/Dubletter/Findel ur listan. Finns det en robot som tar bort de dublett-artiklar som inte längre finns i listan? Om det inte finns, är det tillräckligt lätt för någon av er robot-hackare att göra en sån? --Ettrig (diskussion) 5 november 2015 kl. 14.57 (CET)
- Enklaste lösningen är att lägga
{{radera}}
i artikeln. Att robot-radera är inte oproblematiskt. Lsj (diskussion) 5 november 2015 kl. 15.48 (CET)- För extra tydlighet: Jag menade de artiklar som finns under Lsjbot/ . Har nu lagt in radera i ett par av dem. --Ettrig (diskussion) 5 november 2015 kl. 16.26 (CET)
- De två är borta nu. Processen är alltså ?:
- Kontrollera och åtgärda artikeln
- Lägg in radera-mallen i dublettartikeln
- När länken är röd i listan: ta bort raden ur listan
- Processen borde kanske publiceras i listan? --Ettrig (diskussion) 5 november 2015 kl. 16.53 (CET)
Icke-namnkonflikter
[redigera wikitext]Användare:Lsjbot/Namnkonflikter innehåller följande passage:
- South Point (olika betydelser) South Point (olika betydelser)
- Signal Hill (olika betydelser) Signal Hill (olika betydelser)
- Sandy Island (olika betydelser) Sandy Island (olika betydelser)
- Saint Philip (olika betydelser) Saint Philip (olika betydelser)
- Saint Peter (olika betydelser) Saint Peter (olika betydelser)
- Saint Paul (olika betydelser) Saint Paul (olika betydelser)
- Saint Mary (olika betydelser) Saint Mary (olika betydelser)
- Saint John's (olika betydelser) Saint John's (olika betydelser)
- St. John's (olika betydelser) St. John's (olika betydelser)
- Saint George (olika betydelser) Saint George (olika betydelser)
- The Pinnacle (olika betydelser) The Pinnacle (olika betydelser)
- Parham (olika betydelser) Parham (olika betydelser)
- Pares (olika betydelser) Pares (olika betydelser)
- Carlisle (olika betydelser) Carlisle (olika betydelser)
- Table Mountain (olika betydelser) Table Mountain (olika betydelser)
- Long Island (olika betydelser) Long Island (olika betydelser)
- High Point (olika betydelser) High Point (olika betydelser)
Sådana ska väl helt enkelt tas bort? Tarvas någon ytterligare undersökning? --Ettrig (diskussion) 6 november 2015 kl. 12.47 (CET)
- Jo, de kan nog tas bort. Men de borde inte genereras. Lsj (diskussion) 6 november 2015 kl. 22.01 (CET)
- Nej, de borde inte genereras. Det var därför jag frågade om undersökning. --Ettrig (diskussion) 8 november 2015 kl. 10.31 (CET)
- Jag har lagt in i koden en spärr mot ytterligare generering. Bör inte ha blivit några fler under helgens körningar. Lsj (diskussion) 8 november 2015 kl. 11.03 (CET)
- Nej, de borde inte genereras. Det var därför jag frågade om undersökning. --Ettrig (diskussion) 8 november 2015 kl. 10.31 (CET)
Azeriska namn
[redigera wikitext]På förgreningssidan Gora Karadag finns Qaradağ (berg i Azerbajdzjan, Qäbälä). Qäbälä referera säkert till Qəbələ. Såvitt jag vet uttalas visserligen Ə som Ä, men man bör väl använda den ursprungliga formen. K9re11 (diskussion) 7 november 2015 kl. 13.11 (CET)
- När det gäller namn på länder och provinser (&motsvarande) har jag för hand matchat mot vad som redan står på svenska Wikipedia. Stavningen i det här fallet torde vara hämtad från Azerbajdzjans administrativa indelning, där ə konsekvent har transkriberats som ä. GeoNames anger annars Qabala som huvudvariant. Lsj (diskussion) 7 november 2015 kl. 14.38 (CET)
- Det skulle gå att ändra just Qäbälä inför framtida skapande utan större problem. Men då kvarstår dels andra eventuellt tveksamma transkriberingar i Azerbajdzjans administrativa indelning, och dels de grensidor som redan har skapats där Qäbälä finns med. Hur viktigt är det här? Lsj (diskussion) 7 november 2015 kl. 15.00 (CET)
- Jag tycker att det är konstigt att Qəbələ skrivs Qäbälä, och samma sak med en del andra azeriska namn, men samtidigt engelska namn skrivs i originalformen. Azeriskan har ingen orsak att särbehandlas, så Qəbələ bör nog användas. K9re11 (diskussion) 7 november 2015 kl. 15.07 (CET)
- Det skulle gå att ändra just Qäbälä inför framtida skapande utan större problem. Men då kvarstår dels andra eventuellt tveksamma transkriberingar i Azerbajdzjans administrativa indelning, och dels de grensidor som redan har skapats där Qäbälä finns med. Hur viktigt är det här? Lsj (diskussion) 7 november 2015 kl. 15.00 (CET)
Armeniska
[redigera wikitext]På sidan Shikahoghi Argelanots' står att Shikahoghi Argelanots’ är det armeniska namnet. Dessutom finns Shikakhokhskiy Zapovednik (säkert ryskt namn translittererat till engelska) och Shikahogh State Reserve som alternativa namn. Sidan Verishen har fel namn, det bör vara Verisjen (jag kan inte läsa armeniska, men detta går att lista ut från andra språkversioners artiklar, t.ex. de:Werischen). Jag antar att en del andra artiklar lider av samma problem, t.ex. gissar jag att Shikahoghi Argelanots' bör ha sj i början. K9re11 (diskussion) 7 november 2015 kl. 15.13 (CET)
- Här följer boten källan GeoNames. För Verishen innehåller GeoNames endast den namnformen, Verisjen finns inte med, inte heller en kyrillisk eller armenisk version som man kunde retranskribera från. Transkription från armenisk skrift tänker jag hur som helst inte ge mig på. Shikahoghi Argelanots' är mer komplicerat. Artikelnamnet och det "armeniska" namnet skiljer sig i formen på apostrofen. Vi hade en diskussion om olika apostrofer nyligen som jag inte hittar just nu, och utifrån den standardiserar jag apostroferna i artikelnamn, men inte i alternativa namn. Om boten kallar ett namn "armeniskt", så är det för att det har den etiketten i GeoNames. Vad kyrillisk transkribering beträffar så diskuterades detta i #Пра́вда här ovan för ett tag sedan. Utfallet blev att för länder där kyrilliska är den primära skriften gjorde jag om GeoNames engelska transkribering enligt svenska normer. Men detta gjordes inte i länder som Armenien där kyrilliska inte är den normala skriften. Skulle under vissa förutsättningar gå att göra löpande, men jag tror inte de förutsättningarna är uppfyllda just för Shikahoghi Argelanots'. Lsj (diskussion) 7 november 2015 kl. 17.03 (CET)
Fel datum för folkmängder
[redigera wikitext]Många av robotens artiklar använder fel datum för folkmängder. Några exempel är:
- Muharraqguvernementet som anger datumet 2010-08-06 men källan frwp säger (utan egen källa) att folkmängden gäller 2001.
- Hobscheid (kommun) med datumet 2008-06-14 där frwp säger (utan källa) 2015.
- Redange (kanton) anger datum 2013-11-09 fast uppgiften om folkmängd (utan datum och källa) lades in i geonames redan 2006.
F.d. 82.212.68.183 (diskussion) 7 november 2015 kl. 16.55 (CET)
- De två förstnämnda är en bugg, där befolkning från frwp har fått datum från GeoNames. Ska fixas. Tack för att du noterade den. Den sistnämnda har det datum som GeoNames anger som senaste uppdatering av posten. Lsj (diskussion) 7 november 2015 kl. 17.07 (CET)
- Det sista exemplet är också en bugg. Dels är det inte troligt att befolkningsstatistiken lades in på geonames samma datum som den skapades, dels är det stor chans att senaste uppdateringen var av någon annan uppgift. Geonames anger inga datum för folkmängder, så det kan inte användas som källa för det. F.d. 82.212.68.183 (diskussion) 7 november 2015 kl. 19.17 (CET)
- Botkörning pågår för att ta bort felaktiga datum. Lsj (diskussion) 7 november 2015 kl. 20.49 (CET)
- Fixat. Ett hundratal artiklar hade samma fel som Muharraqguvernementet och Hobscheid (kommun). Lsj (diskussion) 8 november 2015 kl. 00.11 (CET)
- Botkörning pågår för att ta bort felaktiga datum. Lsj (diskussion) 7 november 2015 kl. 20.49 (CET)
- Det sista exemplet är också en bugg. Dels är det inte troligt att befolkningsstatistiken lades in på geonames samma datum som den skapades, dels är det stor chans att senaste uppdateringen var av någon annan uppgift. Geonames anger inga datum för folkmängder, så det kan inte användas som källa för det. F.d. 82.212.68.183 (diskussion) 7 november 2015 kl. 19.17 (CET)
Tidszoner i Antarktis
[redigera wikitext]Vilken tidszon, om någon, bör boten ange för platser i Antarktis? GeoNames anger UTC+13 för de flesta antarktiska platser, men man kan misstänka att det är ett dummyvärde. Eller ska jag helt enkelt ta bort tidszonsparametern från antarktisartiklarna? Lsj (diskussion) 10 november 2015 kl. 21.30 (CET)
- Minns jag rätt så är det forskningsstationens bekvämlighet som bestämmer vilken tidszon de följer. Det bekvämaste är nog att helt enkelt strunta i denna parameter för Antarktis. Det finns kanske någon nedlagd valfångststation i Atlanten där det kan vara annorlunda, men det spelar kanske mindre roll. -- Innocent bystander 11 november 2015 kl. 07.11 (CET)
Antarktis glest befolkat ?
[redigera wikitext]Tchaikovsky och antagligen många andra artiklar säger att omkringliggande trakt är glest befolkad. Jag misstänker starkt att dessa påståenden oftast är felaktiga. Dessa trakter är snarare obefolkade. Avsikten var nog att påtala att befolkningstalet är lågt. Men denna formulering betyder att det bor folk i trakten. Men för större delen av Antarktis är detta som sagt inte sant. --Ettrig (diskussion) 11 november 2015 kl. 10.00 (CET)
- Boten kan inte skilja på glesbefolkade och obefolkade trakter, eftersom landsbygdsbefolkning inte syns i databasen. Och visst är Antarktis glesbefolkat, mycket glest, med sådär 0,0001 invånare per km2. Men jag kan göra en specialare så att det just för Antarktis står "obefolkat". Ska ändå göra specialare med tidszonerna, och skriva "kontinenten" istället för "landet". Annars är det ju korrekt som står om de flesta platser att de ligger i norra delen av landet. Lsj (diskussion) 11 november 2015 kl. 10.18 (CET)
- Den här uppgiften är kanske för svår för Lsjbot. Det är sant att Antarktis är glest befolkat. Det är också sant att de flesta trakter i (på?) Antarktis är obefolkade. Jag vet inte, men tror att det finns ett par orter på Antarktis. Jag vet inte om alla trakter utanför dessa orter är obefolkade. Möjligen skulle Lsjbot kunna skriva att i trakten finns ingen eller mycket liten befolkning. Det skulle i alla fall inte vara ett falskt påstående. --Ettrig (diskussion) 11 november 2015 kl. 10.37 (CET)
- Ska kolla ifall de få orterna finns med i GeoNames. I så fall är det hanterbart med botens normala metoder. En diskussion om Antarktis har f.ö. också uppstått på WP:Robothjälp. Lsj (diskussion) 11 november 2015 kl. 11.31 (CET)
- Antarktis har en befolkning på ca. 4000 om sommeren og 1000 om vinteren - i all hovedsak temporært personell og forskere ved kontinentets 60-talls forskningsstasjoner. De eneste "orter" med sivil befolkning er en:Villa Las Estrellas og Esperanza. - 4ing (diskussion) 11 november 2015 kl. 11.56 (CET)
- Att en region på Antarktis är glest befolkad eller obefolkad är nog icke-information. Om det lätt går att lämna bort sådana meningar tycker jag man skall göra det. Om man däremot kan säga något om att det finns en forskningsstation (eller annan "bosättning") i "närheten" är det bra att skriva in. Också "Det finns inga samhällen i närheten." är vettig information, med lämplig definition av samhälle och närhet. --LPfi (diskussion) 11 november 2015 kl. 13.59 (CET)
- Forskare är ingen befolkning. IMO kan dessa meningar om "glest befolkad" eller "inget samhälle i närheten" helt strykas för hela Antarktis. --Nordelch För Wikipedia - i tiden 12 november 2015 kl. 14.21 (CET)
- Att en region på Antarktis är glest befolkad eller obefolkad är nog icke-information. Om det lätt går att lämna bort sådana meningar tycker jag man skall göra det. Om man däremot kan säga något om att det finns en forskningsstation (eller annan "bosättning") i "närheten" är det bra att skriva in. Också "Det finns inga samhällen i närheten." är vettig information, med lämplig definition av samhälle och närhet. --LPfi (diskussion) 11 november 2015 kl. 13.59 (CET)
- Antarktis har en befolkning på ca. 4000 om sommeren og 1000 om vinteren - i all hovedsak temporært personell og forskere ved kontinentets 60-talls forskningsstasjoner. De eneste "orter" med sivil befolkning er en:Villa Las Estrellas og Esperanza. - 4ing (diskussion) 11 november 2015 kl. 11.56 (CET)
- Ska kolla ifall de få orterna finns med i GeoNames. I så fall är det hanterbart med botens normala metoder. En diskussion om Antarktis har f.ö. också uppstått på WP:Robothjälp. Lsj (diskussion) 11 november 2015 kl. 11.31 (CET)
- Den här uppgiften är kanske för svår för Lsjbot. Det är sant att Antarktis är glest befolkat. Det är också sant att de flesta trakter i (på?) Antarktis är obefolkade. Jag vet inte, men tror att det finns ett par orter på Antarktis. Jag vet inte om alla trakter utanför dessa orter är obefolkade. Möjligen skulle Lsjbot kunna skriva att i trakten finns ingen eller mycket liten befolkning. Det skulle i alla fall inte vara ett falskt påstående. --Ettrig (diskussion) 11 november 2015 kl. 10.37 (CET)
- Njae. Forskare är väl också folk? Jag är ganska säker på att det finns en permanent bas på Sydpolen. Vi har väl inget kutym att personer som bott 6 månader eller mindre ska räknas bort från befolkningssiffran? Ska bli intressant när vi kommer till Brasilien. I Amazonas finns stora områden som bara har nomadiserande (primitiv (fult ord)) befolkning. Ska de beskrivas som obefolkade? --Ettrig (diskussion) 12 november 2015 kl. 17.38 (CET)
- GeoNames anger befolkningssiffror för många forskningsstationer. Blygsamma sådana i de flesta fall, men ändå. Och McMurdo har över 1000 invånare. Tycker nog ändå vi kan behandla dem som samhällen. Lsj (diskussion) 12 november 2015 kl. 17.44 (CET)
- Oberoende om forskningsstationer är "samhällen" eller har "befolkning" så är närliggande forskningsstationer intressant information för den som läser om platser på Antarktis. Det torde vara möjligt att använda sådan terminologi att det inte blir missvisande eller alltför lustigt (vad kallas stationerna och eventuella andra "samhällen" i GeoNames?). --LPfi (diskussion) 13 november 2015 kl. 16.57 (CET)
- De är en egen platstyp i Geonames, som jag inte betraktar som relevant i "normala" länder, men som jag befordrar till relevans just för Antarktis. Lsj (diskussion) 13 november 2015 kl. 17.18 (CET)
- Befordran av stationerna verkar inte fungera helt och hållet, de blir olänkade av någon anledning. Se t.ex. Boulder Cones. Lsj (diskussion) 13 november 2015 kl. 17.30 (CET)
- Fixat. Lsj (diskussion) 14 november 2015 kl. 17.50 (CET)
- Angående Ettrigs inlägg - forskare är också folk men är de bosatta någon annan stans och bara vistas tillfälligt på Antarktis är de inte bosatta där. En charterturist på Mallorca ingår inte i Mallorcas befolkning. Om viss personal vistas där år i sträck är det möjligen en annan sak, då kan de möjligen räknas som bosatta där. McMurdo har inte över 1000 innevånare, den har 1000 personer som vistas där under vinterhalvåret och ungefär 250 under sommaren. Hur många av dessa som kan räknas som fast bosatta och stannar på basen år efter år är troligen betydligt färre. Nomadiserande befolkningar beskrivs som bosatta i de regioner de är bosatta i. Det är ju inte så att de strövar omkring fritt, de har sina egna territorier med boplatser dit de återvänder. Normalt har de även en basboplats, särskilt de stammar som håller tamgrisar vilket är stora delar av stammarna. Det är egentligen inte annorlunda än gårdar med hemfäbodar och långfäbodar. En plats där nomadiserande fiskare en gång om året slår sig ned för att fiska under några veckor för att därefter ge sig av har inte heller någon fast befolkning. Räknar man in turister, säsongsarbetare med mera ju mängder med människor att bidra med befolkning på flera platser och ge en betydligt större befolkning än vad som egentligen finns. Visst är det intressant om en viss plats är ett flitigt besöksmål men de bör inte räknas in i befolkningsstatistik och bidra vid beräkningar av befolkningstäthet.FBQ (diskussion) 16 november 2015 kl. 22.04 (CET)
- Artikeln Antarktis säger att kontinenten har 0 permanenta innevånare och normalt 1000-4000 som vistas där beroende på årstid. Det är den definitionen av innevånare som vanligen används, skall vi använda någon annan tycker jag det behövs förtydligas.FBQ (diskussion) 18 november 2015 kl. 14.01 (CET)
- Angående Ettrigs inlägg - forskare är också folk men är de bosatta någon annan stans och bara vistas tillfälligt på Antarktis är de inte bosatta där. En charterturist på Mallorca ingår inte i Mallorcas befolkning. Om viss personal vistas där år i sträck är det möjligen en annan sak, då kan de möjligen räknas som bosatta där. McMurdo har inte över 1000 innevånare, den har 1000 personer som vistas där under vinterhalvåret och ungefär 250 under sommaren. Hur många av dessa som kan räknas som fast bosatta och stannar på basen år efter år är troligen betydligt färre. Nomadiserande befolkningar beskrivs som bosatta i de regioner de är bosatta i. Det är ju inte så att de strövar omkring fritt, de har sina egna territorier med boplatser dit de återvänder. Normalt har de även en basboplats, särskilt de stammar som håller tamgrisar vilket är stora delar av stammarna. Det är egentligen inte annorlunda än gårdar med hemfäbodar och långfäbodar. En plats där nomadiserande fiskare en gång om året slår sig ned för att fiska under några veckor för att därefter ge sig av har inte heller någon fast befolkning. Räknar man in turister, säsongsarbetare med mera ju mängder med människor att bidra med befolkning på flera platser och ge en betydligt större befolkning än vad som egentligen finns. Visst är det intressant om en viss plats är ett flitigt besöksmål men de bör inte räknas in i befolkningsstatistik och bidra vid beräkningar av befolkningstäthet.FBQ (diskussion) 16 november 2015 kl. 22.04 (CET)
- Fixat. Lsj (diskussion) 14 november 2015 kl. 17.50 (CET)
- Befordran av stationerna verkar inte fungera helt och hållet, de blir olänkade av någon anledning. Se t.ex. Boulder Cones. Lsj (diskussion) 13 november 2015 kl. 17.30 (CET)
- De är en egen platstyp i Geonames, som jag inte betraktar som relevant i "normala" länder, men som jag befordrar till relevans just för Antarktis. Lsj (diskussion) 13 november 2015 kl. 17.18 (CET)
- Oberoende om forskningsstationer är "samhällen" eller har "befolkning" så är närliggande forskningsstationer intressant information för den som läser om platser på Antarktis. Det torde vara möjligt att använda sådan terminologi att det inte blir missvisande eller alltför lustigt (vad kallas stationerna och eventuella andra "samhällen" i GeoNames?). --LPfi (diskussion) 13 november 2015 kl. 16.57 (CET)
- GeoNames anger befolkningssiffror för många forskningsstationer. Blygsamma sådana i de flesta fall, men ändå. Och McMurdo har över 1000 invånare. Tycker nog ändå vi kan behandla dem som samhällen. Lsj (diskussion) 12 november 2015 kl. 17.44 (CET)
- Njae. Forskare är väl också folk? Jag är ganska säker på att det finns en permanent bas på Sydpolen. Vi har väl inget kutym att personer som bott 6 månader eller mindre ska räknas bort från befolkningssiffran? Ska bli intressant när vi kommer till Brasilien. I Amazonas finns stora områden som bara har nomadiserande (primitiv (fult ord)) befolkning. Ska de beskrivas som obefolkade? --Ettrig (diskussion) 12 november 2015 kl. 17.38 (CET)
Jag har ingen stark åsikt i frågan. Bara ett par svaga. 1) Om antalet personer som bor på en plats varierar mellan 250 och 1000, och alla är tillfälliga (några dagar till några månader) så skulle det vara vilseledande att sammanfatta detta som att platsen är obefolkad. (Ordet bo innefattar också tillfälligt vistande (Var ska du bo i natt?)) 2) Befolkning är inte samma sak som antalet fast bosatta. --Ettrig (diskussion) 18 november 2015 kl. 16.18 (CET)
- Som nämnts tidigare i den här tråden finns faktiskt ett par platser i Antarktis med normal civil befolkning, inte bara forskare: en:Villa Las Estrellas och Esperanza. Så att befolkningen skulle vara 0 är fel. Jag har heller ingen stark åsikt om exakt hur det ska uttryckas, men visst är det relevant info om en plats i Antarktis huruvida det överhuvudtaget finns en mänsklig närvaro i trakten eller inte. Även om de inte bor där permanent. Lsj (diskussion) 18 november 2015 kl. 17.00 (CET)
- De flesta språkversioner anger att Antarktis har en permanent befolkning på 0 personer. Om de har fel och i vilken mån man verkligen kan tala om en "bofast" befolkning kan jag inte svara på. Esperanza (forskningsstation) har en befolkning av 55 personer vintertid, frågan är dock om de verkligen bor här permanent och om de är folkbokförda här. Befolkningen här är som artikeln säger kopplad till "Argentinas territoriella anspråk på denna del av Antarktis" - Argentina är måna om att stärka sina anspråk på Antarktis så uppenbart håller de folk här av det skälet, om de sedan bor här i säsonger, anställningsintervall om flera år eller verkligen har sina permanenta hem här vet jag inte. Samma sak gäller en:Villa Las Estrellas som tydligen enligt engelskspråkiga wikipedia en befolkning av 150 personer sommartid och 80 personer vintertid. Chile har 4 permanenta baser och 7 som enbart är tillfälligt aktiva. Att de är permanenta betyder att de har personal året runt men inte nödvändigtvis att det är samma personal som stannar kvar år från år. Jag tycker det är viktigt att vi inte använder andra kriterier för befolkning på Antarktis. Gotland har 57 255 innevånare. Ön besöks årligen av ungefär 800.000 människor. Det är viktigt att de inte räknas som befolkning, även om gissningsvis minst lika många som de fasta innevånarna har sommarhus och en del vistas i stort sett lika ofta i dessa som på sina folkbokförda adresser. Vi får väldigt underlig statistik om människor skall registreras som boende på flera platser. Man kan givetvis kommentera om det finns stor antal semesterfirare eller andra tillfälliga besökare. Hursomhelst torde några hundra personer som vistas på en 14.000.000 km2 stor kontinent göra att det är ganska små områden som kan räknas som befolkade. På vilket avstånd måste det finnas befolkning för att boten skall klassa området som befolkat?FBQ (diskussion) 18 november 2015 kl. 21.46 (CET)
- För att svara på den sista frågan först: boten räknar befolkning inom 20 km radie, både i Antarktis och andra ställen. Det betyder att sådär 99% av Antarktis yta klassas som obefolkad. Vad de argentinska och chilenska bosättningarna beträffar, så misstänker jag att befolkningen är mantalskriven på plats, just i syfte att stärka ländernas anspråk. Och båda ställena har tillräckligt många barnfamiljer för att driva skolor. Flera barn är födda på plats. Båda ställena är också inlemmade i ländernas civila administration. Tycker nog detta är fullt tillräckligt för att kalla platserna befolkade i ganska normal mening. (info från spanska Wikipedia) Lsj (diskussion) 19 november 2015 kl. 19.51 (CET)
- En relaterad fråga är ju "Om en forskningsstation är den enda befolkningen i ett område inom 20 km, kan man då verkligen tala om att omgivningen är glest befolkad?" Om den enda bosättningen på Gotland hade varit Visby, skulle vi då säga att Visbys omgivning är glest befolkad? -- Innocent bystander 19 november 2015 kl. 20.29 (CET)
- Så står det inte i artiklarna. I artiklar om forskningsstationer står det "Trakten är obefolkad. Det finns inga samhällen i närheten." I artiklar om platser i närheten av forskningsstationer står det "Trakten är glest befolkad. Närmaste befolkade plats är Arturo Parodi Station, 2,3 km nordost om Patriot Hills." Lsj (diskussion) 20 november 2015 kl. 10.00 (CET)
- Informasjonen om befolkningstetthet er vel en "ikke-informasjon" som er tilstrekkelig å nevne i hovedartikkelen Antarktis, på samme sett som at det er overflødig å skrive at Stockholm har høy befolkningstetthet. For Antarktis' vedkommende vil det være mye mer interessant/relevant å opplyse om avstanden til nærmeste forskningsstasjon. - 4ing (diskussion) 20 november 2015 kl. 12.20 (CET)
- Ur Antarktis inledning "Det är den enda kontinent som saknar bofast mänsklig befolkning" och Antarktis#Befolkning "Antarktis har inga riktiga invånare, på de olika forskningsstationer lever däremot varje sommar mer än 4 000 och året runt omkring 1 000 personer." Texten borde i forskningsstationerna vara: Antarktis saknar bofast befolkning men forskningsstationerna är (kan vara?) bemannade året runt." Maundwiki (diskussion) 20 november 2015 kl. 16.47 (CET)
- Som vi konstaterat ovan, så verkar det finnas åtminstone en Chilensk och en ARgentinsk bosättning som gör den artikeln lite föråldrad. Det stycket ser dessutom ut att helt sakna källor. -- Innocent bystander 20 november 2015 kl. 16.54 (CET)
- Ur Antarktis inledning "Det är den enda kontinent som saknar bofast mänsklig befolkning" och Antarktis#Befolkning "Antarktis har inga riktiga invånare, på de olika forskningsstationer lever däremot varje sommar mer än 4 000 och året runt omkring 1 000 personer." Texten borde i forskningsstationerna vara: Antarktis saknar bofast befolkning men forskningsstationerna är (kan vara?) bemannade året runt." Maundwiki (diskussion) 20 november 2015 kl. 16.47 (CET)
- Informasjonen om befolkningstetthet er vel en "ikke-informasjon" som er tilstrekkelig å nevne i hovedartikkelen Antarktis, på samme sett som at det er overflødig å skrive at Stockholm har høy befolkningstetthet. For Antarktis' vedkommende vil det være mye mer interessant/relevant å opplyse om avstanden til nærmeste forskningsstasjon. - 4ing (diskussion) 20 november 2015 kl. 12.20 (CET)
- Så står det inte i artiklarna. I artiklar om forskningsstationer står det "Trakten är obefolkad. Det finns inga samhällen i närheten." I artiklar om platser i närheten av forskningsstationer står det "Trakten är glest befolkad. Närmaste befolkade plats är Arturo Parodi Station, 2,3 km nordost om Patriot Hills." Lsj (diskussion) 20 november 2015 kl. 10.00 (CET)
- En relaterad fråga är ju "Om en forskningsstation är den enda befolkningen i ett område inom 20 km, kan man då verkligen tala om att omgivningen är glest befolkad?" Om den enda bosättningen på Gotland hade varit Visby, skulle vi då säga att Visbys omgivning är glest befolkad? -- Innocent bystander 19 november 2015 kl. 20.29 (CET)
- För att svara på den sista frågan först: boten räknar befolkning inom 20 km radie, både i Antarktis och andra ställen. Det betyder att sådär 99% av Antarktis yta klassas som obefolkad. Vad de argentinska och chilenska bosättningarna beträffar, så misstänker jag att befolkningen är mantalskriven på plats, just i syfte att stärka ländernas anspråk. Och båda ställena har tillräckligt många barnfamiljer för att driva skolor. Flera barn är födda på plats. Båda ställena är också inlemmade i ländernas civila administration. Tycker nog detta är fullt tillräckligt för att kalla platserna befolkade i ganska normal mening. (info från spanska Wikipedia) Lsj (diskussion) 19 november 2015 kl. 19.51 (CET)
- De flesta språkversioner anger att Antarktis har en permanent befolkning på 0 personer. Om de har fel och i vilken mån man verkligen kan tala om en "bofast" befolkning kan jag inte svara på. Esperanza (forskningsstation) har en befolkning av 55 personer vintertid, frågan är dock om de verkligen bor här permanent och om de är folkbokförda här. Befolkningen här är som artikeln säger kopplad till "Argentinas territoriella anspråk på denna del av Antarktis" - Argentina är måna om att stärka sina anspråk på Antarktis så uppenbart håller de folk här av det skälet, om de sedan bor här i säsonger, anställningsintervall om flera år eller verkligen har sina permanenta hem här vet jag inte. Samma sak gäller en:Villa Las Estrellas som tydligen enligt engelskspråkiga wikipedia en befolkning av 150 personer sommartid och 80 personer vintertid. Chile har 4 permanenta baser och 7 som enbart är tillfälligt aktiva. Att de är permanenta betyder att de har personal året runt men inte nödvändigtvis att det är samma personal som stannar kvar år från år. Jag tycker det är viktigt att vi inte använder andra kriterier för befolkning på Antarktis. Gotland har 57 255 innevånare. Ön besöks årligen av ungefär 800.000 människor. Det är viktigt att de inte räknas som befolkning, även om gissningsvis minst lika många som de fasta innevånarna har sommarhus och en del vistas i stort sett lika ofta i dessa som på sina folkbokförda adresser. Vi får väldigt underlig statistik om människor skall registreras som boende på flera platser. Man kan givetvis kommentera om det finns stor antal semesterfirare eller andra tillfälliga besökare. Hursomhelst torde några hundra personer som vistas på en 14.000.000 km2 stor kontinent göra att det är ganska små områden som kan räknas som befolkade. På vilket avstånd måste det finnas befolkning för att boten skall klassa området som befolkat?FBQ (diskussion) 18 november 2015 kl. 21.46 (CET)
Norra/södra/centrala delen av kontinenten Antarktis
[redigera wikitext]Nytt försök med Antarktis. Har fixat med anspråk, tidszoner, och annat. Har också gjort en speciallösning med "delen av landet". Nu kallas det "centrala delen" om det är nära sydpolen, "nordöstra" om det är vid kusten kring longitud +90, "nordvästra" om det är kring longitud -90, och "norra" annars. Lsj (diskussion) 11 november 2015 kl. 20.04 (CET)
- Jag hade kallat det Öst/Väst-antarktis, men det kanske är en smaksak? -- Innocent bystander 11 november 2015 kl. 20.31 (CET)
- Det finns ju delar som formellt heter Öst/Väst-antarktis, men boten kan inte identifiera dem med säkerhet. Därför använder jag nordöstra/nordvästra som är vagare. Lsj (diskussion) 11 november 2015 kl. 20.43 (CET)
- (red.konflikt) Øst-Antarktis og Vest-Antarktis er innarbeidede begrep og den transantarktiske fjellkjede danner en naturlig delelinje. Området rundt Sørpolen kalles Antarktis indre, Polarplatået, Antarktisplatået mm., men jeg kan ikke huske å ha sett betegnelsen sentrale Antarktis (det ligger ganske usentralt....). Nordre delen av Antarktis er også en nykonstruksjon, ved kysten, kystnære er muligens bedre. - mvh 4ing (diskussion) 11 november 2015 kl. 20.51 (CET)
- Ja, om nu inte det "kustnära" ligger på en ö utanför själva fastlandet. -- Innocent bystander 11 november 2015 kl. 20.53 (CET)
- Känns inte klockrent att kalla Belgica Guyot för kustnära. Lsj (diskussion) 11 november 2015 kl. 20.59 (CET)
- Säg inte det, jag tycker det ser ut som bara ngn dryg cm på kartan. -- Innocent bystander 11 november 2015 kl. 21.04 (CET)
- Belgica Guyot ligger vel strengt tatt ikke på kontinentet, men utenfor. Det samme gjør Nils Larsen (glaciär), men den har ikke blitt plassert på Peter I:s ö der den hører hjemme. Dermed stemmer heller ikke "Inget land gör anspråk på området." Samme påstand settes fram i blant annet Nielsenholen og Nordhortane, som begge ligger i Norges kravområde Dronning Maud Land. - 4ing (diskussion) 11 november 2015 kl. 22.02 (CET)
- Säg inte det, jag tycker det ser ut som bara ngn dryg cm på kartan. -- Innocent bystander 11 november 2015 kl. 21.04 (CET)
- Känns inte klockrent att kalla Belgica Guyot för kustnära. Lsj (diskussion) 11 november 2015 kl. 20.59 (CET)
- Ja, om nu inte det "kustnära" ligger på en ö utanför själva fastlandet. -- Innocent bystander 11 november 2015 kl. 20.53 (CET)
Provar att identifiera Öst/Väst-antarktis i nästa omgång. Nära sydpolen får det fortfarande heta centrala delen. Lsj (diskussion) 12 november 2015 kl. 21.48 (CET)
- Takk, det tror jeg ble bedre. Har ikke kontrollert så mange artikler - det hadde vært enklere dersom du også hadde kategorisert artiklene i henholdsvis Kategori:Östantarktis og Kategori:Västantarktis. For øvrig finnes det ingen klar skillelinje mellom de to delene - hvordan har du beskrevet steder som ligger i den antarktiske fjellkjede? Det hadde vært elegant dersom boten kunne identifisere objekter i denne fjellkjeden og lagt til det i artiklene i stedet for en usikker plassering i Öst- eller Västantarktis. - 4ing (diskussion) 13 november 2015 kl. 08.58 (CET)
- Kategorisering tänkte jag inte på, men det går att ordna ganska enkelt. Boten har en algoritm för att identifiera bergskedjor, men den fungerar bara för ganska små isolerade bergsmassiv, inte för hela den antarktiska fjällkedjan. Jag valde definitionen av "centrala delen" så att det skulle innefatta den del av kedjan som inte entydigt hör till Östantarktis. (Central del = latitud >85S, utanför den cirkeln är longitud 45-180V Västantarktis, resten Östantarktis). Lsj (diskussion) 13 november 2015 kl. 12.50 (CET)
- Håper du kan få på plass kategorisering - i tillegg til Kategori:Östantarktis og Kategori:Västantarktis, finnes Kategori:Dronning Maud Land. På en:Category:Regions of Antarctica finnes mer finmasket oppdeling, som for det meste er definert av sektorer og således enkelt å identifisere. - 4ing (diskussion) 13 november 2015 kl. 13.21 (CET)
- Ser også at steder som hører hjemme i Kategori:Sydshetlandsöarna og Kategori:Sydorkneyöarna feilaktig sies å ligge i Västantarktis, som vanligvis forstås som utelukkende å den kontinentale delen av Antarktis. - 4ing (diskussion) 13 november 2015 kl. 15.15 (CET)
- Kategorier för dessa är på gång. Lsj (diskussion) 13 november 2015 kl. 20.57 (CET)
- Nu borde dessa kategorier genereras, inklusive Kategori:Norges anspråk i Antarktis etc., men inte mer finindelat än anspråken. Lsj (diskussion) 14 november 2015 kl. 13.35 (CET)
- Kategorier för dessa är på gång. Lsj (diskussion) 13 november 2015 kl. 20.57 (CET)
- Ser også at steder som hører hjemme i Kategori:Sydshetlandsöarna og Kategori:Sydorkneyöarna feilaktig sies å ligge i Västantarktis, som vanligvis forstås som utelukkende å den kontinentale delen av Antarktis. - 4ing (diskussion) 13 november 2015 kl. 15.15 (CET)
- Håper du kan få på plass kategorisering - i tillegg til Kategori:Östantarktis og Kategori:Västantarktis, finnes Kategori:Dronning Maud Land. På en:Category:Regions of Antarctica finnes mer finmasket oppdeling, som for det meste er definert av sektorer og således enkelt å identifisere. - 4ing (diskussion) 13 november 2015 kl. 13.21 (CET)
- Kategorisering tänkte jag inte på, men det går att ordna ganska enkelt. Boten har en algoritm för att identifiera bergskedjor, men den fungerar bara för ganska små isolerade bergsmassiv, inte för hela den antarktiska fjällkedjan. Jag valde definitionen av "centrala delen" så att det skulle innefatta den del av kedjan som inte entydigt hör till Östantarktis. (Central del = latitud >85S, utanför den cirkeln är longitud 45-180V Västantarktis, resten Östantarktis). Lsj (diskussion) 13 november 2015 kl. 12.50 (CET)
Antarktiske utfordringer (var: Belgica Mountains)
[redigera wikitext]Jeg flyttet Belgica (berg i Antarktis) til Belgica Mountains. GeoNames har navneformen "Belgica, Monts". Takler ikke roboten slike navneformer med komma (hensikten er vel for korrekt alfabetisk sortering). Jeg fant ingen høydedata for Belgia Mountains på GeoNames, mens den botgenererte artikkelen sier 1986 möh. Jeg endret feature type fra Mountain til Mountains på GeoNames. Jeg ser at koordinatene også er feil - hvis du zoomer litt ut på satellittbildet finner du Belgica Mountains 10-15 km lenger sør enn de oppgitte koordinatene. - 4ing (diskussion) 11 november 2015 kl. 22.22 (CET)
- En rask spotcheck etter siste botkjøring indikerer at boten dessverre produserer artikler som stemmer dårlig med virkeligheten. Hovedårsaken synes å være kvaliteten på dataene i GeoNames. Dataene er ofte upresise, feilaktige og mangelfulle, noe som i hovedsak skyldes at dataene er gamle og at det dreier seg om et øde kontinent. I tilleg til eksemplet ovenfor med Belgica Mountains, viser artikkelen Pensacola Mountains en helt annen beskrivelse sammenlignet med f.eks. no:Pensacolafjellene. Begge de nevnte fjellkjedene er registrert som "feature type=mountain", mens de i virkeligheten er store fjellområder/fjellkjeder. Jeg har selv opprettet mange hundre Antarktis-artikler på norsk WP, og har erfart hvor sparsomme, unøyaktige og sprikende kildene er. - 4ing (diskussion) 12 november 2015 kl. 09.03 (CET)
- Har sjekket litt flere artikler, og ser at iw-lenker mangler for artikler til tross for at de har GeoNames-identifikator (Penguin Island (ö i Antarktis)).
- Jeg er fremdeles skeptisk til hvordan himmelretninger benyttes til å beskrive beliggenhet. Utfordringen er vel at kontinentet omkranser polpunktet, slik at et kartesisk koordinatsystem ikke er brukbart. Beardmore Glacier er plassert nord på kontinentet, men selv om det befinner seg i nærheten av kysten ligger det relativt nærme polpunktet. Skal det bli noen skikk på disse bot-genererte Antarktis-artiklene, tror jeg dataene fra GeoNames må suppleres med f.eks. informasjon fra Wikidata og evt. andre språkversjoner (som at Penguin Island (ö i Antarktis) er en av Sydshetlandsöarna). - 4ing (diskussion) 12 november 2015 kl. 09.42 (CET)
- Jeg har nå slått ihop Ross Sea med den eksisterende Rosshavet, samt merket Weddell Sea for ihopslagning med Weddellhavet. - 4ing (diskussion) 12 november 2015 kl. 10.14 (CET)
- Finnes det noen mulighet for å slå sammen Wikidata-element automatisk? Det er en lang rekke artikler som ikke har blitt koblet til eksisterende Wikidata-element, men det er kanskje bortkastet arbeid å rette opp idette manuelt? - 4ing (diskussion) 13 november 2015 kl. 12.04 (CET)
- Om det finns ett "misstänkt" objekt på Wikidata, så skrivs interwiki-länkar av den "gamla typen" in i artiklarna. Det leder normalt till att robotar kopplar artiklar till rätt objekt mycket snabbt. De fall där programvaran inte kunnat göra denna koppling (även om det är uppenbart vid en manuell titt) så måste arbetet göras för hand. -- Innocent bystander 13 november 2015 kl. 12.12 (CET)
- EmausBot har overført iw-lenker til Wikidata, og det ser ut til at for ca. 600 artikler er det kun lenket til cebuano. Jeg anslår at ca. halvparten av disse allerede har Wikidata-element. - 4ing (diskussion) 13 november 2015 kl. 12.43 (CET)
- Ja, att det samtidigt pågår samma projekt på Cebuano rör till det. När en artikel är fri från interwiki och den är ny, så väntar robotarna normalt ett par veckor innan de lägger in det på WD. -- Innocent bystander 13 november 2015 kl. 14.41 (CET)
- For å forenkle den manuelle koblingen av Wikidata ville det vært en fordel om artikler uten iw til andre språk enn cebuano kategoriseres i en vedlikeholdskategori. Er det mulig å få til? - 4ing (diskussion) 13 november 2015 kl. 15.08 (CET)
- Om detta är ett problem så är väl den enklaste lösningen att boten kör svenska och cebuano ur fas med varandra, så att inte samma länder körs samtidigt på båda språken. Då får man lite tid på sig att manuellt kolla iw. Lsj (diskussion) 13 november 2015 kl. 15.19 (CET)
- For å forenkle den manuelle koblingen av Wikidata ville det vært en fordel om artikler uten iw til andre språk enn cebuano kategoriseres i en vedlikeholdskategori. Er det mulig å få til? - 4ing (diskussion) 13 november 2015 kl. 15.08 (CET)
- Ja, att det samtidigt pågår samma projekt på Cebuano rör till det. När en artikel är fri från interwiki och den är ny, så väntar robotarna normalt ett par veckor innan de lägger in det på WD. -- Innocent bystander 13 november 2015 kl. 14.41 (CET)
- EmausBot har overført iw-lenker til Wikidata, og det ser ut til at for ca. 600 artikler er det kun lenket til cebuano. Jeg anslår at ca. halvparten av disse allerede har Wikidata-element. - 4ing (diskussion) 13 november 2015 kl. 12.43 (CET)
- Om det finns ett "misstänkt" objekt på Wikidata, så skrivs interwiki-länkar av den "gamla typen" in i artiklarna. Det leder normalt till att robotar kopplar artiklar till rätt objekt mycket snabbt. De fall där programvaran inte kunnat göra denna koppling (även om det är uppenbart vid en manuell titt) så måste arbetet göras för hand. -- Innocent bystander 13 november 2015 kl. 12.12 (CET)
- Finnes det noen mulighet for å slå sammen Wikidata-element automatisk? Det er en lang rekke artikler som ikke har blitt koblet til eksisterende Wikidata-element, men det er kanskje bortkastet arbeid å rette opp idette manuelt? - 4ing (diskussion) 13 november 2015 kl. 12.04 (CET)
Mer allmänt om WD-koppling: I början jobbade jag ganska mycket med att försöka hitta WD-kopplingar till artiklar med olika metoder, se några diskussioner här ovan. Men det blev alldeles för många falska positiva. Därför använder boten nu en mycket konservativ algoritm för wd-koppling, som missar många kopplingar men inte skapar många felaktiga. Lsj (diskussion) 13 november 2015 kl. 15.19 (CET)
- Jag har slagit ihop ett titalls Wikidata-dubletter, men det finns många hundra. - 4ing (diskussion) 15 november 2015 kl. 22.46 (CET)
- Säkerligen. Men bättre med saknade kopplingar än felaktiga kopplingar. Lsj (diskussion) 16 november 2015 kl. 22.38 (CET)
Utposter i Antarktis har blivit uppgraderat til Universitet och högskolor (se Kategori:Utposter i Antarktis och Kategori:Universitet och högskolor i Östantarktis. - 4ing (diskussion) 15 november 2015 kl. 22.47 (CET)
- Skulle gå att flytta dem till utpostkategorin. Det är fler som har invändningar mot universiteten. Lsj (diskussion) 16 november 2015 kl. 22.38 (CET)
Det ser ut for at plasser som er oppført på kommaform i GeoNames (eks. Atkinson, Mount) har blitt navngitt på parentesform (Atkinson (berg)). Bør disse flyttes (til enten Mount Atkinson eller Atkinsonberget)? Må det i så fall gjøres manuelt? - 4ing (diskussion) 16 november 2015 kl. 14.54 (CET)
- Det får nog göras manuellt. Finns för många namnformer med komma där vi inte vill göra om namnet med bot, t.ex. Solitario, islote (Bahía Margarit. Lsj (diskussion) 16 november 2015 kl. 22.38 (CET)
Homonymer
[redigera wikitext]Sant Julià de Lòria (olika betydelser) är en av anomalierna. Den säger att det finns en parroquia (eller dyl) (församling, kommun el dyl) och en parroquiahuvudort med detta namn. Det är nog sant, för på kartorna ser man tydligt att det finns en ort som täcker en mindre delmängd av kommunens yta. Det fanns en artikel om församlingen. Lsjbot has skapat en "dublett" om orten (PPLA) men inte om kommunen. Jag skulle vilja att Lsjbot i denna situation också skapar sin artikel om kommunen. Denna önskan bygger på uppfattningen att eftersom Lsjbot har "signalerat" både kommun och ort i grensidan så har den initierat skapande av de två artiklarna och att konkurrensen om namnet förhindrade skapandet av en av dem. Jag vet inte hur många stubbar vi går miste om på grund av detta, inte heller hur mycket programmeringsarbete som skulle behövas. Eventuellt är det inte värt arbetet. --Ettrig (diskussion) 12 november 2015 kl. 08.47 (CET)
- Tror det som blockerar är att boten undviker att skapa dubletter till dubletterna. Om boten "vill" skapa Användare:Lsjbot/Dubletter/Sant Julià de Lòria men märker att den artikeln redan finns, så skapar den inte en till. Detta för att undvika att multipla dublettartiklar skapas om jag kör samma land flera gånger. Lsj (diskussion) 12 november 2015 kl. 09.49 (CET)
- Detta skulle ganska enkelt gå att lösa genom att släppa loss skapande av "dublettdubletter": Användare:Lsjbot/Dubletter/Sant Julià de Lòria 2 etc. Men då blir det ett antal falska dubletter som kostar arbete att städa bort. Med lite mer programmeringsmöda skulle det gå att kolla om en befintlig dublettartikel verkligen syftar på samma plats som den som boten "vill" skapa. Hur angeläget är det? Lsj (diskussion) 12 november 2015 kl. 11.39 (CET)
- För varje stub som jag ser att vi missat känner jag lite sorg, för de är mycket bra. Men det ser också ut som om Lsjbot kommer att skapa uppstädningsarbete som kommer att räcka i flera år. Så det är nog bäst att försöka undvara de här. --Ettrig (diskussion) 12 november 2015 kl. 12.11 (CET)
Justera koordinatfel?
[redigera wikitext]Det är inte ovanligt med små koordinatfel i GeoNames. Oftast rör det sig om koordinater som är avrundade till hela minuter, vilket ger positionsfel på upp till någon kilometer. För berg skulle boten i vissa fall kunna korrigera koordinaten. T.ex. Gjeita har en högsta punkt i närheten 1 km bort, som sannolikt är bergstoppens riktiga position - se satellitbild. Boten skulle kunna flytta artikelns koordinater till den högsta punktens. Samtidigt finns en viss risk för fel om två bergstoppar ligger mycket tätt, men boten kan kolla om det finns en annan bergstopp i GeoNames i närheten. Är detta något som bör göras? Lsj (diskussion) 12 november 2015 kl. 23.08 (CET)
- Det kan samtidigt ju vara en bergstopp som inte inkluderats i Geonames. Går det att enkelt avgöra när en koordinat ser avrundad ut? -- Innocent bystander 13 november 2015 kl. 09.04 (CET)
- Dersom koordinatene er oppgitt i hele minutter tyder det på at de er avrundet eller at eksakte koordinater ikke er registrert. Jeg tror imidlertid det vil være stor sannsynlighet for å feile ved å korrigere koordinatene (om det er original forskning er en annen diskusjon). Kanskje en mellomløsning kan være å legge det inn som en kommentar - med forslag til korrigerte koordinater? - 4ing (diskussion) 13 november 2015 kl. 09.23 (CET)
- Vil boten også være i stand til å justere bergshöjder? Et konkret eksempel er Sør-Rondane i Dronning Maud Land, der høyden oppgis å være 3400 möh. Problemet er at høyeste fjell i DML er Jøkulkyrkja (3148 möh). Blant fjellene/fjellgruppene i Sør-Rondane finnes Isachsen Mountains, der GNIS oppgir 3425 möh og norske myndigheter (og GeoNames) 2750 möh (begge høyder ser ut som circaverdier). Blant Isahcsenfjella oppgir GeoNames høyden på toppene Devold Peak (3280 möh, feilaktige koordinater) og Kjelbotn Peak (3210 möh). Alt tyder altså på at høydeangivelsene er unøyaktige og/eller feilaktige. - 4ing (diskussion) 13 november 2015 kl. 10.02 (CET)
- Boten fixar redan höjduppgifter ur DEM-data för berg som saknar höjduppgift i GeoNames. Ganska enkelt att dubbelkolla GeoNames-höjden även när sådan finns, och lägga in en not om den inte alls matchar DEM-höjden. Lsj (diskussion) 13 november 2015 kl. 15.13 (CET)
- Vil boten også være i stand til å justere bergshöjder? Et konkret eksempel er Sør-Rondane i Dronning Maud Land, der høyden oppgis å være 3400 möh. Problemet er at høyeste fjell i DML er Jøkulkyrkja (3148 möh). Blant fjellene/fjellgruppene i Sør-Rondane finnes Isachsen Mountains, der GNIS oppgir 3425 möh og norske myndigheter (og GeoNames) 2750 möh (begge høyder ser ut som circaverdier). Blant Isahcsenfjella oppgir GeoNames høyden på toppene Devold Peak (3280 möh, feilaktige koordinater) og Kjelbotn Peak (3210 möh). Alt tyder altså på at høydeangivelsene er unøyaktige og/eller feilaktige. - 4ing (diskussion) 13 november 2015 kl. 10.02 (CET)
- Dersom koordinatene er oppgitt i hele minutter tyder det på at de er avrundet eller at eksakte koordinater ikke er registrert. Jeg tror imidlertid det vil være stor sannsynlighet for å feile ved å korrigere koordinatene (om det er original forskning er en annen diskusjon). Kanskje en mellomløsning kan være å legge det inn som en kommentar - med forslag til korrigerte koordinater? - 4ing (diskussion) 13 november 2015 kl. 09.23 (CET)
- Jag har problem med utrikiskan (hade föredragit engelska) men till Lsj: Jag är för. Litar på att du gör kvalitetskontroll som du brukar. --افيراتير (diskussion) 13 november 2015 kl. 12.16 (CET)
- Kategori:Artiklar med robotjusterad position Lsj (diskussion) 14 november 2015 kl. 13.30 (CET)
- Nanometerpresisjon er kanskje ikke nødvendig (se Arntzenrustene)? - 4ing (diskussion) 15 november 2015 kl. 22.53 (CET)
- Hmmm, är det coordinates_note som gör att det ser lite annorlunda ut nu? -- Innocent bystander 16 november 2015 kl. 07.20 (CET)
- Ja, coordinate_note dyker upp lite konstigt i mallen. Men en sådan här justering bör definitivt ha en not. Har du bättre förslag på hur det kan göras? Kan hålla med 4ing om att koordinaterna kunde avrundas lite. Får fixa det till nästa körning. Lsj (diskussion) 16 november 2015 kl. 10.24 (CET)
- Det är parameter 13 i
{{Geobox2 coor}}
som lägger ut denna parameter. Vet inte om det finns utrymme för "tillsnyggning" här. - @Lsj: Vad sägs om detta istället? -- Innocent bystander 16 november 2015 kl. 13.34 (CET)
- Bra idé! Tänkte inte på att det kunde funka inne i mallen. Lsj (diskussion) 16 november 2015 kl. 14.27 (CET)
- Det är parameter 13 i
- Ja, coordinate_note dyker upp lite konstigt i mallen. Men en sådan här justering bör definitivt ha en not. Har du bättre förslag på hur det kan göras? Kan hålla med 4ing om att koordinaterna kunde avrundas lite. Får fixa det till nästa körning. Lsj (diskussion) 16 november 2015 kl. 10.24 (CET)
- Hmmm, är det coordinates_note som gör att det ser lite annorlunda ut nu? -- Innocent bystander 16 november 2015 kl. 07.20 (CET)
- Nanometerpresisjon er kanskje ikke nødvendig (se Arntzenrustene)? - 4ing (diskussion) 15 november 2015 kl. 22.53 (CET)
- Kategori:Artiklar med robotjusterad position Lsj (diskussion) 14 november 2015 kl. 13.30 (CET)
Rödlänkar
[redigera wikitext]Användare:Lsjbot/Dubletter/Peter I Øy innehåller flera rödlänkar. Hur kommer det sig? Kanske är det bara min förväntan som är felaktig. Den var att när Lsjbot förtecknar geografiska företeelser i grannskapet så handlar det om objekt som den hittat i GeoNames och "avser" att göra artiklar om. De här har uppenbarligen inte blivit gjorda. Om den princip som jag föreställde mig inte finns: Skulle det vara en bra idé att begränsa denna lista till objekt som Lsjbot "tycker" är värda en artikel? --Ettrig (diskussion) 13 november 2015 kl. 16.01 (CET)
- Principen är precis den du väntar dig. Men en botkörning av ett stort land kan ta flera dagar, och under de dagarna är en del länkar röda. Runt Antarktis har det dessutom varit en hel del komplikationer (se diskussioner ovan) så jag har startat om flera gånger. Körning av Antarktis pågår fortfarande i skrivande stund. När boten blir klar med ett land kungörs detta i Användare:Lsjbot/Statistik längst ner. Lsj (diskussion) 13 november 2015 kl. 16.14 (CET)
- Nu är Antarktis klart, och ingenting är längre rödlänkat. Lsj (diskussion) 16 november 2015 kl. 20.54 (CET)
Referensfel
[redigera wikitext]Den här texten Referensfel: /<ref/>-tagg med namn "vp", definierad i /<references/> används inte tidigare i texten. ser jag i Plogskaftet Nunataks. --Ettrig (diskussion) 14 november 2015 kl. 16.42 (CET)
- Tack. Ett litet misstag för platstypen "nunataker", som boten inte har stött på förrän i Antarktis. Lsj (diskussion) 14 november 2015 kl. 17.42 (CET)
- En liknande typ av referensfel finns i Carpenter Island (ö i Antarktis). -- Innocent bystander 16 november 2015 kl. 09.00 (CET)
- Här finns en bugg. Rubriken "Kommentarer" är också fel. Förstår dock inte varför den bara drabbar vissa öar, inte alla. Lsj (diskussion) 16 november 2015 kl. 10.09 (CET)
- Ok, har hittat felet. Lsj (diskussion) 16 november 2015 kl. 20.53 (CET)
- Här finns en bugg. Rubriken "Kommentarer" är också fel. Förstår dock inte varför den bara drabbar vissa öar, inte alla. Lsj (diskussion) 16 november 2015 kl. 10.09 (CET)
- En liknande typ av referensfel finns i Carpenter Island (ö i Antarktis). -- Innocent bystander 16 november 2015 kl. 09.00 (CET)
Borttappade öar
[redigera wikitext]Carpenter Island listar två öar i Maryland. Koordinaterna ligger mycket nära varandra, så de syftar sannolikt på samma sak. Men det var inte det jag tänkte på, fel i källorna kan vi inte skämma boten för.
Artikeln på enwp beskriver ön som att den har erroderat bort. Satelitbilderna säger inte emot detta. Är detta en egen kategori på Geonames? -- Innocent bystander 16 november 2015 kl. 09.09 (CET)
- Geonames innehåller två Carpenter Island med positioner ett par hundra meter från varann (samma inom grensidornas avrundning). Den ena betecknas som "historical" men den andra ser ut som en vanlig ö. På Google Maps står det "Carpenter Island" skrivet på rätt plats, men ingen ö syns. Lsj (diskussion) 16 november 2015 kl. 10.20 (CET)
- Kanske man ska radera posten (på Geonames) om den "levande" ön där, då den sannolikt är en dublett av den bortspolade. Enwp nämner den inte och den är uppenbarligen i Stealth-mode när man tittar på satellitbilderna. -- Innocent bystander 16 november 2015 kl. 14.32 (CET)
Ovanliga namn på omdirigeringar m.m.
[redigera wikitext]Dessa har skapats de senaste dagarna.
Följande sex omdirigeringar har grammatiskt felaktiga namn: Croker , pasaje, Los Pozos, montes,nunataks, Melville, cabo,pico, Montura, isla (Is.Orcadas del Sur, Solitario, islote (Bahía Margarit och Solitario, islote (Bahia Margarit.
Artikeln Detaille Island (Base W) /Brit./ och följande 17 omdirigeringar har ovanliga namn med land mellan snedstreck (men de kanske ska heta så?): Port Martin /Fr./, Casey /Austral./, Davis /Austral./, Dumont d'Urville /Fr./, Arctowski /Pol./, Leningradskaja, nauchnaja stancija /SSSR/, Mawson /Austral./, McMurdo /USA/, Mirnyj, nauchnaja stancija /SSSR/, Mizuho /Nip./, Novolazarevskaja, nauchnaja stancija /SSSR/, Palmer /USA/, Rothera /Brit./, Scott Base /N.Z./, Syowa /Nip./, Lewis Island /Austral/ och Faraday /Brit./.
Omdirigeringen Faraday /Brit./ omdirigerar till Faraday som i sin tur omdirigerar till Michael Faraday. Svensson1 (diskussion) 16 november 2015 kl. 22.02 (CET)
- Dessa märkliga namnformer återfinns i källan precis så som de återges. Inte helt lätt att med bot känna igen en orimlig namnform. Från själva artikelnamnet skalar den bort sådant som kan vara särskiljningsled, som Croker , pasaje (och ersätter med egna särskiljningar vid behov), men omdirigeringar tas i befintligt skick. Faraday verkar dock skumt. Lsj (diskussion) 16 november 2015 kl. 22.33 (CET)
House, Lake
[redigera wikitext]House, Lake förstår jag inte syftet med. Skulle begära radera om den var mänskligt skapad. Maundwiki (diskussion) 3 april 2016 kl. 19.42 (CEST)
Bulgarien
[redigera wikitext][19] allt boten skapade ska inte till denna artikel. Troligen bätrre att inte skapa om det inte blir rätt. Mycket tveksam till namn som inte är svenska, bulgariska eller något tidigare spåk i området. Borde falla under att wikipedia inte är en ordbok. Maundwiki (diskussion) 21 april 2016 kl. 18.44 (CEST)
- För många omdirigeringar gör ingen skada, så dem ska vi alltid vara generösa med. ⛐Boⅰⅵᴇ (🖉) 21 april 2016 kl. 19.35 (CEST)
- Ja om de pekar till en artikel som förklarar. Har du tittat? Kolla Narodna Republika Bŭlgariya, kanske samma som Narodna republika Balgariya? Maundwiki (diskussion) 22 april 2016 kl. 01.51 (CEST)
- Se tidigare diskussion här. Boten följer konsensus från den diskussionen. Misstänkter att många av dessa omdirigeringar till Bulgarien inte är språkmärkta i källan. Lsj (diskussion) 21 april 2016 kl. 20.13 (CEST)
- Betyder det att en del av dessa inte ska finnas enligt din sammanställning? Det som är intresant är att Bǎlgarija (titta i artikeln) inte finns som en omdirigering. Република България ska kanske till Folkrepubliken Bulgarien istället. "Народна република България" är namnet på den interwikilänkade artikeln. Din sammanställning är bra förutom för "internationell namnform" som jag tolkar som engelska och det blir "ordbok". Google hittar den engelska varianten och sedan fungerar interwiki. Det handlar om hur bra källan är. Jag tror att coden i boten ska vara konservativ. Maundwiki (diskussion) 22 april 2016 kl. 01.51 (CEST)
Okänt objekt
[redigera wikitext]Informerar för säkerhets skull om förgreningssidan NAME NOT KNOWN. K9re11 (diskussion) 17 november 2015 kl. 09.07 (CET)
- Hmmm... den var oväntad. Det är väl lika bra att bara hoppa över de här platserna. Lsj (diskussion) 17 november 2015 kl. 09.19 (CET)
- Hört ngn skröna om en plats med namnet Haddingen, att infödingarna, när kartmakarna skulle ha frågat: "Va heter den där platsen? Vad har den för namn?". Så var svaret: "Haddingen" (dvs "hade inge namn") Se också en:Nome, Alaska#Etymology. -- Innocent bystander 17 november 2015 kl. 11.40 (CET)
Åboland-Turunmaa 2
[redigera wikitext]På förgreningssidan Granholm finns en länk till Granholm (ö i Finland, Egentliga Finland, Åboland-Turunmaa, lat 59,97, long 21,75). Att Åboland-Turunmaa används är inte önskvärt, men jag förstår att alla sådana saker kan vara svåra att åtgärda. Dock bör sådant inte förekomma i artikelnamn. K9re11 (diskussion) 17 november 2015 kl. 13.25 (CET)
- Ska finna ett sätt att åtgärda detta innan boten börjar med Finland på allvar. Lsj (diskussion) 5 december 2015 kl. 17.43 (CET)
Monument och sådant
[redigera wikitext]Jag upptäckte sidan Kočo Racin, om ett monument i Makedonien. Eftersom Lsjbot (förståeligt nog) inte kan berätta någonting om vad monumentet rests för, vem har gjort det, när, utan enbart geografisk information, vore det bättre att skippa sådana artiklar? K9re11 (diskussion) 17 november 2015 kl. 17.19 (CET)
- Just här kan vi nog gissa vad det är för ett typ av monument. (Jag har hittat flera minnesmonument över en poet med detta namn.) Men jag är böjd att hålla med. Finns det ett Geonames-ID på WD så låt gå/stå, men annars kommer det att främst förvilla. -- Innocent bystander 17 november 2015 kl. 18.00 (CET)
Bokstavsordning
[redigera wikitext]Ska vi tolka detta som att du nu tar länderna i bokstavsordning enligt ngn ISO-kod? -- Innocent bystander 18 november 2015 kl. 08.22 (CET)
- I stort sett, ja. Men jag kommer att göra undantag. Kör svenska och cebuano ur fas, så just nu kör jag A på svenska och B på cebuano, sedan skiftar jag ordning. Tänker också hoppa över de allra största länderna tills koden är mer intrimmad och självgående. Kan också hända att jag låter dagsaktuella länder gå före i flödet. Burundi t.ex. fruktar jag snart kommer i nyheterna på allvar, så det körde jag i förra omgången. Har också funderat på att köra Syrien snart. Lsj (diskussion) 18 november 2015 kl. 08.53 (CET)
- Syrien vore ju väldigt spännande. Kanske kan ta Libanon före, mycket mindre och nära associerat till Syriens problem. --Ettrig (diskussion) 18 november 2015 kl. 10.07 (CET)
- Kör både Libanon och Syrien nu. Lsj (diskussion) 26 november 2015 kl. 18.14 (CET)
- Mycket intressant projekt, och du har mitt fulla stöd (vilket du redan vet). Jag undrar om du har en undersida där du skrivit upp ordningen som du gör länderna, och framför allt där man kan se vilka länder som är klara eller pågående. Detta mest för att det är intressant att se utvecklingen och vilka länder som man kanske skulle kunna peppa folk att läsa på om och förbättra artiklar. (exempelvis känner jag många chilenare och då kanske jag kunde få någon att tycka det är kul att förbättra artiklar från deras hemområde när det finns en grund att utgå ifrån). MVH Adville (diskussion) 17 januari 2016 kl. 20.40 (CET)
- Användare:Lsjbot/Statistik loggar vad boten håller på med. Där går att utläsa vilka länder som är klara och pågående. I stort sett tar jag länderna i bokstavsordning efter ISO-kod, med ett och annat undantag. Chile (kod CL) står på tur ganska direkt när jag är klar med Kanada om sådär två veckor. Lsj (diskussion) 17 januari 2016 kl. 20.52 (CET)
- Tack. Det skall jag pusha för då :-) Adville (diskussion) 17 januari 2016 kl. 21.06 (CET)
- Användare:Lsjbot/Statistik loggar vad boten håller på med. Där går att utläsa vilka länder som är klara och pågående. I stort sett tar jag länderna i bokstavsordning efter ISO-kod, med ett och annat undantag. Chile (kod CL) står på tur ganska direkt när jag är klar med Kanada om sådär två veckor. Lsj (diskussion) 17 januari 2016 kl. 20.52 (CET)
- Mycket intressant projekt, och du har mitt fulla stöd (vilket du redan vet). Jag undrar om du har en undersida där du skrivit upp ordningen som du gör länderna, och framför allt där man kan se vilka länder som är klara eller pågående. Detta mest för att det är intressant att se utvecklingen och vilka länder som man kanske skulle kunna peppa folk att läsa på om och förbättra artiklar. (exempelvis känner jag många chilenare och då kanske jag kunde få någon att tycka det är kul att förbättra artiklar från deras hemområde när det finns en grund att utgå ifrån). MVH Adville (diskussion) 17 januari 2016 kl. 20.40 (CET)
- Kör både Libanon och Syrien nu. Lsj (diskussion) 26 november 2015 kl. 18.14 (CET)
- Syrien vore ju väldigt spännande. Kanske kan ta Libanon före, mycket mindre och nära associerat till Syriens problem. --Ettrig (diskussion) 18 november 2015 kl. 10.07 (CET)
Kanske inte dublett
[redigera wikitext]Användare:Lsjbot/Anomalier säger att Sayda (olika betydelser) innehåller två "platser" med samma koordinater. Jag misstänker att den då syftar på en kommun och en ort i Tyskland. Om så är fallet vore det önskvärt att Lsjbot inte accepterar att en kommun och en ort kan finnas på samma plats utan att det betraktas som konstigt. --Ettrig (diskussion) 26 november 2015 kl. 12.27 (CET)
- Sådana kan vara ganska knepiga att reda ut vad gäller interwiki, så kanske inte helt fel att det ändå rapporteras. -- Innocent bystander 26 november 2015 kl. 12.52 (CET)
- Det här har vi diskuterat tidigare, någonstans här ovan. Kommun och tätort är olika begrepp, och de har separata poster i GeoNames. Det kan i vissa fall vara lämpligt att de har samma wikipediaartikel, men inte alls självklart att göra så generellt och inte praxis på svwp (Stockholm och Stockholms kommun är olika artiklar). Interwiki och wikidata är totalt förvirrat på det här området. Det är inget som jag tänker ens försöka avgöra med bot. Därför skapas nu båda, och flaggas som en anomali för framtida handpåläggning. Lsj (diskussion) 26 november 2015 kl. 14.23 (CET)
- Vi är alltså överens om att kommun och ort är helt olika saker? Motivet för att flagga dessa par som anomalier är att andra kan tycka att de är samma objekt? För mig låter det som en egen kategori. --Ettrig (diskussion) 26 november 2015 kl. 15.05 (CET)
- Ok, bra att vi är överens, jag kanske missuppfattade dig ovan. Men flaggningen behövs ändå, eftersom iw/wd-kopplingen behöver handkollas. I grensidorna är det också svårt att hålla isär olika typer av synbara dublettplatser - enklare och säkrare att flagga på samma sätt för alla sorters par av platser med samma namn och (nästan) samma koordinater. Lsj (diskussion) 26 november 2015 kl. 15.13 (CET)
- Vi är alltså överens om att kommun och ort är helt olika saker? Motivet för att flagga dessa par som anomalier är att andra kan tycka att de är samma objekt? För mig låter det som en egen kategori. --Ettrig (diskussion) 26 november 2015 kl. 15.05 (CET)
- Det här har vi diskuterat tidigare, någonstans här ovan. Kommun och tätort är olika begrepp, och de har separata poster i GeoNames. Det kan i vissa fall vara lämpligt att de har samma wikipediaartikel, men inte alls självklart att göra så generellt och inte praxis på svwp (Stockholm och Stockholms kommun är olika artiklar). Interwiki och wikidata är totalt förvirrat på det här området. Det är inget som jag tänker ens försöka avgöra med bot. Därför skapas nu båda, och flaggas som en anomali för framtida handpåläggning. Lsj (diskussion) 26 november 2015 kl. 14.23 (CET)
Libanons guvernement
[redigera wikitext]Ett litet observandum: Lsjbot ser inte ut att benämna de libanesiska guvernementen på samma sätt som Mall:Libanons guvernement gör. Finns alltså viss risk att det är namnkonflikter mellan befintliga och nya artiklar. -- Innocent bystander 28 november 2015 kl. 11.47 (CET)
- Boten har bara skapat artiklar om de guvernement som är rödlänkade i mallen. Enklaste åtgärden torde vara att ändra i mallen. Jag tar hänsyn till befintliga artiklar i botarbetet, men tar inte hänsyn till befintliga rödlänkar. Finns inget vettigt sätt att ens hitta dessa rödlänkar på ett systematiskt sätt, utan oskälig arbetsinsats. Lsj (diskussion) 28 november 2015 kl. 15.21 (CET)
- Inget länkar nu längre till Baalbek-Hermel (guvernment). -- Innocent bystander 28 november 2015 kl. 17.22 (CET)
- För Aakkâr fanns åtminstone två olika versioner. De två är nu fixade. -- Innocent bystander 28 november 2015 kl. 17.27 (CET)
- Beqaa fixad. -- Innocent bystander 28 november 2015 kl. 17.30 (CET)
- Södra och Norra Libanon fixade.
- @Lsj: Om ingen separat artikel kommer att skapas för Beirut som guvernement, så är det nu Fixat Huruvida Beiruts guvernement är en egen enhet, skild från staden/kommunen har jag ingen aning om. -- Innocent bystander 28 november 2015 kl. 17.39 (CET)
- Beqaa fixad. -- Innocent bystander 28 november 2015 kl. 17.30 (CET)
- För Aakkâr fanns åtminstone två olika versioner. De två är nu fixade. -- Innocent bystander 28 november 2015 kl. 17.27 (CET)
- Inget länkar nu längre till Baalbek-Hermel (guvernment). -- Innocent bystander 28 november 2015 kl. 17.22 (CET)
Milstolparnas placering
[redigera wikitext]Detta är smågnäll av mycket ringa betydelse: Det tycks mig som att Lsjbot skriver milstolparna när de uppnås och sammanfattande statistik när ett land har färdigbehandlats. som en följd av detta kommer milstolpen under rubriken för landet före det land som "platsen" ligger i. Det gör ju ingen skada, men blir lite konstigt när man tittar på uppgifter om ett land och där hittar en milstolpe och klickar på milstolpsartikeln och hamnar i ett annat land. --Ettrig (diskussion) 29 november 2015 kl. 18.11 (CET)
- Ja, så blir det. Boten fyller i statistikartikeln löpande, och lägger in nyheter längst ner. Att få det i annan ordning i artikeln skulle vara allmänt krångligt. Enda enkla sättet att göra det vore att helt vända på ordningen i statistikartikeln så att det senaste läggs först i stället för sist. Lsj (diskussion) 29 november 2015 kl. 18.31 (CET)
- Dristar mig ändå till ett förslag: Skriv ut rubriken som en del av påbörjandet av behandlingen av ett land. Då kommer milstolparna under rubriken för det land som milstolpsartikelns ämne ligger i. --Ettrig (diskussion) 2 december 2015 kl. 10.27 (CET)
- Ja, det var ett bra förslag. Tack! Lsj (diskussion) 2 december 2015 kl. 10.52 (CET)
- Dristar mig ändå till ett förslag: Skriv ut rubriken som en del av påbörjandet av behandlingen av ett land. Då kommer milstolparna under rubriken för det land som milstolpsartikelns ämne ligger i. --Ettrig (diskussion) 2 december 2015 kl. 10.27 (CET)
Isformationer
[redigera wikitext]Vilka andra typer av landformer än Glaciärer kategoriserar du som "Isformationer"? -- Innocent bystander 29 november 2015 kl. 20.35 (CET)
- Iskalotter (kod CAPG). Lsj (diskussion) 29 november 2015 kl. 21.51 (CET)
Wikilänkar till nyskapade artiklar
[redigera wikitext]Till Tortue finns dessa [20] wikilänkar. Den enda som är rätt är omdirigeringen. De andra ska troligen till något i Tortuga härledning från en:Tortue Island kanske Tortuga, Haiti. Boten kan inte kolla detta. Fråga: Hur flaggar boten när det finns wikilänkar till nyskapade artiklar för senare mänsklig kontroll? Maundwiki (diskussion) 3 december 2015 kl. 18.05 (CET)
- Idag flaggas de inte, jag hade inte tänkt på att det kunde behövas. Tack för att du uppmärksammar det. Det går att göra utan alltför mycket besvär, men är enklast att göra i efterhand. Bör dock filtrera så att den inte flaggar när de botskapade artiklarna länkar till varann, eftersom dessa länkar både är frekventa och bör vara korrekta. Lsj (diskussion) 4 december 2015 kl. 14.45 (CET)
- Om många ska kunna fixa bör artikeln vara flaggad inte finnas i en lista. Dold kategori "kolla wikilänkar" som kan tas bort av den som kollar. Maundwiki (diskussion) 4 december 2015 kl. 17.26 (CET)
- Ok. Man kan rimligen anta att artiklar med särskiljningsled inte behöver kollas, eftersom det är osannolikt att en felaktig länk händelsevis har rätt särskiljningsled. Lsj (diskussion) 4 december 2015 kl. 22.51 (CET)
- Finns ett särskiljningsled är det troligen 100%? rätt. Utryckte mig kanske luddigt innan. Det är den nya botskapade artikeln som ska ha kategorin. Maundwiki (diskussion) 5 december 2015 kl. 00.19 (CET)
- Javisst, det är så jag menar. Om den nya botskapade artikeln heter något i stil med Canal Gran (vattendrag i La Massana, lat 42,54, long 1,50) så är det ytterst osannolikt att någon länkat till det namnet av misstag. Behöver knappast kollas. Kategorin finns nu och heter Kategori:Kontrollbehov inkommande wikilänkar, men filtret är inte färdigtrimmat ännu. Lsj (diskussion) 5 december 2015 kl. 12.38 (CET)
- Finns ett särskiljningsled är det troligen 100%? rätt. Utryckte mig kanske luddigt innan. Det är den nya botskapade artikeln som ska ha kategorin. Maundwiki (diskussion) 5 december 2015 kl. 00.19 (CET)
- Ok. Man kan rimligen anta att artiklar med särskiljningsled inte behöver kollas, eftersom det är osannolikt att en felaktig länk händelsevis har rätt särskiljningsled. Lsj (diskussion) 4 december 2015 kl. 22.51 (CET)
- Om många ska kunna fixa bör artikeln vara flaggad inte finnas i en lista. Dold kategori "kolla wikilänkar" som kan tas bort av den som kollar. Maundwiki (diskussion) 4 december 2015 kl. 17.26 (CET)
Kategorin ska gå att använda nu. Kommer att ta ett litet tag för boten att gå igenom alla tusentals artiklar och gör kategorin komplett, men kolla gärna om det ser rätt ut som finns där nu. Storleksordning 1% av artiklarna blir flaggade. Lsj (diskussion) 5 december 2015 kl. 17.58 (CET)
- Ser bra ut, Abur och Abara har wikilänkar som behöver ändras. Jag antar att det bör läggas till en röd länk. 1% 20000? P.S. Samma bör göras för manuella nya sidor. Maundwiki (diskussion) 9 december 2015 kl. 17.28 (CET)
- Kommer Darwin Island en botskapad omdirigering i kategorin? Från Culpeper "Culpepper Island, annat namn på Darwin Island i Galapagosöarna, Ecuador." Maundwiki (diskussion) 19 december 2015 kl. 23.23 (CET)
- Jag har inte gått igenom omdirigeringarna, bara själva artiklarna. Borde man kanske ta omdirigeringarna också? För övrigt kör jag den här kategoriseringen månadsvis, så decembers artikelskörd blir genomgången efter nyår. Lsj (diskussion) 20 december 2015 kl. 09.33 (CET)
- Jag tror ny förgreningssidor som inte är särskiljande från en redan existerande förgreningssida bör ingå i kategorin, som t.ex. Darwin Island. Maundwiki (diskussion) 20 december 2015 kl. 13.47 (CET)
- Ok, det kan jag ordna. Blir lite pyssligt dock, jag kommer inte att hinna med det innan jul. Lsj (diskussion) 20 december 2015 kl. 14.04 (CET)
- Ingen fara jag har några månader kvar innan jag skulle kunna börja och vet inte om det blir mitt nästa projekt. Maundwiki (diskussion) 20 december 2015 kl. 14.17 (CET)
- Någonting jag vill göra samtidigt är att fixa en åtgärdskategori som samlar alla de botskapade omdirigeringarna. Just nu har jag ingen koll alls på dem. Lsj (diskussion) 20 december 2015 kl. 15.11 (CET)
- Ja speciellt de som inte har bokstavskombinationen i målartikeln som inte borde ske med botskapade. Har funderat på det (utan bokstavskombination i målartikeln) för nuvarande omdirigeringar. Maundwiki (diskussion) 20 december 2015 kl. 16.01 (CET)
- Det är något som går att kolla (och flagga) samtidigt. Normalt ska de flesta ha det, huvudregeln är att de namn som räknas upp som alternativnamn i geoboxen också blir omdirigeringar. Men boten skapar ytterligare några kategorier omdirigeringar, bland annat får namn med diakritiska tecken en omdirigering från samma namn utan diakriter utan att den diakritfria namnformen nödvändigtvis nämns i artikeltexten. Det uppfattar jag som praxis på svwp, och har svårt att se det som kontroversiellt. Samma sak med transkriberingsvarianter. Finns också en del omdirigeringar som jag skapar av mer tekniska skäl, t.ex. upptäckte jag häromdagen ett fel i särskiljningsleden för ett antal belgiska kommuner. Då lät jag boten skapa omdirigeringar från de felaktiga till de korrekta särskiljningarna, tills jag hunnit kolla om länkar till de felaktiga kan ligga kvar i någon grensida. Sådana nämns inte i artikeltexten. Lsj (diskussion) 20 december 2015 kl. 16.28 (CET)
- Ja speciellt de som inte har bokstavskombinationen i målartikeln som inte borde ske med botskapade. Har funderat på det (utan bokstavskombination i målartikeln) för nuvarande omdirigeringar. Maundwiki (diskussion) 20 december 2015 kl. 16.01 (CET)
- Någonting jag vill göra samtidigt är att fixa en åtgärdskategori som samlar alla de botskapade omdirigeringarna. Just nu har jag ingen koll alls på dem. Lsj (diskussion) 20 december 2015 kl. 15.11 (CET)
- Ingen fara jag har några månader kvar innan jag skulle kunna börja och vet inte om det blir mitt nästa projekt. Maundwiki (diskussion) 20 december 2015 kl. 14.17 (CET)
- Ok, det kan jag ordna. Blir lite pyssligt dock, jag kommer inte att hinna med det innan jul. Lsj (diskussion) 20 december 2015 kl. 14.04 (CET)
- Jag tror ny förgreningssidor som inte är särskiljande från en redan existerande förgreningssida bör ingå i kategorin, som t.ex. Darwin Island. Maundwiki (diskussion) 20 december 2015 kl. 13.47 (CET)
- Jag har inte gått igenom omdirigeringarna, bara själva artiklarna. Borde man kanske ta omdirigeringarna också? För övrigt kör jag den här kategoriseringen månadsvis, så decembers artikelskörd blir genomgången efter nyår. Lsj (diskussion) 20 december 2015 kl. 09.33 (CET)
- Kommer Darwin Island en botskapad omdirigering i kategorin? Från Culpeper "Culpepper Island, annat namn på Darwin Island i Galapagosöarna, Ecuador." Maundwiki (diskussion) 19 december 2015 kl. 23.23 (CET)
Har du slutat att köra? Newcastle Airport skapad i december har inte Kategori:Kontrollbehov inkommande wikilänkar. Maundwiki (diskussion) 18 mars 2016 kl. 16.00 (CET)
- Tack för du påminde mig. Jag hade glömt att jag behövde göra den här körningen en gång i månaden. Lsj (diskussion) 19 mars 2016 kl. 10.29 (CET)
- @Maundwiki: I det närmaste klart nu. Kategori:Kontrollbehov inkommande wikilänkar har fyllts på med sådär 10 000 artiklar. Lsj (diskussion) 31 mars 2016 kl. 10.12 (CEST)
- Oj, här finns mycket att städa! Jag tittade bara på den första artikeln i kategorin, Aaron Hill. Den har fyra inkommande länkar och samtliga har blivit fel eftersom de avser olika personer och inte platsen med samma namn. --Larske (diskussion) 31 mars 2016 kl. 10.25 (CEST)
- Volumen blir stor med botar. Jag tror att "problemet" finns med mänskliga nyskapade artiklar också. För mänskliga artiklar skulle de troligen "flaggas" till skribenten när artikeln sparas första gången. Skribenten kan klicka "kollat" eller "lägg till" till kategorin "kolla inkommande wikilänkar" eller liknande. Handlar om att låta programvara hjälpa skribenterna och artikelkollarna med "housekeeping". Själv kommer jag inte till dessa innan senare i år men jag tror att det är bättre att skapa listan straxt efter att artikeln är gjord. Förhoppningsvis kollar skribenterna att det går "rätt" när de wikilänkar. Beträffande Aaron Hill bör det troligen bli en förgreningssida. Maundwiki (diskussion) 31 mars 2016 kl. 15.23 (CEST)
- Oj, här finns mycket att städa! Jag tittade bara på den första artikeln i kategorin, Aaron Hill. Den har fyra inkommande länkar och samtliga har blivit fel eftersom de avser olika personer och inte platsen med samma namn. --Larske (diskussion) 31 mars 2016 kl. 10.25 (CEST)
- @Maundwiki: I det närmaste klart nu. Kategori:Kontrollbehov inkommande wikilänkar har fyllts på med sådär 10 000 artiklar. Lsj (diskussion) 31 mars 2016 kl. 10.12 (CEST)
Nytt: Fixade [21] och [22] som länkade till Amparo skapad 30 december 2015 kl. 01.04. Borde den inte ha varit med? Maundwiki (diskussion) 7 april 2016 kl. 02.15 (CEST)
- Amparo fanns inte med eftersom jag bara gick igenom artiklarna, inte grensidorna. Borde jag kört grensidorna också? Lsj (diskussion) 7 april 2016 kl. 09.07 (CEST)
- Nej, mitt tankefel. Men jag har sökt efter ett verktyg som ger en lista av förgreningssidor med wikilänkar från artikelar, men inte diskussionssidor. Helst inte wikilänkar innan feta ordet (rubriken i texten) och inte i/efter se även. Kanske köras ett par gånger om året och troligen bäst med dold "kategori" i förgreningssidan så att efter att det är fixat kan den tas bort. Maundwiki (diskussion) 7 april 2016 kl. 16.24 (CEST)
- Har börjat att kolla till exempel Zaran, Zangana, Zanella. Om inte någon annan har varit inne och rättat utan att ta bort kategorin så borde "Användarerymden" uteslutas från att trigga mallen. I Zazou och om ingen har rättat eftersom vi måste anta att boten wikilänkar rätt och om inget annat än botskapade artiklar triggar mallen kan dessa artiklar också uteslutas från kategorin. (jag trodde koden hade detta) Jag kollade de fem artiklar som har Zazou och ingen av dessa hade ändringar för Zazou. Hur att göra med t.ex. Wikipedia:Projekt saknade artiklar/Z? Kanske ta med eftersom det inte är så många och en del i "Wikipedia:" bör kollas. Maundwiki (diskussion) 15 juni 2016 kl. 15.42 (CEST)
- Nej, mitt tankefel. Men jag har sökt efter ett verktyg som ger en lista av förgreningssidor med wikilänkar från artikelar, men inte diskussionssidor. Helst inte wikilänkar innan feta ordet (rubriken i texten) och inte i/efter se även. Kanske köras ett par gånger om året och troligen bäst med dold "kategori" i förgreningssidan så att efter att det är fixat kan den tas bort. Maundwiki (diskussion) 7 april 2016 kl. 16.24 (CEST)
Kategorisering av förgreningssidor
[redigera wikitext]Idag läggs de botskapade grensidorna bara i kategori Kategori:Robotskapade förgreningssidor, som blir en monsterkategori och inte särskilt användbar. Jag har funderat på ytterligare kategorisering, och det bästa jag kan komma på är att kategorisera grensidorna efter vilka länder som berörs: Kategori:Robotskapade Andorragrensidor etc. Grensidor med flera länder läggs då i flera kategorier. Detta är tekniskt enkelt och ger någorlunda överskådliga kategorier. Tankar om detta? Bättre förslag? Lsj (diskussion) 4 december 2015 kl. 14.50 (CET)
- Jag är i princip emot en uppdelning i fler klasser av grensidor. Frågan är vilket syfte dessa sidors kategorisering fyller?
” | den som läser en artikel att hitta andra artiklar inom samma område | „ |
– Wikipedia:Kategorier |
- Grensidor vill jag inte se som encyklopediska artiklar utan mer som ett ställe man "råkar" hamna när man länkat fel. De är inte oviktiga, då de fyller en inte oviktig funktion, men är ur mitt perspektiv inte en del av det egentliga uppslagsverket. Jag ser alltså egentligen inget omedelbart behov av att kategorisera dem alls. Att de trots detta ändå kategoriseras, är då ur min synvinkeln bara en lösning för att inte översvämma "Special:Okategoriserade sidor/artiklar".
- Ett alternativ jag stått i begrepp att föreslå, är att denna kategori dateras, då jag ser alla "Robotskapade"-kategorier som en tillfällig (om än långvarig) lösning. -- Innocent bystander 4 december 2015 kl. 16.13 (CET)
- Jag har nog en annan syn. När det kommer till geografiska grensidor med någon slags fullständighet, så har de också funktion som listor, och kan vara relevanta att länka exempelvis när det handlar om etymologi. Motsvarande gäller namnförgreningar, och jag skulle gärna se någon meningsfull kategorisering av geografiska grensidor också, men har ingen riktig idé om hur det ska se ut i praktiken. Taxelson (diskussion) 4 december 2015 kl. 16.34 (CET)
- Alla robotskapade grensidor ska infogas eller flyttas till de normala förgreningssidorna. Sant att sjöförgreningssidorna och de nya med kartor är ett mellanting mellan förgreningssidor och informationsartiklar (listor). Trots det är jag mot den uppdelning som har utförts för t.ex. socken och härad. En kategori är nog. Jag skulle föredra att etymologin beskrivs i en egen artikel. Kommer frågan från hur att fördela det fleråriga arbetet att göra allt? Maundwiki (diskussion) 4 december 2015 kl. 17.17 (CET)
- De robotskapade kategorierna ser jag främst som en sorts åtgärdskategorier. Jag använder dem flitigt för underhåll av botskapade artiklar. Det är mest i det syftet som jag föreslår en uppdelning, underhållet blir mer hanterligt om kategorierna inte är alltför gigantiska. Sedan är det trevligt om grensidorna också kan användas som listor, och då kan geografisk kategorisering ha en funktion. För rent underhåll är annars IB:s förslag om daterade kategorier en acceptabel lösning. Lsj (diskussion) 4 december 2015 kl. 18.38 (CET)
- Alla robotskapade grensidor ska infogas eller flyttas till de normala förgreningssidorna. Sant att sjöförgreningssidorna och de nya med kartor är ett mellanting mellan förgreningssidor och informationsartiklar (listor). Trots det är jag mot den uppdelning som har utförts för t.ex. socken och härad. En kategori är nog. Jag skulle föredra att etymologin beskrivs i en egen artikel. Kommer frågan från hur att fördela det fleråriga arbetet att göra allt? Maundwiki (diskussion) 4 december 2015 kl. 17.17 (CET)
- Jag har nog en annan syn. När det kommer till geografiska grensidor med någon slags fullständighet, så har de också funktion som listor, och kan vara relevanta att länka exempelvis när det handlar om etymologi. Motsvarande gäller namnförgreningar, och jag skulle gärna se någon meningsfull kategorisering av geografiska grensidor också, men har ingen riktig idé om hur det ska se ut i praktiken. Taxelson (diskussion) 4 december 2015 kl. 16.34 (CET)
Ser ingen konsensus i diskussionen ovan, och jag behöver kategorisering nu för att fixa till några landsspecifika fel i förgreningarna utan att behöva tröska 70000 artiklar. Jag skapar kategorier nu, men låter allting ligga som underkategorier till åtgärdskategorin Kategori:Robotskapade förgreningssidor. Lsj (diskussion) 17 december 2015 kl. 21.54 (CET)
- Eller möjligen olika mallar, som producerar kategorin, så är det ju enkelt att få dem att ge samma eller skilda förgreningskategorier senare (och göra det möjligt att hitta dem med "länkar hit" till respektive mall? Men jag vet inte om det är kontroversiellt att göra så också? Taxelson (diskussion) 17 december 2015 kl. 22.05 (CET)
- Hade gått att göra så också. Men nu har jag redan skrivit och börjat köra kod för att lägga in kategorierna utan mallar, den får köra klart. När artiklarna väl är kategoriserade går enkelt nog att byta ut mot mallanrop senare om vi så vill. Lsj (diskussion) 17 december 2015 kl. 22.08 (CET)
Antarktis flagga
[redigera wikitext]På Wikidata har vi lite smått börjat använda Antarktisfördragets område som "land" för sådant som ligger inom det berörda området. Vi kanske inte ska dra för mycket växlar av detta, men det kanske går att använda områdets flagga i artiklarna? -- Innocent bystander 4 december 2015 kl. 17.00 (CET)
- Ändras i så fall enklast i
{{Landsdata Antarktis}}
. Lsj (diskussion) 4 december 2015 kl. 18.34 (CET)
Objekt för robotskapade grensidor
[redigera wikitext]Jag håller så sakta på att skapa objekt till de grensidor som saknar sådana. Hittills har jag "fixat" -D och håller nu på med den del av alfabetet som kommer efter Ö. Programmet protesterar när jag vill skapa ett objekt som har en titel som överenstämmer med objekt som redan har en likadan label och hoppar över dessa. Finns det någon möjlighet att du tittar igenom de som blir kvar och låter roboten försöka avgöra om de ska sammanfogas, och dessa fall lägger in interwiki? -- Innocent bystander 5 december 2015 kl. 11.53 (CET)
- Du menar wikidata-objekt, förmodar jag. Jag kan åtminstone titta på hur svårt det kan vara att kolla, men det låter inte helt enkelt. Genererar ditt program en lista på de överhoppade, eller hur hittar jag dem enklast? En fundering: Boten skapar ju i princip samma grensidor även på cebuano - hur svårt vore det för ditt program att koppla även dessa till samma objekt? ceb:Kategoriya:Pagklaro paghimo ni bot. Lsj (diskussion) 5 december 2015 kl. 12.46 (CET)
- Jag använder inget program här hemma, utan använder ett av de verktyg som finns på wmflabs. Wikidata item creator och Autolist2 är de jag använder. Det förstnämnda för att skapa objekten och det sistnämnda för att lägga till påståenden (som typ "är en:grensida" eller "är ett:berg/inom:Unity/land:Sydsudan").
- Jag skulle kunna lägga in en modul i mallen som känner efter vilka sidor som inte har objekt ännu. Det är nog det enklaste sättet att skapa en lista över okopplade sidor.
- Jag har inga större möjligheter att "en masse" kunna koppla ihop ceb-grensidor med sv-grensidor. Det kräver mer avancerade verktyg. Förhoppningsvis finns det verktyg som kan hjälpa till att hitta två objekt med samma label som båda har påståenden som "är en:grensida".
- På sikt vore det trevligt om vi hittar en bot som "snyggar till" sådant som label och beskrivningar till de här objekten. -- Innocent bystander 5 december 2015 kl. 14.20 (CET)
- Det effektivaste sättet att få ihop två sidor är nog att lägga in old-style-interwiki. Det är ju det som gör att de vanliga artiklarna inkluderas så snabbt. -- Innocent bystander 5 december 2015 kl. 17.38 (CET)
- Märkte nu att det förstnämnda programmet fixar just en lista över alla okopplade sidor i en kategori... -- Innocent bystander 5 december 2015 kl. 14.32 (CET)
Kategori:Landformer på havets botten i Sydsudan
[redigera wikitext]Med tanke på att Sydsudan är "landlocked" bör vi kanske göra en faktakoll på den här kategorin? -- Innocent bystander 5 december 2015 kl. 14.56 (CET)
- Hmmm... ett misstag i GeoNames uppenbarligen. Platsen är klassad som en undervattensformation där ("U.BSNU"). Lsj (diskussion) 5 december 2015 kl. 16.30 (CET)
- Det finns även en undervattensravin i Afghanistan: Shwrkyan mandh Lsj (diskussion) 5 december 2015 kl. 16.51 (CET)
- Visst kan man skratta åt detta, men det får mig att än en gång vilja ställa frågan: varför importera sådana här fel till Wikipedia? Detta visar än en gång att Geonames inte är en tillräckligt bra källa som underlag för projektet, tycker jag. Vem ska åtgärda felen, eller bryr sig ingen om dem? Det här felet såg ni tydligen 5 december och sidan är ännu inte korrigerad/raderad. Höstblomma (diskussion) 9 december 2015 kl. 17.43 (CET)
- Är objektet felklassificerat eller ligger ravinen under vatten i en flod eller insjö? Hur som helst måste man i den här typen av arbete räkna med fel. Den som matar in data i en databas kan skriva fel, likaväl som den som skriver en artikel för hand. Om felfrekvensen är måttlig gäller det alltså att försöka hitta och åtgärda så många fel som möjligt (bl.a. genom att senare med bot göra kontroller mot uppdaterade källor), inte att avstå från projektet. --LPfi (diskussion) 12 december 2015 kl. 15.00 (CET)
Klippor
[redigera wikitext]Jag har haft lite svårt att klassificera "Klippor" och dylikt på Wikidata. Funkar det att klassa dem som "berg"? -- Innocent bystander 5 december 2015 kl. 18.09 (CET)
- Inte jättebra. Det som kallas klippor i Geonames är mycket varierande, allt från klippskär i havet till flyttblock på land till sådant som faktiskt kunde kallas berg. Men jag vet inte vad man skulle kalla dem istället. Lsj (diskussion) 5 december 2015 kl. 19.06 (CET)
- Klippor är en omdirigering till en förgreningsida med en oskriven artikel "Klippa (geologi)", kan köra WPClean men koden bör fixas. Närliggande, Mustarahu med geoname typ RKS är troligen vad vi kallar Skär (landområde). Det verkar som om geoname inte har något som skiljer RKS på land eller i vatten (ISLET är för stor). Borde vara en:Skerry. Går det att få boten att skilja på dessa typer av RKS? Maundwiki (diskussion) 4 juli 2016 kl. 16.15 (CEST)
Kon
[redigera wikitext]Det står att Cerro Negro (kon) är en kon. Vad menas med det? Svensson1 (diskussion) 5 december 2015 kl. 18.18 (CET)
- Nu hittade jag svaret på Användare:Lsjbot/Projekt alla platser/platstyper: "A conical landform composed of mud or volcanic material."
Men man kanske inte bör länka i artikeln till kon, som görs nu? Svensson1 (diskussion) 5 december 2015 kl. 18.25 (CET)- Ja, konerna bör länkas till något annat. Men vad? Förslag? Lsj (diskussion) 5 december 2015 kl. 19.08 (CET)
- de:Kegelberg och en:Conical hill har ännu ingen svensk motsvarighet, men borde väl kanske kunna heta kägelberg? Taxelson (diskussion) 5 december 2015 kl. 19.29 (CET)
- Kanske, men om man söker på internet efter ordet "kägelberg" tycks man mest få träffar i mycket gamla böcker. "Konisk kulle" eller "koniskt berg" (som i den engelskspråkiga artikeln) tycks ge fler träffar. Om vi kommer på ett bra namn, så borde väl det även användas i särskiljningsledet i artikelnamnet i stället för "kon".
- Konvulkan finns som omdirigering till vulkan. Skulle det gå att använda? Lsj (diskussion) 6 december 2015 kl. 15.16 (CET)
- Nej, enligt den andra meningen i den ovan nämnda engelskspråkiga artikeln om "conical hill" och "conical mountain", så är ursprunget inte alltid en vulkan. Svensson1 (diskussion) 6 december 2015 kl. 15.59 (CET)
- Har du möjligen några sådana berg, helst i Nordeuropa, som det är hyfsad chans att hitta svenskspråkig litteratur om, och se vilken term som då använts? Taxelson (diskussion) 6 december 2015 kl. 19.35 (CET)
- Man kanske kan hitta några här eller här. Svensson1 (diskussion) 6 december 2015 kl. 22.16 (CET)
- Har du möjligen några sådana berg, helst i Nordeuropa, som det är hyfsad chans att hitta svenskspråkig litteratur om, och se vilken term som då använts? Taxelson (diskussion) 6 december 2015 kl. 19.35 (CET)
- Nej, enligt den andra meningen i den ovan nämnda engelskspråkiga artikeln om "conical hill" och "conical mountain", så är ursprunget inte alltid en vulkan. Svensson1 (diskussion) 6 december 2015 kl. 15.59 (CET)
- Konvulkan finns som omdirigering till vulkan. Skulle det gå att använda? Lsj (diskussion) 6 december 2015 kl. 15.16 (CET)
- Kanske, men om man söker på internet efter ordet "kägelberg" tycks man mest få träffar i mycket gamla böcker. "Konisk kulle" eller "koniskt berg" (som i den engelskspråkiga artikeln) tycks ge fler träffar. Om vi kommer på ett bra namn, så borde väl det även användas i särskiljningsledet i artikelnamnet i stället för "kon".
- de:Kegelberg och en:Conical hill har ännu ingen svensk motsvarighet, men borde väl kanske kunna heta kägelberg? Taxelson (diskussion) 5 december 2015 kl. 19.29 (CET)
- Ja, konerna bör länkas till något annat. Men vad? Förslag? Lsj (diskussion) 5 december 2015 kl. 19.08 (CET)
Osynligt mjukt bindestreck i artikelnamn
[redigera wikitext]Artikelnamnet Vorderer Geißlkopf och omdirigeringen Großer Speikkogel (som båda skapades i dag) innehåller ett osynligt mjukt bindestreck. Det borde väl din programkod rensa bort innan artikelskapande. Svensson1 (diskussion) 8 december 2015 kl. 07.04 (CET)
- Ja, det borde den göra. Hade inte tänkt på att det skulle behövas. Lsj (diskussion) 8 december 2015 kl. 08.46 (CET)
- Ok, fixat nu för framtida skapande. Hur upptäckte du dessa bindestreck, de är totalt osynliga i min webbläsare även i redigeringsläge? Lsj (diskussion) 8 december 2015 kl. 20.10 (CET)
- Det är nog Svensson1bots förtjänst. -- Innocent bystander 8 december 2015 kl. 20.18 (CET)
- Nej, jag har gjort ett redigeringsfilter som tittar efter ovanliga eller felaktiga artikelnamn: Se här. Det märker dock inte upp några redigeringar med märken, det bara loggar. Det är dock inte helt perfekt, det har gett träff då du använt ovanliga apostrofer. Svensson1 (diskussion) 8 december 2015 kl. 20.26 (CET)
- Det där filtret ser användbart ut. Men det illustrerar också det problem jag har med att filtrera artikelnamn i botkoden - jag vill kunna hantera ortsnamn i alla världens språk och alfabet, och då är det svårt att vara säker på vilka tecken som inte någonstans på jorden kan vara en del av ett giltigt platsnamn. T.ex. använder khoisanspråken många av våra skiljetecken som "bokstäver". Lsj (diskussion) 8 december 2015 kl. 20.39 (CET)
- Nej, jag har gjort ett redigeringsfilter som tittar efter ovanliga eller felaktiga artikelnamn: Se här. Det märker dock inte upp några redigeringar med märken, det bara loggar. Det är dock inte helt perfekt, det har gett träff då du använt ovanliga apostrofer. Svensson1 (diskussion) 8 december 2015 kl. 20.26 (CET)
- Det är nog Svensson1bots förtjänst. -- Innocent bystander 8 december 2015 kl. 20.18 (CET)
- Ok, fixat nu för framtida skapande. Hur upptäckte du dessa bindestreck, de är totalt osynliga i min webbläsare även i redigeringsläge? Lsj (diskussion) 8 december 2015 kl. 20.10 (CET)
- Jag har för mig att Unicode har skilda koder för identiska tecken som skiljer sig semantiskt (jfr Å och Å). Om rätt kod använts borde det då inte bli något problem – och i annat fall borde det hur som helst rättas. --LPfi (diskussion) 9 december 2015 kl. 09.32 (CET)
- Sannolikheten att rätt kod används när namn skrivs in i en databas torde vara långt ifrån 100%. Men jag ska titta på det. Lsj (diskussion) 9 december 2015 kl. 11.24 (CET)
- Jag har för mig att Unicode har skilda koder för identiska tecken som skiljer sig semantiskt (jfr Å och Å). Om rätt kod använts borde det då inte bli något problem – och i annat fall borde det hur som helst rättas. --LPfi (diskussion) 9 december 2015 kl. 09.32 (CET)
Filtrerade särskiljningsled
[redigera wikitext]Namnfiltreringen som jag fixade igår kväll verkar ha ställt till ett nytt problem: kommatecken försvinner ur särskiljningsleden. Förstår inte riktigt varför, jag måste ha gjort ett regex-misstag i filtret. Ser ut som att jag behöver skapa om ganska många artiklar ur den pågående körningen. Men den får köra klart, det är pålitligare än att avbryta och ha den halvkörd. Lsj (diskussion) 9 december 2015 kl. 11.24 (CET)
- Har hittat felet. Kör om artiklarna nu. Lsj (diskussion) 10 december 2015 kl. 19.11 (CET)
Azerbajdzjanartiklar
[redigera wikitext]I artiklar som Ashab-i Kehf sägs berget ligga i Nakhchivan Autonomous Republic, men länken går till Nachitjevan (stad). På sidan Nakhchivan (distriktshuvudort) uppges Http://az.wikipedia.org/wiki/Naxçıvan_(şəhər) vara smeknamn. K9re11 (diskussion) 9 december 2015 kl. 21.42 (CET)
- Det första problemet beror på att Nachitjevan (stad) är felaktigt länkad i wikidata till GeoNames-posten om Nakhchivan Autonomous Republic. Av samma skäl har boten inte insett att Nakhchivan (distriktshuvudort) är en dublett till Nachitjevan (stad). Det där konstiga smeknamnet ser ut som klotter i GeoNames. Ska fixa till det här, men det får bli imorgon, det krävs en del handarbete. Lsj (diskussion) 9 december 2015 kl. 23.18 (CET)
Ett annat problem som har dykt upp är att vissa av Azerbajdzjans distrikt länkas fel i artiklarna till en grensida, se t.ex. Kuzun. Förstår ännu inte varför, har inte sett det problemet i andra länder. Behöver få ordning på detta innan det är lönt att åtgärda problemet ovan. Lsj (diskussion) 11 december 2015 kl. 08.39 (CET)
Lsjbot skapade artikeln Qäbälä om distriktet Qəbələ. Jag flyttade till Qəbələ (distrikt) och åtgärdade länkarna, men de flesta artiklarna i Kategori:Indelningar i Azerbajdzjan har samma problem: t.ex. Qazach borde heta Qazax (distrikt), och huvudorten Qazax (distriktshuvudort i Azerbajdzjan) borde heta Qazax. Detta är nu svårt att åtgärda, då Qazax är en förgreningssida. Så för att sköta det manuellt bör man: flytta Qazach till Qazax (distrikt), åtgärda länkarna (kan vara ganska stort arbete), flytta Qazax till Qazax (olika betydelser), åtgärda länkarna, flytta Qazax (distriktshuvudort i Azerbajdzjan) till Qazax. Detta är ett stort arbete, som måste göras med många artiklar. K9re11 (diskussion) 12 december 2015 kl. 10.07 (CET)
- Ja, det finns ett generellt problem med Azerbajdzjans distrikt, som ställer till alla de symtom vi diskuterat i det här avsnittet. Tillräckligt stort att det behöver botfixas, men jag har inte funnit bästa lösningen ännu. Förmodligen behöver jag skapa om hela Azerbajdzjan och dessutom en massa grensidor, efter att först ha handfixat namnen på ett antal distrikt. Det här kommer att ta tid... Lsj (diskussion) 12 december 2015 kl. 10.36 (CET)
- Att bara byta ut namnen på Qäbälä och andra ställen är rättframt men leder till problem med särskiljningsled (jfr Qazax). Därför kan vi väl namnge distrikten med det fulla azarbazdzjanska namnet: Qəbələ Rayonu etc, där särskiljningsled knappast kommer att behövas. Lsj (diskussion) 12 december 2015 kl. 11.06 (CET)
- Tror det ska vara fixat nu, se Kategori:Indelningar i Azerbajdzjan. Finns dock kvar en del skräp i form av tomma kategorier, se t.ex. Kategori:Orter i Azerbajdzjan, och ett mindre antal artiklar lär behöva handfixas. Lsj (diskussion) 13 december 2015 kl. 20.26 (CET)
Sidor inkluderar för mycket mallkod
[redigera wikitext]Har du sett att 13 förgreningssidor som du skapat har hamnat i Kategori:Sidor som inkluderar för mycket mallkod? Det gäller t.ex. Mill Creek och Spring Creek som är över 0,5 megabytes stora och innehåller 1482/1439 förgreningar. Det gäller även t.ex. de betydligt mindre Twin Lakes och Mud Creek som är 0,2 megabytes stora och innehåller 529 förgreningar. Kanske behöver dessa delas upp i flera mindre delförgreningssidor för att fungera korrekt? Svensson1 (diskussion) 12 december 2015 kl. 11.39 (CET)
- Problemet är att sidorna innehåller fler än 1000 anrop till coord-mallen. Antagligen är bästa lösningen att dela upp förgreningssidorna på något vis. Nu är 13 sidor så få att det kan göras manuellt, men det är nog bara Lsj som vet exakt hur många framtida förgreningssidor som har fler än 1000 platser. Nasko (✉) 12 december 2015 kl. 12.10 (CET)
- För de mindre sidorna kan det räcka med att ersätta Coord-mallarna med en extern länk. Men för de stora är det nog inte tillräckligt. -- Innocent bystander 12 december 2015 kl. 12.28 (CET)
- Kanskje man kommer under 1000 anrop ved å slå sammen dubletter. - 4ing (diskussion) 12 december 2015 kl. 12.34 (CET)
- Slå samman dubletter räcker knappast, så stor andel dubletter är det inte. Dela upp sidorna är enklast. Återkommer med statistik om hur många det är totalt. Lsj (diskussion) 12 december 2015 kl. 13.41 (CET)
- For de nevnte eksemplene Mill Creek og Spring Creek tror jeg minst halvparten er dubletter. I så fall er det ikke bare for mange koordinat-anrop som er problematisk, men at det faktisk skapes så mange dubletter. - 4ing (diskussion) 12 december 2015 kl. 14.20 (CET)
- Hade flertalet varit dubletter så hade koordinaterna sammanfallit och inte varit utspridda över hela kartan, som de är i Spring Creek. Enstaka dubletter finns säkert, men det hade synts i koordinatmönstret på kartorna om det varit en stor andel. På vilka grunder hävdar du att hälften skulle vara dubletter? Lsj (diskussion) 12 december 2015 kl. 14.33 (CET)
- Jag tycker att det här låter som ett mycket litet problem som är väl värt att ta som bieffekt av Lsjbot's i det stora hela mycket positiva bidrag. --Ettrig (diskussion) 12 december 2015 kl. 14.35 (CET)
- Jag har i min naivitet hela tiden trott att vi skriver det här uppslagsverket för att dela med oss av tillgänglig information. Men nu visar det sig att det är "ett mycket litet problem" att en hel del av informationen på en del sidor inte går att läsa. har då det jobb jag har lagt ner på att dela upp några (Mud Lake och ett par til jag inte minns namnet på) av dessa mastiga sidor varit helt förgäves? Jaja, får väl skylla mig själv som ger mig på sånt tråk-arbete. Men det är snabbt återställt till det tidigare (oläsabara) skicket. Ett par sekunder bara. --MagnusA 12 december 2015 kl. 17.30 (CET)
- Jag tror inte det var riktigt så Ettrig menade, om jag får försöka tolka. Oläsbar info är ett problem som inte är litet, där är både du och jag och Ettrig nog överens, men att åtgärda ett par dussin oläsbara artiklar är ett mycket litet problem i sammanhanget, även om det är tråkgöra. Och jag, åtminstone, är tacksam att du hjälper att åtgärda problemet. Lsj (diskussion) 12 december 2015 kl. 19.06 (CET)
- Det var verkligen inte min avsikt att förringa någons arbete eller såra någon. Jag ville påpeka att detta fel inte är av sådan art att det måste rättas i robot-koden. Det programmet har kostat mycket arbete och resulterar i ett oerhört värdefullt tillskott till Wikipedia. Om några av dess förgreningssidor är väldigt stora så kan vi leva med det eller korrigera dem för hand. Båda de alternativen är mycket bättre än att inte alls få Lsjbots artiklar. Jag kommenterade absolut inte att de skulle vara oläsbara. Det hade inte nämnts i diskussionen. När jag tittar nu tycker jag att problemet är att det finns för många platser med samma namn. Kanske finns det en lösning på det, kanske inte. I alla händelser bör vi inte kräva att Lsjbot löser det problemet. --Ettrig (diskussion) 12 december 2015 kl. 20.37 (CET)
- det var nog bara lite olycklig formulering att till synes vifta bort de mastiga sidorna som "ett litet problem". Att det är overkill att bygga in eventuell uppdelning i botkoden är vi nog alla överens om. Med oläslig menar jag att det fattas informaion (just för att programvaran inte klarar av att rendera fram den). I exemplet Spring Creek börjar problemen redan vid rubriken USA. Ingen karta och inte en enda av coord-mallarna ar korrekt. Jag håller just nu på med just Spring Creek men någon annan får gärna ta tag i någon annan artikel. --MagnusA 12 december 2015 kl. 20.46 (CET)
- Jag har gjort nya förgreningssidor för Deer Creek, USA, Dry Creek, USA, Bear Creek, USA och Mill Creek, USA. Eftersom det ändå blir flera hundra rader i dessa sidor undrar jag om det inte vore en god idé om Lsjbot använde delstatskartor i stället för USA-kartan där det finns mer än säg tio platser med samma namn i en och samma delstat. Vad säger Lsj? --Larske (diskussion) 13 december 2015 kl. 00.58 (CET)
- Efter diverse åtgärder från olika personer finns nu inga sidor kvar i kategorin. Det var dessa 13 sidor som låg där tidigare om någon undrar: Bear Creek, Camp Creek, Cedar Creek, Clear Creek, Deer Creek, Dry Creek, Horseshoe Lake, Mill Creek, Mud Creek, Rock Creek, Spring Creek, Twin Lakes och Wolf Creek (olika betydelser). Svensson1 (diskussion) 13 december 2015 kl. 10.11 (CET)
- Jag har gjort nya förgreningssidor för Deer Creek, USA, Dry Creek, USA, Bear Creek, USA och Mill Creek, USA. Eftersom det ändå blir flera hundra rader i dessa sidor undrar jag om det inte vore en god idé om Lsjbot använde delstatskartor i stället för USA-kartan där det finns mer än säg tio platser med samma namn i en och samma delstat. Vad säger Lsj? --Larske (diskussion) 13 december 2015 kl. 00.58 (CET)
- det var nog bara lite olycklig formulering att till synes vifta bort de mastiga sidorna som "ett litet problem". Att det är overkill att bygga in eventuell uppdelning i botkoden är vi nog alla överens om. Med oläslig menar jag att det fattas informaion (just för att programvaran inte klarar av att rendera fram den). I exemplet Spring Creek börjar problemen redan vid rubriken USA. Ingen karta och inte en enda av coord-mallarna ar korrekt. Jag håller just nu på med just Spring Creek men någon annan får gärna ta tag i någon annan artikel. --MagnusA 12 december 2015 kl. 20.46 (CET)
- Det var verkligen inte min avsikt att förringa någons arbete eller såra någon. Jag ville påpeka att detta fel inte är av sådan art att det måste rättas i robot-koden. Det programmet har kostat mycket arbete och resulterar i ett oerhört värdefullt tillskott till Wikipedia. Om några av dess förgreningssidor är väldigt stora så kan vi leva med det eller korrigera dem för hand. Båda de alternativen är mycket bättre än att inte alls få Lsjbots artiklar. Jag kommenterade absolut inte att de skulle vara oläsbara. Det hade inte nämnts i diskussionen. När jag tittar nu tycker jag att problemet är att det finns för många platser med samma namn. Kanske finns det en lösning på det, kanske inte. I alla händelser bör vi inte kräva att Lsjbot löser det problemet. --Ettrig (diskussion) 12 december 2015 kl. 20.37 (CET)
- Jag tror inte det var riktigt så Ettrig menade, om jag får försöka tolka. Oläsbar info är ett problem som inte är litet, där är både du och jag och Ettrig nog överens, men att åtgärda ett par dussin oläsbara artiklar är ett mycket litet problem i sammanhanget, även om det är tråkgöra. Och jag, åtminstone, är tacksam att du hjälper att åtgärda problemet. Lsj (diskussion) 12 december 2015 kl. 19.06 (CET)
- Jag har i min naivitet hela tiden trott att vi skriver det här uppslagsverket för att dela med oss av tillgänglig information. Men nu visar det sig att det är "ett mycket litet problem" att en hel del av informationen på en del sidor inte går att läsa. har då det jobb jag har lagt ner på att dela upp några (Mud Lake och ett par til jag inte minns namnet på) av dessa mastiga sidor varit helt förgäves? Jaja, får väl skylla mig själv som ger mig på sånt tråk-arbete. Men det är snabbt återställt till det tidigare (oläsabara) skicket. Ett par sekunder bara. --MagnusA 12 december 2015 kl. 17.30 (CET)
- Jag tycker att det här låter som ett mycket litet problem som är väl värt att ta som bieffekt av Lsjbot's i det stora hela mycket positiva bidrag. --Ettrig (diskussion) 12 december 2015 kl. 14.35 (CET)
- Hade flertalet varit dubletter så hade koordinaterna sammanfallit och inte varit utspridda över hela kartan, som de är i Spring Creek. Enstaka dubletter finns säkert, men det hade synts i koordinatmönstret på kartorna om det varit en stor andel. På vilka grunder hävdar du att hälften skulle vara dubletter? Lsj (diskussion) 12 december 2015 kl. 14.33 (CET)
- For de nevnte eksemplene Mill Creek og Spring Creek tror jeg minst halvparten er dubletter. I så fall er det ikke bare for mange koordinat-anrop som er problematisk, men at det faktisk skapes så mange dubletter. - 4ing (diskussion) 12 december 2015 kl. 14.20 (CET)
- Slå samman dubletter räcker knappast, så stor andel dubletter är det inte. Dela upp sidorna är enklast. Återkommer med statistik om hur många det är totalt. Lsj (diskussion) 12 december 2015 kl. 13.41 (CET)
- Kanskje man kommer under 1000 anrop ved å slå sammen dubletter. - 4ing (diskussion) 12 december 2015 kl. 12.34 (CET)
- För de mindre sidorna kan det räcka med att ersätta Coord-mallarna med en extern länk. Men för de stora är det nog inte tillräckligt. -- Innocent bystander 12 december 2015 kl. 12.28 (CET)
Lite statistik
[redigera wikitext]- Totalt antal grensidor: ca 600 000
- Med mer än 100 förgreningar: 768
- Med mer än 500 förgreningar: 29
- Med mer än 1000 förgreningar: 6
Bör bli kanske några dussin sidor som behöver delas upp. Låter hanterbart för hand. Och de hamnar redan i en åtgärdskategori, så det är väl heller inte meningsfullt att boten flaggar dem? Lsj (diskussion) 12 december 2015 kl. 17.14 (CET)
- För en kolbaserad användare är är de relativt lätta att fixa för hand (om än tråkigt) och de är relativt få. De är också lätta att hitta i och med att MW-programvaran själv flaggar. Att Lsjbot skall försöka hålla reda på hur mycket programvaran tål och göra någon slags intelligent automatisk uppdelning i lagom bitar känns tämligen överflödigt. --MagnusA 12 december 2015 kl. 17.34 (CET)
Viktigaste tråkarbetet?
[redigera wikitext]Som framgår av tidigare diskussion uppstår i Lsjbots kölvatten en stor mängd arbete att korrigera och rätta till. Jag tror att mycket mer sådant uppstår än som kan bli åtgärdat. Men det är mycket svårt att uppskatta. Jag skulle vilja få systemstöd för att identifiera de artiklar som blir mest lästa. Det är ju synd att lägga ned en massa tråkarbete på artiklar som inte alls blir lästa. Jag tror att en stor andel av Lsjbots artiklar hör dit. --Ettrig (diskussion) 13 december 2015 kl. 12.48 (CET)
Engelska namn
[redigera wikitext]I artikeln Stogić står det "Det ligger i entiteten Federation of Bosnia and Herzegovina...", med korrekt länk men fel text, samma problem som vissa Azerbajdzjanartiklar hade. K9re11 (diskussion) 14 december 2015 kl. 19.54 (CET)
- Jo, jag märkte det också. Enkelt nog att byta efteråt när det bara är en handfull namn, men helst ska det ju bli rätt från början. Lsj (diskussion) 14 december 2015 kl. 19.57 (CET)
- Ok, tror jag har hittat buggen. Startar om Bosnien. Ska göra om Azerbajdzhan också vid tillfälle. Lsj (diskussion) 14 december 2015 kl. 20.07 (CET)
Fler än en vapenbild i kommunartikel ger trasig bildlänk
[redigera wikitext]I en artikel om en belgisk kommun blev det trasig bildlänk (vapenbilden), vilket gjorde att den hamnade i åtgärdskategorin som MW-programvaran själv använder. Det visade sig att den utpekade propertyn (94) innehåller två filnamn. Jag vet inte om det är korrekt med fler än ett filnamn i den propertyn hos Wikidata men i geoboxen i våra artiklar här kan det bara vara ett. Som fix i ovanstående artikel kommenterade jag bort det anropet men jag inser att problemet förmodligen kommer att uppstå i andra artiklar. --MagnusA 18 december 2015 kl. 17.38 (CET)
- Ok, tack. Trist med ytterligare ett tecken på att WD inte är så pålitligt som man kunde önska. Jag lägger in en lämplig spärr i botkoden. Lsj (diskussion) 18 december 2015 kl. 18.29 (CET)
- I nästa körning går boten in och kollar direkt på commons om det är en giltig bildfil som levereras av P94. Lade också in samma spärr för P18 och P948. Lsj (diskussion) 18 december 2015 kl. 18.39 (CET)
- ... och det gick inte heller att lita på att {{#property}} levererar samma sak som ett direkt wd-anrop i botkoden. Skippar {{#property}}-anrop för de här bilderna och lägger bildnamnet direkt i geoboxen. Lsj (diskussion) 18 december 2015 kl. 19.15 (CET)
- Problemet här är att det finns mer än en bild i P94. Det är ett fullt korrekt användande av en property på WD. #Property-parsern kan dock inte hantera det. En modul-lösning hanterar det enkelt, men jag vill egentligen varken ha moduler eller #Property-parsern direkt i artiklarna. -- Innocent bystander 19 december 2015 kl. 08.50 (CET)
- ... och det gick inte heller att lita på att {{#property}} levererar samma sak som ett direkt wd-anrop i botkoden. Skippar {{#property}}-anrop för de här bilderna och lägger bildnamnet direkt i geoboxen. Lsj (diskussion) 18 december 2015 kl. 19.15 (CET)
- I nästa körning går boten in och kollar direkt på commons om det är en giltig bildfil som levereras av P94. Lade också in samma spärr för P18 och P948. Lsj (diskussion) 18 december 2015 kl. 18.39 (CET)
Universitet
[redigera wikitext]Med tanke på artiklar som Institut de Recherches microbiologiques Jean-Marie Wiame frågar jag om det är så vettigt att Lsjbot skapar artiklar om universitet. Någon information om vad universitetet gör finns ju inte i artikeln. K9re11 (diskussion) 18 december 2015 kl. 18.44 (CET)
- Samma fråga diskuteraades ovan under rubrik #University of Juba. Taxelson (diskussion) 18 december 2015 kl. 18.51 (CET)
Curaçao
[redigera wikitext]Lsjbot tycks skriva Curaçao som Curacao, t.ex. på sidan Westpunt. K9re11 (diskussion) 21 december 2015 kl. 15.55 (CET)
- Felskrivet i min fil med landsdata. Tack för att du såg det! Lsj (diskussion) 21 december 2015 kl. 15.58 (CET)
- Kommer att fixa detta när kategoriseringen av förgreningssidorna är klar. Det är just sådant här fixande som kategoriseringen är bra för. Lsj (diskussion) 21 december 2015 kl. 16.06 (CET)
- Och nu är alla Curaçao-artiklar skapade, se Kategori:Robotskapade Curaçaoartiklar. Såvitt jag kan se har namnformen blivit rätt nu. Lsj (diskussion) 30 december 2015 kl. 12.00 (CET)
Saba
[redigera wikitext]Har noterat att Saba länkas fel i t.ex. Core Gut. Åtgärdar detta när pågående körning är klar. Lsj (diskussion) 21 december 2015 kl. 16.06 (CET)
Bumbunga Lake
[redigera wikitext]Den hade ytan 100 ggr för stor. Jag kan inte se det är ett generellt problem utan bara hittat detta fall.Yger (diskussion) 23 december 2015 kl. 09.07 (CET)
- Ok tack. Jag har hittat problemet nu. Boten tog arean från enwp någon gång i somras, och då var den där angiven som 1388 hektar. Boten missade enhetangivelsen "ha" och tog för givet att det var km2 så som det normalt ska vara i Geobox. Lsj (diskussion) 23 december 2015 kl. 13.37 (CET)
Lång geobox i parker
[redigera wikitext]Går det att trimma geobox-instansen i artiklar som Goodwill Park (park i Australien)? Den artikeln är 50kB, fast den har ett ordinärt Lsjbot-stub-utseende. Orsaken till längden är ett mycket stort antal oanvända parametrar i geoboxen. --Ettrig (diskussion) 28 december 2015 kl. 12.32 (CET)
- För de flesta platstyper har jag hittat eller fixat "skräddarsydda" geoboxar med bara de relevanta parametrarna. Men för några få platstyper fanns det ingen som passade, och då får de en default-geobox med alla parametrar. Men visst skulle det gå att rensa en hel del i den. Lsj (diskussion) 28 december 2015 kl. 19.31 (CET)
- Har städat ur default-geoboxen nu, och ungefär halverat storleken inför framtida skapande. Lsj (diskussion) 30 december 2015 kl. 11.59 (CET)
Läckande koordinater
[redigera wikitext]I exempelvis Bukit Telingan "läcker" koordinaterna utanför boxen och jag kan inte riktigt se vad det beror på. /Hangsna (diskussion) 29 december 2015 kl. 05.42 (CET)
- @Hangsna: En nulledit verkade hjälpa. Det är koordinaterna som brukar ligga på titelraden längst upp till höger som hade flyttat på sig och lagt sig efter "robotskapadmallen". Det kan möjligen bero på en ändring som Nirmos gjorde för att de inte skulle krocka med "långa titlar". --Larske (diskussion) 29 december 2015 kl. 07.00 (CET)
- Kan Nirmos visa var "långa titlar" har stört koordinaterna? -- Innocent bystander 29 december 2015 kl. 09.09 (CET)
- Koordinaterna i Bukit Telingan ser helt normala ut när jag tittar nu. Har någon fixat problemet redan? Lsj (diskussion) 29 december 2015 kl. 10.53 (CET)
- Om ingen gör en nulledit i Bukit Biang nu så kan du se det där. /Hangsna (diskussion) 29 december 2015 kl. 15.54 (CET)
- Ok, jag ser problemet. Om det behövs kan jag ju föralldel sätta Lsjbot på att göra en nulledit i alla artiklarna, men det borde finnas ett bättre sätt att åtgärda. Lsj (diskussion) 29 december 2015 kl. 18.28 (CET)
- Tiden löser alla cache-problem. -- Innocent bystander 29 december 2015 kl. 18.41 (CET)
- Felet finns inte i Google Crome av någon anledning. Avvakta och låt en Iw-bot göra redigeringen. Nasko (✉) 29 december 2015 kl. 18.49 (CET)
- Tiden löser alla cache-problem. -- Innocent bystander 29 december 2015 kl. 18.41 (CET)
- Ok, jag ser problemet. Om det behövs kan jag ju föralldel sätta Lsjbot på att göra en nulledit i alla artiklarna, men det borde finnas ett bättre sätt att åtgärda. Lsj (diskussion) 29 december 2015 kl. 18.28 (CET)
- Om ingen gör en nulledit i Bukit Biang nu så kan du se det där. /Hangsna (diskussion) 29 december 2015 kl. 15.54 (CET)
- Koordinaterna i Bukit Telingan ser helt normala ut när jag tittar nu. Har någon fixat problemet redan? Lsj (diskussion) 29 december 2015 kl. 10.53 (CET)
- Kan Nirmos visa var "långa titlar" har stört koordinaterna? -- Innocent bystander 29 december 2015 kl. 09.09 (CET)
Två IWL-grupper
[redigera wikitext]Ofta hittar inte Lsjbot motsvarande artiklar på andra språk. Jag har tittat framför allt på orter. Lsjbot skapar då en text-iwl-länk till ceb:. En bot i Lsjbots kölvatten flyttar senare text-länken till Wikidata (WD). Vi får då två grupper av artiklar om samma fenomen. Jag går igenom orter och letar efter motsvarande engelska artikel. Om jag finner den så gör jag sammanlänkningen i WD. Om den engelska artikeln var olänkad så går det bra. Genom ett extra klick blir också ceb:-artikeln inlänkad. Om den engelska artikeln är länkad i "en annan grupp" får jag fel när jag försöker lägga till sv: i den gruppen. Den svenska artikeln hör ju redan till "en annan grupp". Jag går då till den andra gruppen och tar bort sv: från den gruppen, för att sedan kunna lägga till sv: i den grupp som innehåller den engelska artikeln.
Som en oönskad effekt av detta agerande lämnas ceb:-artikeln utan IWL. Tillsammans har länkningsboten och jag förstört information. Jag skulle förstås kunna lägga in också ceb:-artikeln i den nya gruppen. Men jag vill inte lägga ned det arbetet.
Kan vi hitta en lösning på detta problem som inte kräver extra manuellt arbete? Kan man till exempel lägga in ett moratorium för just denna WD-länkning? Jag menar, finns det ett sätt att i artikel-texten säga till länkningsrobotar att just den här länken ska inte överföras till WD. En sådan blockering skulle kunna gälla så länge ceb: är den enda länkningen som finns i dessa två artiklar. --Ettrig (diskussion) 31 december 2015 kl. 11.06 (CET)
- Du vet att det finns ett Merge-verktyg på WD? Då flyttas både sv och ceb-länkarna till en-objektet och en omdirigering skapas. Det kräver två musklick och allt samamnfogas! - Innocent bystander 31 december 2015 kl. 11.11 (CET)
- Nej, det visste jag inte. Det tog en bra stund för mig att lura ut. Men nu är det gjort och det är tillräckligt bra. Tack för hjälpen. --Ettrig (diskussion) 31 december 2015 kl. 12.21 (CET)
- Samma problem var uppe till diskussion tidigare, se #Antarktiske utfordringer (var: Belgica Mountains) ovan. En partiell lösning som jag har tillämpat sedan dess är att köra svenska och cebuano ur fas, så att vi och iw-botarna får åtminstone någon vecka på oss när artiklarna bara finns på ena språket. På det viset kan vi slippa åtminstone en del dubblerade wd-objekt. Och med merge-verktyget som IB påminner om bör återstoden vara relativt enkel att fixa. Tror hur som helst det är lättare att slå ihop två objekt än att sära på en felaktig sammanlänkning. Därför är boten konservativ när den iw-länkar till andra språk, och låter bli i tveksamma fall. Lsj (diskussion) 31 december 2015 kl. 11.37 (CET)
Städning
[redigera wikitext]Tänkte städa bland alla labels på WD. Kan jag lite på att alla förekomster av paranteser i artikelrubriker är en del av ett särskiljningsled? -- Innocent bystander 31 december 2015 kl. 16.44 (CET)
- Det kan du nog lugnt göra. Boten gör samma antagande. Jag har hittat enstaka skräp-parenteser (liksom en del annat skräp) i Geonames-namn, men inte så många att det stör. Lsj (diskussion) 31 december 2015 kl. 17.45 (CET)
- Finns det något api-gränssnitt (eller liknande) till Geonames? Ladda ner hela globala filen känns lite övermäktigt. -- Innocent bystander 1 januari 2016 kl. 10.09 (CET)
- Ja, det finns: [23]. Men det är såpass begränsat (max antal anrop per tidsenhet) att det är värdelöst för våra syften. Och en komplett datadump är bara ett par hundra Mb, inte så farligt att ladda ner. Finns också uppdelad per land. Lsj (diskussion) 1 januari 2016 kl. 10.57 (CET)
- Jag tänkte att om jag nu lyfter över alla geonames till P1566 så kan jag sedan utifrån det fylla i P31 mfl på WD. Filen ryms nog här, men känns svårnavigerad med C# både storleksmässigt och sökmässigt. -- Innocent bystander 1 januari 2016 kl. 11.15 (CET)
- Mja, tänkt ~försöka banta filen innan jag använder den, men OO Calc hanterar inte så stora filer (för många rader). Hmmm, mummel mutter... -- Innocent bystander 1 januari 2016 kl. 11.28 (CET)
- Jag tänkte att om jag nu lyfter över alla geonames till P1566 så kan jag sedan utifrån det fylla i P31 mfl på WD. Filen ryms nog här, men känns svårnavigerad med C# både storleksmässigt och sökmässigt. -- Innocent bystander 1 januari 2016 kl. 11.15 (CET)
- Ja, det finns: [23]. Men det är såpass begränsat (max antal anrop per tidsenhet) att det är värdelöst för våra syften. Och en komplett datadump är bara ett par hundra Mb, inte så farligt att ladda ner. Finns också uppdelad per land. Lsj (diskussion) 1 januari 2016 kl. 10.57 (CET)
- Finns det något api-gränssnitt (eller liknande) till Geonames? Ladda ner hela globala filen känns lite övermäktigt. -- Innocent bystander 1 januari 2016 kl. 10.09 (CET)
- Jo, filen är en b*tch att redigera, det har jag också märkt. Förmodligen enklare att skriva lite kod som bantar/splittar filen. Att läsa in hela filen i minnet i en botkörning tar några Gb RAM, vilket också kan bli jobbigt om man inte har mer än 8Gb. Jag brukar läsa ett land i taget, utom för särskiljningskörningarna när jag verkligen måste kolla alla mot alla. C#-kod för att läsa Geonames-filerna finns här: Wikipedia:Projekt DotNetWikiBot Framework/Lsjbot/Make-Geonames. Metoden read_geonames(string countrycode) läser huvudfilen (eller en landsfil), och read_altnames() läser alternativnamnsfilen. Lsj (diskussion) 1 januari 2016 kl. 11.33 (CET)
Över 3000 m
[redigera wikitext]- (hitflyttat från Användardiskussion:Lsj#Över 3000 m)
Det finns bergstoppar i Kategori:Berg i Antarktis högre än 2000 meter över havet som är över 3 000 m ö.h. Dessa borde i stället föras över till Kategori:Berg i Antarktis högre än 3000 meter över havet. Kan det göras med Lsjbot? Dammråtta (diskussion) 31 december 2015 kl. 16.50 (CET)
- För de här höjdkategorierna använder boten höjdgränserna 200, 500, 1000, 2000, 4000, 6000 m.ö.h. Enkelt att lägga till 3000 som en ytterligare gräns för framtida skapande. Går att göra med bot för befintliga artiklar också, men lite pilligt. Hur angeläget är det? Lsj (diskussion) 31 december 2015 kl. 17.45 (CET)
- Det skall förstås följa de internationella interwikikategorierna om 0, 1000, 2000, 3000, 4000, 5000, 6000, 7000 och 8000-meterstoppar. 200, 500, 1000, 2000, 4000, 6000 verkar inte följa någon befintlig wikipraxis på andra språk. Dammråtta (diskussion) 1 januari 2016 kl. 02.59 (CET)
- Tack, det visste jag inte att det fanns en praxis för detta. I så fall ska den förstås följas, även om jag personligen inte tycker en linjär indelning är optimal. Lsj (diskussion) 1 januari 2016 kl. 11.00 (CET)
- Men jag tycker inte alls om namnen på de befintliga samlingskategorierna: Kategori:Tvåtusenmeterstoppar etc. Vore både enklare och tydligare att kalla dem Kategori:Berg högre än XXXX meter över havet. Och kategorinamnen på Commons och enwp (Category:Two-thousanders etc) är ännu värre. Lsj (diskussion) 1 januari 2016 kl. 11.06 (CET)
- Kategorinamnen kan förstås diskuteras, nuvarande namn är i analogi med de engelska kategorinamnen. Nuvarande namn utgår från att toppar i kategorin har en höjd på ≳ det värde som anges, medan ditt förslag betyder att det skulle avse toppar som har en höjd som är > värdet. Därför är ditt förslag inte bra. Ett förtydligat namn kunde vara Kategori:Berg XXXX meter över havet eller högre eller ännu mer specifikt Kategori:Berg XXXX meter över havet eller högre, upp till XXXX+1000 meter över havet. Det sistnämnda blir kanske lite för omständligt, även om det förstås vore mer korrekt. Dammråtta (diskussion) 1 januari 2016 kl. 12.02 (CET)
- Boten kategoriserar idag baserat på > värdet, inte >= värdet, i enlighet med de namn den skapar. Går föralldel att göra vilket som, jag har inga problem med Kategori:Berg XXXX meter över havet eller högre. Men att engelska har svårtolkade kategorinamn är inget skäl att inte vara tydlig på svenska. Boten lägger "högre" kategorier som underkategorier till "lägre", vilket torde göra det överflödigt att ha intervallens övre gränser i kategorinamnen. Lsj (diskussion) 1 januari 2016 kl. 12.30 (CET)
Besläktad fråga: Idag blir det separata kategorier för berg, kullar och vulkaner efter höjd. Bör dessa slås ihop? Lsj (diskussion) 1 januari 2016 kl. 11.17 (CET)
- Ja, det tycker jag definitivt, eftersom det viktiga torde vara höjden och inte karaktären. Dammråtta (diskussion) 1 januari 2016 kl. 12.02 (CET)
- Ok, ska fixas. Kategori:Kullar i Afghanistan högre än 4000 meter över havet får avvecklas :) Lsj (diskussion) 1 januari 2016 kl. 12.30 (CET)
Städer efter befolkning?
[redigera wikitext]Som det är nu skapar boten storlekskategorier för berg, öar och sjöar. En tänkbar utvidgning som är kodmässigt enkel är att även kategorisera orter efter befolkning: Kategori:Orter i Belgien med minst 10 000 invånare etc. Vore det av intresse? Lsj (diskussion) 1 januari 2016 kl. 18.33 (CET)
- Jag är inte intresserad av den typen av kategorier. - Innocent bystander 3 januari 2016 kl. 08.22 (CET)
- Befolkningens storlek korrelerar nog starkt med artikelns angelägenhetsgrad. Lsjbot skapar nu artiklar väldigt mycket snabbare än det manuella putsandet/städandet/kompletterandet. Med storleks-sortering skulle det vara möjligt att prioritera att fixa de som troligtvis är mest angelägna. Jag skulle nog använda det. --Ettrig (diskussion) 3 januari 2016 kl. 09.33 (CET)
- Konsensus saknas. Jag provkör några länder så får vi se vad vi tycker. Lsj (diskussion) 5 januari 2016 kl. 22.46 (CET)
- Bör inte talen i kategorierna ha tusentalsavgränsare som på alla andra ställen på svwp? Alltså Kategori:Orter med 1 000 000 eller fler invånare. Det är lite jobbigt att behöva "räkna nollor" för att skilja på till exempel 100000 och 1000000. --Larske (diskussion) 6 januari 2016 kl. 11.48 (CET)
- Jo, det har du rätt i. Ska fixas. Lsj (diskussion) 6 januari 2016 kl. 12.58 (CET)
- Bör inte talen i kategorierna ha tusentalsavgränsare som på alla andra ställen på svwp? Alltså Kategori:Orter med 1 000 000 eller fler invånare. Det är lite jobbigt att behöva "räkna nollor" för att skilja på till exempel 100000 och 1000000. --Larske (diskussion) 6 januari 2016 kl. 11.48 (CET)
- Konsensus saknas. Jag provkör några länder så får vi se vad vi tycker. Lsj (diskussion) 5 januari 2016 kl. 22.46 (CET)
- Befolkningens storlek korrelerar nog starkt med artikelns angelägenhetsgrad. Lsjbot skapar nu artiklar väldigt mycket snabbare än det manuella putsandet/städandet/kompletterandet. Med storleks-sortering skulle det vara möjligt att prioritera att fixa de som troligtvis är mest angelägna. Jag skulle nog använda det. --Ettrig (diskussion) 3 januari 2016 kl. 09.33 (CET)
Provkörning
[redigera wikitext]Provkör nu både fixade bergskategorier och Kategori:Orter efter befolkning för Belize. Lsj (diskussion) 5 januari 2016 kl. 21.45 (CET)
- Ser ut att fungera som det ska nu. Två kommentarer:
- För bergen kör jag standardkategorier enligt ovan, men behåller också de två "låga" kategorierna 200 och 500 möh, som jag ser som relevanta för låglänta länder.
- För orter hittar jag inga standardkategorier för storlekarna. Börjar vid 3000 invånare och kör med ungefär logaritmiska intervall: 3000, 10 000, 30 000, ...
- Synpunkter på detta? Lsj (diskussion) 5 januari 2016 kl. 22.45 (CET)
- Provkört Belize, Andorra, Antigua/Barbuda, Bangladesh och Bolivia. Lsj (diskussion) 6 januari 2016 kl. 11.19 (CET)
- Det är nog bra med sådana kategorier för orter. Storleken är inte det enda som gör en ort relevant, men de här är ju inte heller den enda kategoriseringen av orter. Jag har inga synpunkter på intervallerna. Finns det inte redan några intervaller i motsvarande kategorier på andra språk, så kan vi nog sätta vad vi vill på svenska. Dammråtta (diskussion) 12 januari 2016 kl. 00.30 (CET)
- Ok. Jag håller på nu att köra igenom alla hittills skapade länder med bot för att både fixa bergskategorierna och lägga till ortkategorier. Lsj (diskussion) 12 januari 2016 kl. 08.32 (CET)
- Det är nog bra med sådana kategorier för orter. Storleken är inte det enda som gör en ort relevant, men de här är ju inte heller den enda kategoriseringen av orter. Jag har inga synpunkter på intervallerna. Finns det inte redan några intervaller i motsvarande kategorier på andra språk, så kan vi nog sätta vad vi vill på svenska. Dammråtta (diskussion) 12 januari 2016 kl. 00.30 (CET)
- Provkört Belize, Andorra, Antigua/Barbuda, Bangladesh och Bolivia. Lsj (diskussion) 6 januari 2016 kl. 11.19 (CET)
Bukter i Antarktis
[redigera wikitext]Kategori:Bukter i Antarktis er "tunt befolkad". Det ser ut til å være en mangel ved robotkjøringen, som forhåpentligvis kan fikses. - 4ing (diskussion) 2 januari 2016 kl. 19.55 (CET)
- Artikeln Phantom Coast är överkategoriserad. Om den ingår i Kategori:Bukter i Västantarktis så ska den inte ingå i Kategori:Bukter i Antarktis. --Larske (diskussion) 2 januari 2016 kl. 20.32 (CET)
- Ja, i den grad vi trenger Kategori:Bukter i Västantarktis. Men det mangler mange hundre artikler om bukter i Antarktis. Disse finnes både på engelsk Wikipedia, GeoNames og i Antarktis ;-) - 4ing (diskussion) 2 januari 2016 kl. 20.54 (CET)
- GeoNames har flera olika platstyper som handlar om bukter och liknande: BAY, GULF, BGHT (bight), FJD (fjord), COVE. Boten skapar artiklar om alla dessa utom COVE. På engelska betyder "cove" en liten obetydlig vik, som knappast är relevant för Wikipedia. Men av någon anledning använder GeoNames just i Antarktis beteckningen COVE för alla bukter utom Phanton Coast. Därför blev de inte skapade i botkörningen. Men det går att ordna. Lsj (diskussion) 2 januari 2016 kl. 21.59 (CET)
- Ok, fyller på med "coves" nu i Kategori:Bukter i Antarktis. Lsj (diskussion) 2 januari 2016 kl. 22.19 (CET)
- GeoNames har flera olika platstyper som handlar om bukter och liknande: BAY, GULF, BGHT (bight), FJD (fjord), COVE. Boten skapar artiklar om alla dessa utom COVE. På engelska betyder "cove" en liten obetydlig vik, som knappast är relevant för Wikipedia. Men av någon anledning använder GeoNames just i Antarktis beteckningen COVE för alla bukter utom Phanton Coast. Därför blev de inte skapade i botkörningen. Men det går att ordna. Lsj (diskussion) 2 januari 2016 kl. 21.59 (CET)
- Ja, i den grad vi trenger Kategori:Bukter i Västantarktis. Men det mangler mange hundre artikler om bukter i Antarktis. Disse finnes både på engelsk Wikipedia, GeoNames og i Antarktis ;-) - 4ing (diskussion) 2 januari 2016 kl. 20.54 (CET)
Överkategorisering
[redigera wikitext]@Lsj: Kan du ändra i botkoden så att den inte kategoriserar bukter i Antarktis i mer än en "buktkategori". --Larske (diskussion) 2 januari 2016 kl. 23.46 (CET)
- Ok, fixar det imorgon. Antarktis har hur som helst specialkod, problemet bör inte drabba andra länder. Däremot har nog andra Antarktiskategorier samma problem. Lsj (diskussion) 2 januari 2016 kl. 23.53 (CET)
- Ser att Larskebot redan har åtgärdat bukterna inatt. Lsjbot fortsätter med övriga landformer. Tack för hjälpen. Lsj (diskussion) 3 januari 2016 kl. 10.37 (CET)