Benutzer:TMg/autoFormatter
Dieses Benutzerskript blendet eine „Auto-Format“-Schaltfläche () in der Werkzeugleiste über dem Bearbeitungsfenster ein, die rund 200 typische Wikifizierungs-Fehler automatisch korrigiert.
Verwendung
[Bearbeiten | Quelltext bearbeiten]Folgende Zeilen entweder in die eigene common.js (zur lokalen Verwendung nur in der deutschsprachigen Wikipedia) oder die eigene global.js im Meta-Wiki (zur globalen Verwendung in allen Wikimedia-Wikis) kopieren:
// [[User:TMg/autoFormatter.js]]
mw.loader.load( '//de.wikipedia.org/w/index.php?title=Benutzer:TMg/autoFormatter.js&action=raw&ctype=text/javascript' );
Ergänzend empfehle ich mein cleanDiff-Skript.
Verwendung in anderen Wikis
[Bearbeiten | Quelltext bearbeiten]In anderen Sprachen
[Bearbeiten | Quelltext bearbeiten]Die Beschriftung bzw. der Tooltip der „Auto-Format“-Schaltfläche kann lokalisiert werden:
var autoFormatterButtonLabel = 'Auto-Format';
In Nicht-Wikimedia-Wikis
[Bearbeiten | Quelltext bearbeiten]In externen Wikis, die Links zu Wikimedia-Wikis in der Kurzschreibweise [[:de:Wikipedia]]
nicht unterstützen, können die entsprechenden Formatierungen abgeschaltet werden:
var autoFormatWikimediaLinks = false;
Lokalisierung von Schlüsselwörtern
[Bearbeiten | Quelltext bearbeiten]Zum Abschalten der Lokalisierung von thumb
, DEFAULTSORT
usw. die folgende Zeile in die eigene common.js kopieren:
var autoFormatLocalisation = false;
Aufdecken von Linkzielen
[Bearbeiten | Quelltext bearbeiten]Potentiell irreführend verschleierte Links wie [[Berlin|Berliner Fernsehturm]]
wandelt das Skript in [[Berlin]]er Fernsehturm
um. Diese Funktion kann deaktiviert werden:
var autoFormatMaskedLinks = false;
Links wie [[Berlin|Berlins]]
, deren Kurzform [[Berlin]]s
den selben anklickbaren Text erzeugt, werden unabhängig von dieser Option immer umgewandelt.
Ausschreiben von Jahreszahlenbereichen
[Bearbeiten | Quelltext bearbeiten]In der deutschsprachigen Wikipedia schreibt das Skript verkürzte Jahreszahlenbereiche wie „2001–02“ automatisch aus. Diese Funktion kann ab- oder in anderen Wikis mit true
eingeschaltet werden:
var autoFormatShortYearRanges = false;
Entfernung von Redundanzen aus Infoboxen
[Bearbeiten | Quelltext bearbeiten]Das Skript entfernt Namensparameter aus einigen häufig verwendeten Infoboxen, wenn der Parameter leer ist oder lediglich das Lemma des Artikels wiederholt und das dem Standardverhalten der Infobox entspricht. Das vermeidet Redundanzen und reduziert Fehlerquellen. Die Liste der Vorlagen mit jeweils einem zu entfernenden Parameter kann wie folgt in der eigenen common.js angepasst werden:
var redundantTemplateParameters = [
'Infobox Musikalbum|Titel',
'Infobox Unternehmen|Name'
];
Die Funktion lässt sich auch ganz abschalten:
var redundantTemplateParameters = [];
Vorlagenformatierung
[Bearbeiten | Quelltext bearbeiten]Auf Wunsch bringt das Skript selbstgewählte Infoboxen und andere Vorlagen in eine einheitliche Form, benennt Parameter um oder entfernt sie. Dazu muss ein Abschnitt ähnlich wie der folgende in der eigenen common.js angelegt werden:
var autoFormatTemplates = [
{ name: 'Infobox Gemeinde in Deutschland',
format: '|_________________ = _\n'
},
{ name: 'Infobox Landkreis',
format: '|__________________ = _\n',
parameters: {
'Bürgermeister': 'Landrat',
'Direktionsbezirk': false
}
}
];
Innerhalb des Formats geben Unterstriche (_
) und ggf. Doppelkreuze (#
) Position, Minimal- und Maximallänge für Parametername und Wert an. Alle anderen Zeichen, Leerzeichen und Zeilenumbrüche (\n
) werden so übernommen, wie im Format angegeben. Leerzeichen am Zeilenende werden entfernt; mit trim: false,
lässt sich das für einzelne Vorlagen abschalten. Optional können veraltete Vorlagenparameter umbenannt oder mit false
ganz entfernt werden.
Beispiele:
format: '|_=_'
- Einzeiliges Format (inline) ohne Leerzeichen, das heißt aus
{{Internetquelle | url=… | titel=… }}
wird{{Internetquelle|url=…|titel=…}}
. format: '|_ = _\n'
- Mehrzeiliges Format mit Leerzeichen, jedoch ohne Ausrichtung der Gleichheitszeichen untereinander.
format: '|__________ = _\n'
- Mehrzeiliges Infobox-Format mit Ausrichtung der Gleichheitszeichen untereinander.
format: ' | __________########## = _\n'
|
: Der senkrechte Strich, mit dem jede Infoboxzeile beginnt, soll um ein Leerzeichen eingerückt und mit einem weiteren vom Parameternamen abgesetzt werden.__________
: Kurze Parameternamen sollen mit Leerzeichen auf mindestens diese Länge gebracht werden.##########
: Bereits vorhandene tiefere Einrückungen sollen beibehalten bzw. auf diese Maximallänge verkürzt werden.=
: Das Gleichheitszeichen soll immer mit Leerzeichen abgesetzt werden, unabhängig von einer eventuellen Einrückung._
: Platzhalter für den Wert. Die Festlegung von Minimal- und Maximallänge ist ebenfalls möglich, jedoch unüblich.\n
: Zeilenumbruch.
Benutzerdefinierte Ersetzungen
[Bearbeiten | Quelltext bearbeiten]Wahlweise kann das Skript auch typische Rechtschreibfehler korrigieren. Dazu muss ein Abschnitt ähnlich wie der folgende in die eigene common.js kopiert werden.
var autoFormatReplacements = [
[ 'daß', 'dass' ],
[ 'e.V.', 'e. V.' ],
[ 'u.a.', 'u. a.' ],
[ 'z.B.', 'z. B.' ]
];
Die Liste kann beliebig erweitert und Abkürzungen auch ausgeschrieben werden. Die Schreibweise mit Leerzeichen ist inbegriffen, dazu sind keine gesonderten Einträge nötig. Groß-/Kleinschreibung ist signifikant. Reguläre Ausdrücke werden in dieser vereinfachten Schreibweise nicht verarbeitet. Als Ausnahmen sind Zeichenauswahl sowie Platzhalter für Zahlen (\\d
) und Wörter (\\w
) erlaubt.
Beispiele:
[ 'ca.', 'etwa' ],
- Ersetzt alle Vorkommen von „ca.“ durch „etwa“. Wortgrenzen werden in dieser Schreibweise automatisch beachtet, „Bianca.“ bleibt also unangetastet.
[ '[cz]ir[ck]a', 'zirka' ],
- Ersetzt „circa“, „cirka“ und „zirca“ durch „zirka“.
[ 'z.B.', 'z. B.' ],
- Fügt ein geschütztes Leerzeichen in die Abkürzung ein. Punkte bewirken in dieser Schreibweise automatisch, dass auch Abkürzungen mit normalen, ungeschützten Leerzeichen erkannt werden.
[ 'Abs.\\d', 'Abs. \\d' ],
- Fügt zwischen „Abs.“ und einer darauf folgenden Zahl (
\\d
steht für digit) ein geschütztes Leerzeichen ein. Die Zahl wird durch Wiederholen des Platzhalters\\d
in die Ersetzung hinüber gerettet. [ '\\w\'\\w', '\\w’\\w' ],
- Setzt in Wörter (
\\w
) wie „O’Brian“ den typografisch korrekten Apostroph ein. [ '<!--\\w', '<!-- \\w' ], [ '\\w-->', '\\w -->' ],
- Fügt Leerzeichen in
<!-- Kommentare -->
ein, die mit einem Wort beginnen und enden.
Erweiterte benutzerdefinierte Ersetzungen
[Bearbeiten | Quelltext bearbeiten]Die Schreibweise (technisch: ein zweidimensionales Array) erlaubt auch die Verwendung eigener regulärer Ausdrücke und sogar Ersetzungsfunktionen.
Häufig gebrauchte Elemente:
[ /und/, 'sowie' ],
- Ersetzt nur das erste Vorkommen der Buchstabenfolge „und“ durch „sowie“. Wortgrenzen werden in dieser Schreibweise nicht automatisch beachtet.
[ /und/g, 'sowie' ],
- Ersetzt alle (
g
steht für „global“) Vorkommen der Buchstabenfolge „und“ durch „sowie“. [ /\bund\b/g, 'sowie' ],
- Ersetzt nur noch ganze Wörter (
\b
steht für boundary, „Wortgrenze“), nicht mehr Teile anderer Wörter wie z. B. in „rund“. Das ist gleichbedeutend mit der einfachen Schreibweise[ 'und', 'sowie' ],
. [ /([ ,])und([ ,])/g, '$1sowie$2' ],
- Führt die Ersetzung nur noch durch, wenn davor und dahinter ganz bestimmte Zeichen stehen, in diesem Fall Leerzeichen oder Kommas. Die in runde Klammern gefassten Fundstellen werden per
$1
und$2
in die Ersetzung hinüber gerettet. [ /([^\w-])und([^\w-])/g, '$1sowie$2' ],
- Führt die Ersetzung nur noch durch, wenn davor und dahinter ganz bestimmte Zeichen nicht stehen, in diesem Fall Wortzeichen (
\w
) oder Bindestriche. [ /([ ,])und(?=[ ,])/g, '$1sowie' ],
- Folgen mögliche Fundstellen direkt aufeinander, z. B. in „und und“, wird möglicherweise nur das erste Vorkommen ersetzt. Der positive Look-ahead
(?=…)
(oder(?!…)
für einen negativen) verbraucht die gefundenen Zeichen nicht, so dass das Leerzeichen hinter dem ersten „und“ für den Beginn der nächsten Fundstelle zur Verfügung steht. Vorsicht: Die Look-behinds(?<=…)
und(?<!…)
existieren in JavaScript nicht.
Praxisbeispiele
[Bearbeiten | Quelltext bearbeiten]Leerzeichen vor Einzelnachweisen immer entfernen, nicht nur am Satzende. Vorsicht: Keine Zeilenumbrüche entfernen, da das in <references>…</references>
vorkommt.
[
/ +<ref\b/g,
'<ref'
],
Fügt immer ein Leerzeichen hinter den Aufzählungszeichen *
und #
am Zeilenanfang ein.
[
/(\n[*#]+) *([^\s*#:;])/g,
'$1 $2'
],
Kürzt mehrfache Leerzeichen im Text auf jeweils eins, ohne dabei Tabellen und Vorlagen zu zerstören.
[
/([^\s=|] ) +(?=[^\s=|])/g,
'$1'
],
Bringt <!-- Kommentare -->
in eine einheitliche Form mit höchstens zwei Bindestrichen und Leerzeichen.
[
/<!--+ *(?=[^\s-])([^>]*[^\s-]) *--+>/g,
'<!-- $1 -->'
],
Fügt geschützte Leerzeichen in Daten wie „10. Januar“ ein. Vorsicht: Es ist umstritten, ob das durchgängig erfolgen soll.
[
/([\s(]\d+\.) (?=Januar|Februar|März|April|Mai|Ju[nl]i|August|(?:Sept|Nov|Dez)ember|Oktober)\b/g,
'$1 '
],
Automatik gemäß Hilfe:Kategorien #8. Regel: Ziffern am Lemma-Anfang.
[
/(\{\{SORTIERUNG:|\[\[Kategorie:[^\n[\]|]*\|)(?:#:+)?0*(\d+(?:\.\d{3})*)(?!\d)/g,
function( $0, $1, $2 ) {
return $1 + '#' + $2.replace( /\d\D*/g, ':' ) + $2.replace( /\D+/g, '' );
}
],
Was tut das Skript?
[Bearbeiten | Quelltext bearbeiten]Das Skript wird nur tätig, wenn man auf die Schaltfläche klickt.
Einheitliche Schreibweisen
[Bearbeiten | Quelltext bearbeiten]- Die Namensräume
Datei:
,Kategorie:
undVorlage:
, Bildparameter sowie die Schlüsselwörter{{SORTIERUNG}}
und#WEITERLEITUNG
werden vereinheitlicht (Referenz). - Die Schreibweise zahlreicher Vorlagen wird vereinheitlicht und Weiterleitungen aufgelöst.
- Die CSS-Klasse
wikitable
wird vereinheitlicht (Referenz). <ref>
und<references />
werden vereinheitlicht (Referenz).- Verschiedene Schreibweisen für die Überschrift „Weblinks“ werden vereinheitlicht (Referenz).
- Umlaute und Sonderzeichen in Sortierschlüsseln werden ersetzt und überflüssige Sortierschlüssel entfernt (Referenz).
- Benutzerdefinierte Ersetzungen ermöglichen die Korrektur von „daß“ → „dass“ (Referenz), „z.B.“ →
z. B.
(Referenz) und vielem mehr, dies muss jedoch von jedem Benutzer selbst festgelegt werden.
Typografie
[Bearbeiten | Quelltext bearbeiten]- "Zollzeichen" werden durch typografische „Anführungszeichen“ ersetzt (Referenz).
- Gedankenstriche - wie hier – werden durch typografische ersetzt (Referenz).
- ISBNs werden regelkonform formatiert.
- Datumsangaben werden einheitlich in die Form „1. Januar 1980“ gebracht (Referenz).
- Seiten- und Jahreszahlenbereiche werden einheitlich in die Form „S. 1–2“ und „1980–1982“ gebracht (Referenz).
- In Zeiträumen mit Tag und Monat wird der Strich durch „bis“ ersetzt (Referenz).
Links
[Bearbeiten | Quelltext bearbeiten]- Mehrfach verlinkte Jahreszahlen werden entlinkt (Referenz).
- Kopierte Weblinks und Anker werden umgewandelt, z. B.
[http://de.wikipedia.org/wiki/ß#Gro.C3.9Fschreibweise]
→[[ß#Großschreibweise]]
. [[Link|Link]]
wird auf[[Link]]
gekürzt.[[Link|Die]]s
wird zu[[Link|Dies]]
, weil es im Quelltext besser lesbar ist.[[Link|Links mit Anhängseln]]
werden zu[[Link]]s mit Anhängseln
, weil sonst das Linkziel unnötig verschleiert wird (Referenz).
Leerräume
[Bearbeiten | Quelltext bearbeiten]- Vor häufigen Maßeinheiten wie mm/cm/km, kg, kHz/MHz/GHz, kB/MB/GB sowie KiB/MiB/GiB werden geschützte (vor % normale) Leerzeichen eingesetzt (Referenz).
- In „§ 103“ und ähnlich werden geschützte Leerzeichen eingesetzt (Referenz).
== Überschriften ==
erhalten zur besseren Lesbarkeit immer Leerzeichen, geschützte Leerzeichen werden entfernt.- Unterstriche und geschützte Leerzeichen in Dateinamen werden durch Leerzeichen ersetzt.
- Geschützte Leerzeichen werden einheitlich in die Form
gebracht. - Manuelle Zeilenumbrüche werden einheitlich in die Form
<br />
gebracht (Referenz). - Mehrfache Leerzeilen werden auf einzelne reduziert.
- Mehrere Kategorien in einer Zeile werden untereinander gesetzt.
- Überflüssige Zeilenumbrüche und Leerräume am Textanfang und Zeilenende werden entfernt.
Neuheiten und Versionsgeschichte
[Bearbeiten | Quelltext bearbeiten]→ Ausführliches Änderungsprotokoll
- 2018–2022
-
- Zahlreiche Fehlerbehebungen u. a. für die bessere Unterstützung nicht-deutschsprachiger Wikis; Details siehe Versionsgeschichte.
- 24. Februar 2017
- 23. Juni 2016
-
- Neu: Galerien werden gesäubert.
- Neu: Österreich- und schweizbezogen wird beachtet.
- Neu: Mehr Säuberungen in der Zusammenfassungszeile.
- Behoben: Commons-Kategorienamen werden wie Dateinamen vor typografischen Änderungen geschützt.
- 2. Juni 2015
-
- Geändert: Leerzeichen am Ende nicht ausgefüllter Vorlagenparameter werden nicht mehr entfernt.
- 16. Januar 2014
-
- Neu: Zwei neue Konfigurationsschalter für verdeckte Linkziele und Jahreszahlenbereiche.
- Neu: Dateiinformationen wie „(PDF; 1,2 MB)“ in eine einheitliche Form bringen.
- Neu: Fehlendes Leerzeichen in „1.Januar“ einfügen.
- Neu: Auch individuelle Sortierschlüssel in Kategoriezeilen normieren.
- 15. Dezember 2013
-
- Neu: Sortierschlüssel in Kategoriezeilen zugunsten von SORTIERUNG verwerfen.
- Neu: ISBN in der Schreibweise „ISBN 13:“ erkennen.
- Geändert: ISBN nur noch nach bestimmten Zeichen säubern.
- Geändert: Jahreszahlenbereiche in Links gar nicht mehr ausschreiben.
- 7. Dezember 2013
-
- Behoben: In „1 January 2013 – 2 January 2013“ kein „to“ mehr einsetzen.
- Entfernt: Kein Trimmen am Textende mehr.
- 1. Dezember 2013
-
- Neu: Hochgestellte 2 und 3 bei gängigen Maßeinheiten in Unicode-Zeichen umwandeln.
- Neu: Bindestriche am Ende von Links entlinken.
- Behoben: In Galerien Dateinamen ohne Präfix schützen.
- 19. August 2013
-
- Neu: Viele Regeln für die englischsprachige Wikipedia tauglich gemacht.
- Neu: Endlich mit WikEd kompatibel gemacht.
- Neu: Viele neue Regeln zur Säuberung von HTML-Elementen in eindeutigen Fällen, vor allem
<font>
. - Neu: Die meisten als HTML-Entitäten kodierte Sonderzeichen werden dekodiert.
- Neu: Mehr Bildeinbindungs-Schlüsselwörter lokalisieren (Referenz), nicht jedoch CSS-Schlüsselwörter (Referenz).
- Neu: Unnötige Sortierschlüssel auch aus individuellen Kategorie-Zeilen entfernen.
- 24. Mai 2013
-
- Neu: In eindeutigen Fällen Leerzeilen zwischen Einzelnachweise, Navigationsleisten und Kategorien setzen.
- Geändert: Wesentlich mehr Zeichen in Sortierschlüssel normalisieren.
- Geändert: Die Erkennung von Maßeinheiten ist strenger bei Bis-Strichen, Minus und Komma.
- 8. April 2013
-
- Neu: Zusätzliche Säuberungen und Verfeinerungen der Säuberungen rund um
<ref>
. - Neu: ISBNs werden auch innerhalb von Vorlagen gesäubert.
- Neu: Einige häufig benutzte Filmvorlagen werden von redundanten Titelangaben befreit.
- Geändert: Das Ausschreiben des missverständlichen deutschen Datumsformats (z. B. 1.2.2013) ist wesentlich robuster.
- Neu: Zusätzliche Säuberungen und Verfeinerungen der Säuberungen rund um
- 18. Februar 2013
-
- Neu: Zahlreiche weitere Vorlagen werden vereinheitlicht, unter anderem alle Sprachvorlagen nach dem Schema Vorlage:enS.
- Neu: Kategorien erhalten immer einen großen Anfangsbuchstaben (Referenz).
- Neu: In Vorlage:Zitat und Vorlage:" werden doppelte Anführungszeichen durch einfache ersetzt.
- Neu: Mit Kommas ,,simulierte" Anführungszeichen werden gesäubert.
- Geändert: Drei Punkte werden an zahlreichen weiteren Stellen durch typografische Auslassungspunkte ersetzt.
- Geändert: Interlanguage-Links werden besser vor ungewollten Änderungen geschützt.
- 19. Januar 2013
-
- Neu:
{{SORTIERUNG:…}}
wird entfernt, wenn sie abgesehen von der Groß-/Kleinschreibung identisch zum Lemma ist (Referenz). - Neu: Unterstriche und
%
-Kodierungen werden aus allen Links entfernt, nicht mehr nur aus#Anker
-Links. - Neu: In Seitenzahlenbereiche werden typografische Bis-Striche eingesetzt.
- Neu: Experimentelle Option zur Säuberung von Vorlagen anhand benutzerdefinierter Formatstrings.
- Neu: Die Vorlage:Personendaten wird in eine einheitliche Form gebracht (Vorbelegung für die ansonsten benutzerdefinierbaren Vorlagenformatierungen).
- Geändert: Statt
miniatur
wird jetztmini
verwendet, vorhandeneminiatur
bleiben aber unangetastet (Referenz).
- Neu:
- 10. Dezember 2012
-
- Neu: Ist Text markiert, wird nur dieser gesäubert.
- Neu: Wikilinks in der Zusammenfassungszeile werden gesäubert.
- Neu: Die Lokalisierung von Schlüsselwörtern lässt sich abschalten.
- Neu: Benutzerdefinierten Ersetzungen sind wesentlich flexibler, erlauben Platzhalter für Wörter und reguläre Ausdrücke.
- Neu: Mathematische Ausdrücke, Dateinamen in Vorlagen und Quelltextabschnitte werden vor ungewollten Änderungen geschützt.
- 13. September 2012
-
- Behoben: Englische Anführungszeichen werden nicht mehr durch deutsche ersetzt.
- 6. August 2012
-
- Neu: ISBN-Formatierung für englische Bücher.
- 3. August 2012
-
- Behoben: Es wurden nicht alle aktuell vergebenen ISBN-Verlagsnummern beachtet.
- Geändert: Redundante Namensparameter werden aus wesentlich mehr häufig verwendeten Infoboxen entfernt.
- 3. November 2011
-
- Neu: Verschiedene Schreibweisen für das geschützte Leerzeichen (
) werden vereinheitlicht. - Behoben: Vor allem bei langen Artikeln arbeitet das Skript spürbar schneller.
- Neu: Verschiedene Schreibweisen für das geschützte Leerzeichen (
- 9. September 2011
-
- Neu: Der Platzhalter
\\d
für Zahlen erlaubt benutzerdefinierten Ersetzungen wie z. B.Nr.1
→Nr. 1
.
- Neu: Der Platzhalter
- 25. Juli 2011
-
- Neu: In „§ 103“ und ähnlich werden geschützte Leerzeichen eingesetzt.
- 24. Juni 2011
-
- Geändert: Bindestriche zwischen Zahlen (z. B. in
<math>3 - 2</math>
) werden nicht mehr in Gedankenstriche umgewandelt.
- Geändert: Bindestriche zwischen Zahlen (z. B. in
- 17. Mai 2011
-
- Geändert: Mehrdeutige Jahreszahlenbereiche „2000-01“ bis „2000-12“ (kann auch für den Monat stehen) werden nicht mehr ersetzt.
- 11. März 2011
-
- Neu: ISBNs werden in eine einheitliche Form gebracht.
- Behoben: Weblinks und Anker werden zuverlässiger in lesbare Wikilinks umgewandelt.
- 10. März 2011
-
- Neu: In Sortierschlüsseln wird die Groß/Kleinschreibung korrigiert und Umlaute ersetzt.
- Behoben: Dateinamen werden jetzt auch in Galerien ohne Beschreibungen gesäubert und vor ungewollten Änderungen geschützt.
- 17. Januar 2011
-
- Neu: Benutzerdefinierte Ersetzungen.
- Entfernt: „Daß“ und Abkürzungen werden standardmäßig gar nicht mehr ersetzt. Es werden auch keine geschützten Leerzeichen mehr eingesetzt.
- Entfernt: Die jetzt benutzerdefinierten Ersetzungen sind nicht mehr auf den Artikelnamensraum beschränkt.
- 14. Dezember 2010
-
- Neu: Der Bildparameter
upright
wird durchhochkant
ersetzt.
- Neu: Der Bildparameter
- 12. November 2010
- 7. Oktober 2010
-
- Neu: Weblinks mit falscher Syntax werden repariert.
- Neu: Weblinks auf Wikipedia-Sprachversionen werden in Wikilinks umgewandelt.
- Neu: Häufige Textbausteine für Schwesterprojekte werden normalisiert.
- Neu: Auch vor den Maßeinheiten kg und KiB/MiB/GiB werden geschützte Leerzeichen eingesetzt.
- Geändert: Nur noch Maßeinheiten mit korrekter Groß/Kleinschreibung werden beachtet. Einzige Ausnahme ist kB/KB, da beides häufig vorkommt.
- Entfernt: Die Maßeinheit dm wird nicht mehr beachtet, da sie zu selten vorkommt.
- 29. September 2010
-
- Neu: Kopierte Anker-Links (z. B.
[[ß#Gro.C3.9Fschreibweise]]
) werden dekodiert. - Behoben: Doppelstriche (häufig vor Signaturen) werden nicht mehr in Gedankenstriche umgewandelt.
- Neu: Kopierte Anker-Links (z. B.
- 21. September 2010
-
- Neu: Zum Lemma redundante Namens- oder Titelangaben werden aus verschiedenen häufig genutzten Infoboxen entfernt; das reduziert mögliche Fehlerquellen.
- Teilweise behoben: Dateinamen in Galerien ohne Beschreibungen wurden nicht erkannt.
- Behoben:
<br style="…" />
wurde nicht erkannt. - Geändert:
prettytable
wird nur noch innerhalb vonclass="…"
ersetzt.
- 22. August 2010
-
- Neu: Unterstriche in Dateinamen werden durch Leerzeichen ersetzt, auch in Galerien.
- Behoben: In Dateinamen wurden häufig Gedankenstriche, Daten und ähnliches ersetzt.
- 14. Januar 2010
-
- Neu: In Bildern werden
thumb
,right
undleft
eingedeutscht. - Neu: Kombinationen wie
miniatur|rechts
werden gekürzt, da Miniaturen immer rechts sind. - Neu: In
attribut = "…"
werden die Leerzeichen entfernt, da sonst die Anführungszeichen ersetzt wurden.
- Neu: In Bildern werden
- 22. Dezember 2009
-
- Neu: Geschützte Leerzeichen in Überschriften werden ersetzt, da Anker sonst nicht funktionieren.
- 21. Dezember 2009
-
- Neu: Bis-Striche zwischen Daten in Langform (zum Beispiel in „7. Dezember 1850–14. Januar 1851“) werden durch „bis“ ersetzt.
- 10. Oktober 2008
-
- Neu: Jede Kategorie wird in eine eigene Zeile umgebrochen.
- 14. März 2008
-
- Entfernt: Keine Leerzeile vor Überschriften erzwingen, es gibt zu viele Sonderfälle.
- 5. März 2008
-
- Neu: Hilfe zur Umstellung der alten „Infobox Ort in Deutschland“ nach „Gemeinde“.
- 12. Januar 2008
-
- Geändert: Prozentwerte brauchen kein geschütztes Leerzeichen mehr, da die MediaWiki-Software es einsetzt.
- 27. Oktober 2006
-
- Neu: Erste Version, teilweise basierend auf Benutzer:BLueFiSH.as/JS/markup.js. Hauptgrund und die mir persönlich wichtigste Regel war die Ersetzung von Anführungszeichen.
Weiterentwicklung
[Bearbeiten | Quelltext bearbeiten]Ziele (nach Wichtigkeit):
- Die Korrekturen dürfen möglichst keine neuen Fehler erzeugen.
- Der Benutzer soll von zeitraubenden Routinearbeiten befreit werden.
- Der Versionsvergleich soll möglichst übersichtlich bleiben.
- Es sollten nur möglichst konsensfähige Korrekturen vorgenommen werden.
- Kontrolle und Verantwortung sollen stets beim Benutzer bleiben.
Bekannte Probleme:
- Firefox’ Regex-Engine ist extrem anfällig für catastrophic backtracking.
- Internet Explorer bis Version 8 löscht Zeilenumbrüche am Beginn und Ende von Markierungen.
Siehe auch
[Bearbeiten | Quelltext bearbeiten]- Wikipedia:WikiProjekt Syntaxkorrektur
- meta:Wikificator
- Benutzer:PerfektesChaos/js/WikiSyntaxTextMod
- Benutzer:Jowereit/Typografie ersetzt Anführungszeichen und Gedankenstriche während der Eingabe, wie von Word gewohnt.
- Benutzer:Schnark/js/edithelper erlaubt die Eingabe zusammengesetzter Zeichen mittels einer Compose-Taste.
- Benutzer:Schnark/js/veAutocorrect führt typografische Autokorrekturen im Visual Editor durch.
- Benutzer:CamelBot#mediawiki-syntax
- Benutzer:Codeispoetry/Benutzerscripte#regengine.js (seit 2011 ungepflegt)
- en:Wikipedia:AutoEd (seit 2009 ungepflegt)
- pl:MediaWiki:Gadget-sk.js