Festkörperphysik (Gross, Marx)
Festkörperphysik (Gross, Marx)
Festkörperphysik
De Gruyter Studium
Weitere empfehlenswerte Titel
Festkörperphysik
Aufgaben und Lösungen
Rudolf Gross, Achim Marx, Dietrich Einzel, Stephan Geprägs, 2018
ISBN 978-3-11-056611-6, e-ISBN (PDF) 978-3-11-056613-0,
e-ISBN (EPUB) 978-3-11-056635-2
Festkörperphysik
Siegfried Hunklinger, 2017
ISBN 978-3-11-056774-8, e-ISBN (PDF) 978-3-11-056775-5,
e-ISBN (EPUB) 978-3-11-056827-1
Moderne Thermodynamik
Band 1: Physikalische Systeme und ihre Beschreibung
Christoph Strunk, 2018
ISBN 978-3-11-056018-3, e-ISBN (PDF) 978-3-11-056022-0,
e-ISBN (EPUB) 978-3-11-056034-3
Moderne Thermodynamik
Band 2: Quantenstatistik aus experimenteller Sicht
Christoph Strunk, 2018
ISBN 978-3-11-056050-3, e-ISBN (PDF) 978-3-11-056032-9,
e-ISBN (EPUB) 978-3-11-056035-0
Optik
Eugene Hecht, 2018
ISBN 978-3-11-052664-6, e-ISBN (PDF) 978-3-11-052665-3,
e-ISBN (EPUB) 978-3-11-052670-7
Rudolf Gross, Achim Marx
Festkörperphysik
|
3. Auflage
Autoren
Prof. Dr. Rudolf Gross
Technische Universität München und
Bayerische Akademie der Wissenschaften
Walther-Meißner-Institut
Walther-Meißner-Straße 8
85748 Garching b. München
rudolf.gross@wmi.badw.de
ISBN 978-3-11-055822-7
e-ISBN (PDF) 978-3-11-055918-7
e-ISBN (EPUB) 978-3-11-055928-6
www.degruyter.com
Vorwort
Festkörper spielen in der Entwicklungsgeschichte der Menschheit eine bedeutende Rolle.
So sind zum Beispiel die elektrischen, magnetischen und optischen Eigenschaften von
Festkörpern für die Entwicklung unserer heutigen Informationsgesellschaft von zentraler
Bedeutung und Anwendungen von Festkörpern sind entscheidend für die wirtschaftliche
Entwicklung der heutigen Industrienationen. Das Gebiet der Festkörperphysik ist mitt-
lerweile so umfangreich geworden, dass es nicht in einem einzelnen Lehrbuch umfassend
dargestellt werden kann. Das vorliegende Buch soll eine ausgewogene Einführung in dieses
wohl breiteste Gebiet der Physik geben und als Basis für weiterführende Fachliteratur zu
verschiedenen Spezialthemen der Festkörperphysik wie z. B. Supraleitung, Halbleiterphysik
und -elektronik, Magnetismus, Spin-Elektronik, Nanosysteme, Kristallographie, Tieftem-
peraturphysik oder Polymerphysik geben. Auf experimentelle Techniken und technische
Anwendungen wird nur am Rande eingegangen, um den Umfang des Buches zu begrenzen.
Nicht verzichtet wurde dagegen auf viele historische Hinweise und die Lebensläufe einiger
bedeutender Wissenschaftler, da diese in vielen anderen Büchern häufig zu kurz kommen,
für das Verständnis von wissenschaftlichen Entwicklungen und die allgemeine Ausbildung
der Studenten aber wichtig sind.
Die Grundlage für das vorliegende Buch bildet ein Skriptum, das den Studenten als Begleit-
material zu unseren Vorlesungen an der Universität zu Köln (1996–2000) und später an der
Technischen Universität München zur Verfügung gestellt wurde. Die erste vollständige Ver-
sion des Skriptums wurde bereits im Wintersemester 1997/1998 fertig gestellt und online
frei verfügbar gemacht. Seither wurde es ständig, auch dank der zahlreichen Rückmeldungen
von engagierten Studentinnen und Studenten, überarbeitet und vervollständigt. Insbesonde-
re wurden viele Vertiefungsthemen auf Anregung der Studenten hinzugefügt. Die nun vor-
liegenden 3. Auflage berücksichtigt zahlreiche Anregungen für Verbesserungen und Ergän-
zungen, welche die Autoren zu den früheren Auflagen erhalten haben. Insbesondere wurden
Fehler im Text und in den Abbildungen beseitigt, die Darstellung weiter optimiert und neue
Abschnitte zu mittlerweile wichtig gewordenen Themengebieten (u.a. Spin-Ströme, anoma-
le Hall- und Nernst-Effekte, mit dem Spin-Freiheitsgrad verbundene Transportphänomene,
Magnetisierungsdynamik) überarbeitet und ergänzt. Das Themengebiet topologische Quan-
tenmaterialien ist in den vergangenen zwei Jahrzehnten so stark gewachsen, dass es jetzt in
einem neuen Kapitel 14 separat vorgestellt wird.
Da die Vertiefung und Erweiterung von Fachwissen anhand von Übungsaufgaben von un-
schätzbarem Wert ist, haben die Autoren als Ergänzung zu diesem Lehrbuch das Buch Fest-
körperphysik. Aufgaben und Lösungen (Rudolf Gross, Achim Marx, Dietrich Einzel) ver-
fasst. Es ermöglicht den Lesern dieses Buches, ihr erlerntes Wissen durch die Lösung von
Übungsaufgaben zu überprüfen. Die zur Verfügung gestellten Musterlösungen sollen dabei
VI Vorwort
helfen, den eigenen Lösungsweg zu überprüfen und Hindernisse bei der Erarbeitung des
eigenen Lösungswegs zu überwinden. Da die Übungsaufgaben und zugehörigen Musterlö-
sungen in einem eigenen Buch enthalten sind, wurde in der jetzigen Auflage des Lehrbuchs
zur Festkörperphysik auf die Auflistung der Übungsaufgaben am Ende jedes Kapitels ver-
zichtet.
Das Buch richtet sich an Studierende der Physik und Materialwissenschaften im Bachelor-
und Master-Studiengang, die als Spezialisierungsrichtung die Physik der kondensierten Ma-
terie gewählt haben. Je nach zeitlichem Umfang der Vorlesungen können einige Themen-
gebiete weggelassen werden. Im Buch sind bereits so genannte Vertiefungsthemen markiert,
die zum weiteren Verständnis des Buches nicht benötigt werden und deshalb auch über-
sprungen werden können. Vorausgesetzt werden Grundkenntnisse zur Mechanik, Atom-
physik, Elektrodynamik, Quantenmechanik und statistischen Physik. In allen Gleichungen
wird grundsätzlich das internationale Maßsystem (SI) verwendet. Allerdings wird an eini-
gen Stellen auf für den atomaren Bereich praktische Einheiten wie z. B. Ångström oder eV
zurückgegriffen.
In das vorliegende Buch sind zahlreiche Anregungen, Hinweise und Illustrationen von un-
seren Mitarbeiterinnen und Mitarbeitern sowie von verschiedenen Kolleginnen und Kolle-
gen eingeflossen. Namentlich erwähnen möchten wir insbesondere M. Althammer, L. Alff,
W. Biberacher, B. Büchner, B. S. Chandrasekhar, F. Deppe, R. Doll, D. Einzel, S. Geprägs,
S. Gönnenwein, R. Hackl, H. Hübl, M. Kartsovnik, D. Koelle, A. Lerf, M. Opel, K. Uhlig und
M. Weiler.
Die Autoren hoffen, dass diese Neuauflage ein ähnlich positives Echo findet wie die vorhe-
rigen Auflagen und weiterhin die Leser zum Dialog mit den Autoren animiert. Die von den
Lesern erhaltenen Verbesserungsvorschläge und Rückmeldungen zu Fehlern sind von un-
schätzbarem Wert. Sie können direkt an unsere elektronischen Adressen (Rudolf.Gross@
wmi.badw.de, Achim.Marx@wmi.badw.de) geschickt werden.
Vorwort V
1 Kristallstruktur 1
1.1 Periodische Strukturen – Grundbegriffe und Definitionen . . . . . . . . . . . . . . . . . . 3
1.1.1 Das Bravais-Gitter . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
1.1.2 Klassifizierung von Kristallgittern . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
1.1.3 Richtungen und Ebenen in Kristallen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20
1.1.4 Quasikristalle . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22
1.2 Einfache Kristallstrukturen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24
1.2.1 Die sc-Struktur . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
1.2.2 Die fcc-Struktur . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
1.2.3 Die bcc-Struktur . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26
1.2.4 Die hcp-Struktur . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
1.2.5 Die dhcp-Struktur. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28
1.2.6 Die Natriumchloridstruktur . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28
1.2.7 Die Cäsiumchloridstruktur . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29
1.2.8 Die Diamantstruktur . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30
1.2.9 Die Zinkblende-und Wurtzit-Struktur . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
1.2.10 Die Graphitstruktur . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
1.3 Festkörperoberflächen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35
1.4 Reale Kristalle . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37
1.4.1 Strukturelle Fehlordnung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37
1.4.2 Chemische Fehlordnung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43
1.5 Nicht-kristalline Festkörper . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44
1.5.1 Die radiale Verteilungsfunktion. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44
1.5.2 Flüssigkristalle . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46
1.6 Vertiefungsthema: Direkte Abbildung von Kristallstrukturen . . . . . . . . . . . . . . . 49
1.6.1 Elektronenmikroskopie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49
1.6.2 Rastersondentechniken . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51
Literatur . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53
VIII Inhaltsverzeichnis
2 Strukturanalyse 55
2.1 Das reziproke Gitter . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56
2.1.1 Definition des reziproken Gitters . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56
2.1.2 Fourier-Analyse . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57
2.1.3 Die reziproken Gittervektoren . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57
2.1.4 Die erste Brillouin-Zone . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61
2.1.5 Gitterebenen und Millersche Indizes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62
2.1.6 Gegenüberstellung von direktem und reziprokem Raum . . . . . . . . . . . . . . . . . . . . 65
2.2 Beugung von Wellen an periodischen Strukturen . . . . . . . . . . . . . . . . . . . . . . . . . . . 65
2.2.1 Die Bragg-Bedingung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66
2.2.2 Die von Laue Bedingung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67
2.2.3 Zusammenhang zwischen Bragg und von Laue Bedingung . . . . . . . . . . . . . . . . . 70
2.2.4 Allgemeine Beugungstheorie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71
2.2.5 Beispiele für Strukturfaktoren. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77
2.2.6 Inelastische Streuung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 78
2.2.7 Der Debye-Waller Faktor. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81
2.2.8 Vertiefungsthema: Der Mößbauer-Effekt . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 84
2.3 Experimentelle Methoden . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 87
2.3.1 Wellentypen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 87
2.3.2 Methoden der Röntgendiffraktometrie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 91
Literatur . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 94
3 Bindungskräfte 95
3.1 Grundlagen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 96
3.1.1 Bindungsenergie und Schmelztemperatur . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 96
3.1.2 Elektronische Struktur der Atome . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 97
3.2 Die Van der Waals Bindung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 102
3.2.1 Wechselwirkung zwischen fluktuierenden Dipolen . . . . . . . . . . . . . . . . . . . . . . . . . . 103
3.2.2 Abstoßende Wechselwirkung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 105
3.2.3 Gleichgewichtsgitterkonstante . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 107
3.2.4 Kompressibilität . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 109
3.3 Die ionische Bindung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 110
3.3.1 Madelungenergie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 111
3.3.2 Gleichgewichtsgitterkonstante . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 115
3.3.3 Kompressibilität . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 116
3.4 Die kovalente Bindung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 117
3.4.1 Das H+2 -Molekülion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 118
3.4.2 Das H2 -Molekül . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 122
3.4.3 Vertiefungsthema: Hybridisierung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 129
3.5 Die metallische Bindung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 136
3.5.1 Bindungsenergie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 137
Inhaltsverzeichnis IX
5 Gitterdynamik 171
5.1 Grundlegendes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 172
5.1.1 Die adiabatische Näherung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 172
5.1.2 Die harmonische Näherung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 176
5.2 Klassische Theorie. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 178
5.2.1 Bewegungsgleichungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 178
5.2.2 Kristallgitter mit einatomiger Basis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 180
5.2.3 Kristallgitter mit zweiatomiger Basis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 185
5.2.4 Gitterschwingungen – dreidimensionaler Fall . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 191
5.3 Zustandsdichte im Phononenspektrum . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 193
5.3.1 Randbedingungen. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 194
5.3.2 Zustandsdichte im Impulsraum . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 196
5.3.3 Zustandsdichte im Frequenzraum . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 196
5.4 Quantisierung der Gitterschwingungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 200
5.4.1 Das Quantenkonzept . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 200
5.4.2 Phononen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 200
5.4.3 Der Impuls von Phononen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 202
X Inhaltsverzeichnis
8 Energiebänder 315
8.1 Bloch-Elektronen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 317
8.1.1 Bloch-Wellen im Ortsraum . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 320
8.1.2 Bloch-Wellen im k-Raum . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 321
8.1.3 Der Kristallimpuls . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 322
8.1.4 Dispersionsrelation und Bandstruktur . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 323
8.1.5 Reduziertes Zonenschema . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 325
8.2 Die Näherung fast freier Elektronen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 328
8.2.1 Qualitative Diskussion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 328
8.2.2 Quantitative Diskussion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 330
8.3 Die Näherung stark gebundener Elektronen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 335
8.3.1 Beispiele: kubische Gitter . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 339
8.3.2 Weitere Methoden zur Bandstrukturberechnung . . . . . . . . . . . . . . . . . . . . . . . . . . . . 342
8.3.3 Vertiefungsthema: Spin-Bahn-Kopplung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 343
8.4 Metalle, Halbmetalle, Halbleiter, Isolatoren . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 345
8.4.1 Anzahl der Zustände pro Band . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 346
8.4.2 Halbmetalle . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 348
8.4.3 Isolatoren. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 348
8.5 Zustandsdichte und Bandstrukturen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 350
8.5.1 Zustandsdichte . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 350
8.5.2 Beispiele für Bandstrukturen. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 352
8.5.3 Experimentelle Bestimmung der Bandstruktur . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 354
8.6 Fermi-Flächen von Metallen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 358
8.6.1 Quadratisches Gitter . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 358
8.7 Wechselwirkende Elektronensysteme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 363
8.7.1 Hartree-Fock-Methode . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 364
8.7.2 Dichtefunktionaltheorie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 365
8.7.3 Hubbard-Modell . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 365
Literatur . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 367
XII Inhaltsverzeichnis
10 Halbleiter 483
10.1 Grundlegende Eigenschaften. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 485
10.1.1 Klassifizierung von Halbleitern . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 485
10.1.2 Intrinsische Halbleiter . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 489
10.1.3 Dotierte Halbleiter . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 501
10.1.4 Elektrische Leitfähigkeit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 508
10.1.5 Hall-Effekt. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 511
10.1.6 Vertiefungsthema: Seebeck- und Peltier-Effekt . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 513
10.2 Inhomogene Halbleiter. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 514
10.2.1 p-n Übergang im thermischen Gleichgewicht . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 515
10.2.2 p-n Übergang mit angelegter Spannung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 522
10.2.3 Schottky-Kontakt . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 527
10.2.4 Schottky-Kontakt mit angelegter Spannung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 529
10.3 Halbleiter-Bauelemente . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 532
10.3.1 Zener-Diode . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 532
10.3.2 Esaki- oder Tunneldiode . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 534
10.3.3 Solarzelle . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 536
10.3.4 Bipolarer Transistor . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 542
10.4 Realisierung von niedrigdimensionalen Elektronengassystemen . . . . . . . . . . . . 546
10.4.1 Zweidimensionale Elektronengase . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 546
10.4.2 Vertiefungsthema: Halbleiter-Laser . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 554
10.5 Zweidimensionales Elektronengas: Quanten-Hall-Effekt . . . . . . . . . . . . . . . . . . . . 555
10.5.1 Zweidimensionales Elektronengas im Magnetfeld . . . . . . . . . . . . . . . . . . . . . . . . . . . 556
10.5.2 Transporteigenschaften des zweidimensionalen Elektronengases . . . . . . . . . . . 558
10.5.3 Ganzzahliger Quanten-Hall-Effekt . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 560
10.5.4 Vertiefungsthema: Fraktionaler Quanten-Hall-Effekt . . . . . . . . . . . . . . . . . . . . . . . 569
Literatur . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 571
12 Magnetismus 659
12.1 Makroskopische Größen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 662
12.1.1 Die magnetische Suszeptibilität . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 662
12.1.2 Magnetische Feldstärke und Flussdichte . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 664
12.1.3 Entmagnetisierungs- und Streufelder . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 665
12.1.4 Lokales magnetisches Feld . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 666
12.1.5 Magnetostatische Selbstenergie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 667
12.2 Mikroskopische Theorie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 668
12.2.1 Dia-, Para- und Ferromagnetismus . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 668
12.3 Atomarer Dia- und Paramagnetismus . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 671
12.3.1 Atome im homogenen Magnetfeld . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 671
Inhaltsverzeichnis XV
13 Supraleitung 769
13.1 Geschichte und grundlegende Eigenschaften . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 772
13.1.1 Geschichte der Supraleitung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 772
13.1.2 Supraleitende Materialien . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 780
13.1.3 Sprungtemperaturen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 783
13.1.4 Grundlegende Eigenschaften. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 784
13.2 Thermodynamische Eigenschaften von Supraleitern . . . . . . . . . . . . . . . . . . . . . . . . 792
13.2.1 Typ-I Supraleiter im Magnetfeld . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 792
13.2.2 Typ-II Supraleiter im Magnetfeld . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 797
13.3 Phänomenologische Modelle . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 798
13.3.1 London-Gleichungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 798
13.3.2 Verallgemeinerte London Theorie – Supraleitung als makroskopisches
Quantenphänomen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 801
13.3.3 Die Ginzburg-Landau-Theorie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 813
13.4 Typ-I und Typ-II Supraleiter . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 825
13.4.1 Mischzustand und kritische Felder . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 826
13.4.2 Supraleiter-Normalleiter Grenzflächenenergie. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 827
13.4.3 Vertiefungsthema: Zwischenzustand und Entmagnetisierungseffekte . . . . . . . 829
13.4.4 Kritische Felder . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 830
13.4.5 Vertiefungsthema: Nukleation an Oberflächen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 834
13.4.6 Vertiefungsthema: Shubnikov-Phase und Flussliniengitter . . . . . . . . . . . . . . . . . . 835
13.4.7 Vertiefungsthema: Flusslinien in Typ-II Supraleitern . . . . . . . . . . . . . . . . . . . . . . . . 838
13.4.8 Kritische Stromdichte . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 843
13.5 Mikroskopische Theorie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 847
13.5.1 Attraktive Elektron-Elektron-Wechselwirkung und Cooper-Paare . . . . . . . . . . 849
13.5.2 Der BCS-Grundzustand . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 858
13.5.3 Energielücke und Anregungsspektrum . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 873
13.5.4 Quasiteilchentunneln . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 875
13.5.5 Thermodynamische Größen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 879
13.6 Josephson-Effekt . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 883
13.6.1 Die Josephson-Gleichungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 883
13.6.2 Josephson-Kontakt mit Wechselspannung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 888
13.6.3 Josephson-Kontakt im Magnetfeld . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 889
13.6.4 Supraleitende Quanteninterferometer . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 893
13.7 Kritische Ströme in Typ-II Supraleitern. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 895
13.7.1 Stromtransport im Mischzustand . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 896
13.7.2 Lorentz-Kraft . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 898
13.7.3 Reibungskraft . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 900
13.7.4 Haftkraft. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 901
13.8 Unkonventionelle Supraleitung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 903
Inhaltsverzeichnis XVII
B Quantenstatistik 963
B.1 Identische Teilchen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 963
B.1.1 Klassischer Fall: Maxwell-Boltzmann-Statistik . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 964
XVIII Inhaltsverzeichnis
C Sommerfeld-Entwicklung 977
E Symmetrietransformationen 983
E.1 Symmetrien in der Physik . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 983
E.2 Zeitumkehrtransformation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 984
E.3 Parität . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 985
E.4 Ladungskonjugation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 987
F Dipolnäherung 989
I SI-Einheiten 1015
I.1 Geschichte des SI-Systems . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1015
I.2 Die SI-Basiseinheiten . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1016
I.2.1 Einige von den SI-Einheiten abgeleitete Einheiten . . . . . . . . . . . . . . . . . . . . . . . . . . . 1017
I.3 Vorsätze . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1018
I.4 Abgeleitete Einheiten und Umrechnungsfaktoren . . . . . . . . . . . . . . . . . . . . . . . . . . . 1018
I.4.1 Länge, Fläche, Volumen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1018
I.4.2 Masse . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1019
I.4.3 Zeit, Frequenz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1019
I.4.4 Temperatur . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1019
I.4.5 Winkel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1020
I.4.6 Kraft, Druck, Viskosität . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1020
I.4.7 Energie, Leistung, Wärmemenge. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1020
I.4.8 Elektromagnetische Einheiten . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1021
Literatur 1027
Abbildungsnachweis 1031
Index 1033
Merken
Achtung, wichtiger Hinweis!
IA VIIIA
Wasserstoff 1,0079 Helium 4,0026
0,089 H 1 Alkalimetalle Erdalkalimetalle Übergangsmetalle 0,179 He 2
1s 1 Seltene Erden andere Metalle Halbmetalle/Halbleiter 1s 2
1 3,75 hex 1,731 3,57 hex 1,633 1
13,598 2,20 Nichtmetalle Halogene Edelgase 24,587 12,3
14,0 110 IIA IIIA IVA VA VIA VIIA ~1,0 (26 Atm) 26LT
Lithium 6,941 Beryllium 9,0122 Symbol
Bor 10,81 Kohlenstoff 12,01 Stickstoff 14,007 Sauerstoff 15,999 Fluor 18,998 Neon 20,18
Elementname Massenzahl
0,53 Li 3 1,85 Be 4 Magnesium 24,305 Ordnungszahl fcc kubisch-flächenzentriert 2,34 B 5 2,26 C 6 1,03 N 7 1,43 O 8 1,97 (α) F 9 1,56 Ne 10
1
2s 2 Dichte [g/cm 3 ] bcc kubisch-raumzentriert
2s 2 2p1 2s 2 2p2 2s 2 2p3 2s 2 2p4 2s 2 2p
5 2 6
2
2s 1,74 Mg 12 Elektronenkonfiguration des Atoms sc einfach kubisch
2s 2p
3,49 bcc 2,29 hex 1,567 (der häufigsten Kristallphase)
3s 2 tet tetragonal
8,73 tet 0,576 3,57 dia 4,039 hex 1,651 6,83 sc mcl 4,43 fcc 2
Verhältnis c/a und Winkel α (für rhomboedrische Struktur)
5,392 0,98 9,322 1,75 Gitterkonstante a [Å] 3,21 hex 1,624 orc orthorombisch 8,298 2,04 11,260 2,55 14,534 3,04 13,618 3,44 17,422 3,98 21,564
oder Verhältnis b/a (für orthorhombische Struktur) LT
453 400 1550 1000 1. Ionisierungsenergie [eV] 7,646 1,31 Elektronegativität (nach Pauling)
hex hexagonal 2600 1250 (4300) 1860 63,3 (ß)79 54,7 (γ)46 LT 53,5 24,5 63
22,9898 Magnesium dia Diamantstruktur
Natrium 24,305 Schmelztemperatur [K] 922 318
mittlere Debye-Temperatur [K], der Index LT kennzeichnet Aluminium 26,982 Silicium 28,086 Phosphor 30,974 Schwefel 32,064 Chlor 35,453 Argon 39,948
rhl rhomboedrisch
0,97 Na 11 1,74 Mg 12 Werte, die bei niedriger Temperatur ermittelt wurden mcl monoklin 2,70 Al 13 2,33 Si 14 1,82 P 15 2,07 S 16 2,09 Cl
17 1,78 Ar 18
3s 1 3s 2 Kristallstruktur (der häufigsten Kristallphase) 3s 2 3p 1 3s 2 3p 2 3s2 3p3 3s 2 3p 4 3s 2 3p5 3s 2 3p 6
2,339 1,324
3 4,23 bcc 3,21 hex 1,624 4,05 fcc 5,43 dia 7,17 orc 10,47 orc 1,229 6,24 orc
0,718
5,26 fcc 3
5,139 0,93 7,646 1,31 5,986 1,61 8,151 1,90 10,486 2,19 10,360 2,58 12,967 3,16 15,759
371,0 150 922 318 IIIB IVB VB VIB VIIB VIIIB VIIIB VIIIB IB IIB 933 394 1683 625 317,3 386 172,2 83,9 85
Kalium 39,09 Calcium 40,08 Scandium 44,956 Titan 47,90 Vanadium 50,942 Chrom 52,00 Mangan 54,938 Eisen 55,85 Cobalt 58,93 Nickel 58,6934 Kupfer 63,546 Zink 65,409 Gallium 69,72 Germanium 72,63 Arsen 74,92159 Selen 78,96 Brom 79,904 Krypton 83,80
0,86 K 19 1,54 Ca 20 2,99 Sc 21 4,51 Ti 22 6,1 V 23 7,19 24 7,43 Cr 25 7,86 Mn26 8,9 27 Fe Co 8,9 Ni 28 8,96 Cu
29 7,14 30 5,91 Zn 31 5,32 Ga
32 5,72 33 4,79 Ge 34 4,10 As
35 3,07 36 Se Br Kr
10
4s 1 4s 2 3d 1 4s2 3d 2 4s 2 3d 3 4s 2
5
3d 4s1
5
3d 4s2
6
3d 4s2
7
3d 4s2
8
3d 4s2
10
3d 4s 1
10
3d 4s 2 10
3d 4s 2 4p1
10
3d 4s 2 4p2
10
3d 4s 2 4p3
10
3d 4s 2 4p4 3d 4s 2 4p5 1,307 10
3d 4s 2 4p6
4 5,23 bcc 5,58 fcc 3,31 hex 1,594 2,95 hex 1,588 3,02 bcc 2,88 bcc 8,89 sc 2,87 bcc 2,51 hex 1,622 3,52 fcc 3,61 fcc 2,66 hex 1,856 4,51 orc 1,695 5,66 dia
1,001
4,13 rhl 54°10‘ 4,36 hex 1,136 6,67 orc 0,672 5,72 fcc 4
4,341 0,82 6,113 1,00 6,54 1,36 6,82 1,54 6,74 1,63 6,766 1,66 7,435 1,55 7,870 1,83 7,86 1,88 7,635 1,91 7,726 1,90 9,394 1,65 5,999 1,81 7,899 2,01 9,81 2,18 9,752 2,55 11,814 2,96 13,999
337 100 1111 230 1812 359 LT 1933 380 2163 390 2130 460 1518 400 1808 420 1768 385 1726 375 1356 315 693 234 303 240 1211 360 1090 285 490 150 LT 266 116,5 73 LT
Rubidium 85,47 Strontium 87,62 Yttrium 88,91 Zirconium 91,22 Niob 92,91 Molybdän 95,94 Technetium 98,91 Ruthenium 101,07 Rhodium 102,90 Palladium 106,40 Silber 107,87 Cadmium 112,40 Indium 114,82 Zinn 118,69 Antimon 121,75 Tellur 127,60 Jod 126,90 Xenon 131,30
1,53 Rb 37 2,60 Sr 38 4,46 Y 39 6,49 Zr
40 8,4 Nb 41 10,2 Mo 42 11,5 Tc 43 12,2 44 12,4Ru 45 Rh 12,0 Pd 46 10,5 Ag
47 8,65 48 7,31 Cd 49 7,30 In50 6,62 51 6,24 Sn 52 4,94 Sb 53 3,77 54 Te I Xe
10 1 10
5s 1 5s 2 4d 1 5s 2 4d 2 5s 2 4d 4 5s1 4d 55s 1 4d 5 5s 2 4d 7 5s 1 4d 8 5s 1 4d105s 0 10
4d 5s 1 4d 10 5s 2 4d 5s 2 5p 4d105s 25p 2 10 2
4d 5s 5p3 4d105s 2 5p4
10 2 5
4d 5s 5p 4d 5s 2 5p 6
1,347
5 5,59 bcc 6,08 fcc 3,65 hex 1,517 3,23 hex 1,593 3,30 bcc 3,15 bcc 2,74 hex 1,604 2,70 hex 1,584 3,80 fcc 3,89 fcc 1,584 4,09 fcc 2,98 hex 1,886 4,59 tet 1,076 5,82 tet 0,546 4,51 rhl 57°6‘ 4,45 hex 1,330 7,27 orc 0,659 6,20 fcc 5
4,177 0,82 5,695 0,95 6,38 1,22 6,84 1,33 6,88 1,6 7,099 2,16 7,28 1,9 7,37 2,2 7,46 2,28 8,34 2,20 7,576 1,93 8,993 1,69 5,786 1,78 7,344 1,96 8,641 2,05 9,009 2,1 10,451 2,66 12,130 2,6
LT LT
312 56 LT 1043 147 LT 1796 256 LT 2125 250 2741 275 2890 380 2445 2583 382 2239 350 1825 275 1234 215 594 120 429,8 129 505 170 904 200 723 139 LT 387 161,3 55 LT
Caesium 85,47 Barium 137,34 Hafnium 178,49 Tantal 180,95 Wolfram 183,85 Rhenium 186,2 Osmium 190,20 Iridium 192,22 Platinum 195,09 Gold 196,97 Quecksilber 200,59 Thallium 204,37 Blei 207,19 Bismut 208,98 Polonium 210 Astat 210 Radon 222
Cs 55 3,5 Ba 56 Hf 16,6 Ta
73 19,3 74 21,0 W 75 22,6 Re 77 Os 76 22,5 Ir Pt Au Hg Tl Pb Bi 83 9,4 Po At Rn
6
1,90
6,05
6s 1
bcc
6s 2 * 13,1
2 2
4f 145d 6s
3,20 hex 1,582 3,31 bcc
72
14 3 2
4f 5d 6s
14 4
4f 5d 6s2
3,16 bcc
4f 14 5d 56s 2 4f 14 5d 66s2
2,76 hex 1,615 2,74 hex 1,579 3,84 fcc
14
4f 5d 76s2
21,4
4f 14 5d 86s2
3,92 fcc
78 19,3
4f 14 5d 106s1
4,08 fcc
79 13,6
4f 14 5d 6s
10 2
10 2 1
4f 14 5d 6s 6p
80 11,85
6
5,02 bcc
3,894 0,79 5,212 0,89 7,0 1,3 7,89 1,5 7,98 2,36 7,88 1,9 8,7 2,2 9,1 2,20 9,0 2,28 9,225 2,54 10,437 6,108 1,62 7,416 2,33 7,289 2,02 8,42 2,0 9,5 2,2 10,748
302 40 LT 998 110 LT 2495 225 3683 310 3453 416
LT
3318 400 LT 2683 430 2045 230 1337 170 234,3 100 577 96 601 88 544,5 120 527 (575) (202)
Francium 223 Radium 226 Rutherfordium 261 Dubnium 262 Seaborgium 263 Bohrium 262 Hassium 265 Meitnerium 266 Darmstadtium 281 Roentgenium 280 Copernicium 277 Ununtrium Flerovium Ununpentium Livermorium Ununseptium Ununoctium
Fr Ra Rf Db Sg Bh Hs Mt Ds Rg Cn Uut Fl Uup Lv Uus Uuo
7s 1
87 (5,0)
7s 2
88
* * 2
5f 14 6d 7s 2
104
3
5f 14 6d 7s 2
105
4
5f 14 6d 7s 2
106
5
5f 14 6d 7s 2
107
6
5f 14 6d 7s 2
108
7
5f 14 6d 7s 2
109
9
5f 14 6d 7s1
110
10
5f 14 6d 7s 1
111
10
5f 14 6d 7s2
112
10
5f 14 6d 7s2 7p1
113
10
5f 14 6d 7s2 7p2
114
10
5f 14 6d 7s2 7p3
115
10
5f 14 6d 7s2 7p4
116
10
5f 14 6d 7s2 7p5
117
10
5f 14 6d 7s2 7p6
118
7 (bcc) 7
4,0 0,7 5,279 0,89
(300) 973
Seltene Erden
Lanthan 138,91 Cer 140,12 Praseodym 140,91 Neodym 144,24 Promethium 145 Samarium 150,35 Europium Gadolinium 157,25 Terbium 158,92 Dysprosium 162,50 Holmium 164,93 Erbium 167,26 Thulium 168,93 Ytterbium 173,04 Lutetium 174,97
6,17 La 57 6,77 Ce 58 6,77 Pr 59 7,00 Nd 60 Pm 61 7,54 Sm 62 7,90 Eu 63 8,23 Gd 64 8,54 Tb 65 8,78 Dy 66 9,05 Ho 67 9,37 Er 68 9,31 Tm 69 6,97 Yb 70 9,84 Lu 71
1 2 0 2 3 0 2 4 0 2 5 0 2 6 0 2 7 0 2 7 1 2 9 0 2 10 0 2 12 0 2 11 0 2 14 0 2 13 0 2 14 1 2
5d 6s 2 4f 5d 6s 4f 5d 6s 4f 5d 6s 4f 5d 6s 4f 5d 6s 4f 5d 6s 4f 5d 6s 4f 5d 6s 4f 5d 6s 4f 5d 6s 4f 5d 6s 4f 5d 6s 4f 5d 6s 4f 5d 6s
1
R. J. Haüy, Essai d’une théorie sur la structure des cristaux, Paris (1784); Traité de minéralogie, Paris
(1801).
2
W. Friedrich, P. Knipping, M. von Laue, Interferenz-Erscheinungen bei Röntgenstrahlen, Bayerische
Akademie der Wissenschaften, Sitzungsberichte, S. 303–322 (1912); Abdruck in Ann. Phys. 39,
97–100 (1912) und Ann. Phys. 41, 971–1002 (1913).
3
Walter Friedrich, geboren am 25. Dezember 1883 in Salbke bei Magdeburg, gestorben am 16. Ok-
tober 1968 in Berlin, deutscher Physiker und Pionier der Strahlenphysik.
4
Paul Knipping, geboren am 20. Mai 1883 in Neuwied am Rhein, gestorben am 26. Oktober 1935,
deutscher Physiker.
2 1 Kristallstruktur
Ein idealer Kristall ist eine unendliche Wiederholung von identischen Strukturelementen.
Wir können einen idealen Kristall immer beschreiben durch Angabe der
1. Ein Bravais-Gitter ist ein unendliches Gitter von Raumpunkten mit einer Anordnung
und Orientierung, die exakt gleich aussieht, egal von welchem Gitterpunkt wir das Gitter
betrachten.
2. Ein dreidimensionales Bravais-Gitter besteht aus allen Punkten
R = n 1 a1 + n 2 a2 + n 3 a3 , n 1 , n 2 , n 3 ganzzahlig . (1.1.2)
Die Vektoren a1 , a2 und a3 , die nicht in einer Ebene liegen dürfen, bezeichnen wir als
primitive Gittervektoren. Sie spannen das Raumgitter auf. Ihre Längen a 1 , a 2 und a 3
werden als Gitterkonstanten bezeichnet.
5
Es sei hier angemerkt, dass es in realen Kristallen natürlich Baufehler (Defekte) und Ränder gibt.
6
nach Auguste Bravais, geboren am 23. August 1811 in Annonay, gestorben am 30. März 1863 in
Le Chesnay.
7
Auguste Bravais, Études Cristallographiques, Gauthier Villars, Paris (1866).
8
Auguste Bravais, Mémoire sur les systèmes formés par les points distribués régulièrement sur un plan
ou dans l’espace, École Polytech. 19 (1850), S. 1-128.
4 1 Kristallstruktur
a2
T
R R aB
P Q P
a1
(a) (b)
Abb. 1.1: (a) Die Schnittpunkte der Linien eines Bienenwabenmusters bilden kein Bravais-Gitter, da
das Kristallgitter von Punkt P und Q aus betrachtet anders aussieht. (b) Nur die rot oder blau markier-
ten Punkte bilden ein Bravais-Gitter. Auf diese muss man dann eine zweiatomige Basis bestehend aus
jeweils einem roten und blauen Atom setzen. Die Vektoren a 1 und a 2 sind die primitiven Gittervekto-
ren, der Vektor a B gibt die Verschiebung der beiden Untergitter aus roten und blauen Kohlenstoffato-
men an.
Es kann gezeigt werden, dass beide Definitionen äquivalent sind. In Abb. 1.1 ist als Beispiel
ein zweidimensionales Bienenwaben-Gitter gezeigt. Die Schnittpunkte dieses Musters bilden
kein Bravais-Gitter. Die Anordnung der Punkte sieht zwar von Punkt P oder R aus betrachtet
identisch aus. Die Ansicht von Punkt Q aus ist dagegen um 60○ gedreht. Ein Bravais-Gitter
bilden deshalb nur jeweils die rot oder blau markierten Gitterpunkte, auf die man eine zwei-
atomige Basis bestehend aus einem roten und blauen Atom setzen muss. Ein Beispiel hierfür
ist Graphen (vergleiche Abschnitt 1.2.10), bei dem sowohl die rot als auch die blau markier-
ten Atome Kohlenstoffatome sind. Obwohl wir also nur eine Atomsorte vorliegen haben,
besitzt Graphen eine zweiatomige Basis aus zwei Kohlenstoffatomen.
Eine analoge Formulierung von (2) ist, dass ein Bravais-Gitter invariant gegenüber diskreten
Translationen um den Translationsvektor
T = n 1 a1 + n 2 a2 + n 3 a3 n 1 , n 2 , n 3 ganzzahlig (1.1.3)
𝒂′𝟐
𝒂𝟐
𝒂′′′
𝟐
𝒂𝟏 𝒂′𝟏 𝒂′′′
𝟏
𝒂′′
𝟐 𝑻
Abb. 1.2: Gitterpunkte eines zweidi- (a)
mensionalen (a) und eines dreidi- 𝒂′′
𝟏
mensionalen (b) Bravais-Gitters und
einige Möglichkeiten für die Wahl
der primitiven Gittervektoren. Die
Vektoren a ′1,2 und a ′′1,2 sind keine
primitiven Translationsvektoren,
da wir die Gittertranslation T nicht 𝒂𝟑
mit ganzzahligen Kombinationen 𝒂𝟐
von a ′1,2 und a ′′1,2 bilden können. (b) 𝒂𝟏
𝐑 = 𝑛1 𝐚1 + 𝑛2 𝐚2 + 𝑛3 𝐚3 mit 𝑛1 , 𝑛2 , 𝑛3 ganzzahlig
1.1 Periodische Strukturen – Grundbegriffe und Definitionen 5
ist. Zwei Punkte eines Bravais-Gitters sind immer durch einen Vektor T miteinander verbun-
den. Greifen wir einen beliebigen Punkt r eines Kristalls heraus, so gilt für dessen Umgebung
𝒰(r) wegen der Translationsinvarianz des Gitters immer 𝒰(r) = 𝒰(r + T).
Ein Nachteil der Definition (2) ist, dass die Wahl der primitiven Gittervektoren nicht ein-
deutig ist, wie in Abb. 1.2 dargestellt ist.
Vc = (a1 × a2 ) ⋅ a3 (1.1.4)
gegeben. Verschieben wir das Volumen der primitiven Gitterzelle um den Translationsvek-
tor T, so füllen wir den gesamten Raum aus, ohne dass Überlappungen oder Löcher entste-
hen. Wie Abb. 1.3 zeigt, gibt es wiederum eine Vielzahl von Möglichkeiten für die Wahl der
primitiven Gitterzelle. Diese muss auch nicht die Symmetrie des Gitters haben. Eine primi-
tive Gitterzelle enthält aber immer genau einen Gitterpunkt und alle primitiven Gitterzellen
besitzen das gleiche Volumen. Ist die Gitterzelle ein Paralellogramm mit Gitterpunkten an
allen Ecken, so ist die Anzahl der Gitterpunkte pro primitiver Gitterzelle auch nur 14 ⋅ 4 = 1,
da jeder Gitterpunkt mit vier benachbarten Zellen geteilt wird.
(a) (b)
109°28´
60°
(a) (b)
Abb. 1.4: Primitive (Blautöne) und konventionelle Zelle (Würfel) für ein kubisch raumzentriertes (a)
und ein kubisch flächenzentriertes (b) Bravais-Gitter.
man meist mit einer kubischen Einheitszelle, die viermal so groß ist wie die primitive Zelle
(siehe Abb. 1.4). Die Längen, die die Größe der Einheitszelle beschreiben, so wie die Länge
a bei einem kubischen Kristall, werden Gitterkonstanten genannt.
1.1.1.3 Wigner-Seitz-Zelle
Wir können immer eine primitive Gitterzelle mit der vollen Symmetrie des Bravais-Gitters
auswählen. Die am häufigsten verwendete Wahl ist die Wigner-Seitz-Zelle.9 Die Wigner-
Seitz-Zelle um einen Gitterpunkt ist derjenige Bereich, der diesem Gitterpunkt näher ist als
irgendeinem anderen Gitterpunkt. Aufgrund der Translationssymmetrie des Bravais-Gitters
muss die Wigner-Seitz-Zelle um irgendeinen Gitterpunkt in eine um einen anderen Gitter-
punkt überführt werden, wenn sie um den Translationsvektor T verschoben wird.
9
Eugene Paul Wigner, geboren am 17. November 1902 in Budapest,
Konstruktion der Wigner-Seitz
gestorben am 1. JanuarZelle
1995
in Princeton, ungarisch-amerikanischer Physiker. Er erhielt 1963 zusammen mit J. Hans D. Jensen
und Maria Goeppert-Mayer der Nobelpreis für Physik „für seine Beiträge zur Theorie des Atom-
kerns und der Elementarteilchen, besonders durch die Entdeckung und Anwendung fundamentaler
Symmetrie-Prinzipien“.
Frederik Seitz, geboren am 4. Juli 1911 in San Francisco, gestorben am 2. März 2008 in New York.
US-amerikanischer Physiker, er war von 1962 bis 1969 Präsident der National Academy of Sciences
und von 1968 bis 1978 Präsident der Rockefeller University in New York.
1.1 Periodische Strukturen – Grundbegriffe und Definitionen 7
Abb. 1.5 zeigt die Wigner-Seitz-Zelle eines zweidimensionalen Bravais-Gitters. Sie wird
erhalten, indem wir Verbindungslinien von dem betreffenden Gitterpunkt zu den Nach-
barpunkten ziehen und auf den Mittelpunkten der Verbindungslinien Geraden (bei dreidi-
mensionalen Gittern Flächen) senkrecht zu den Verbindungslinien zeichnen. Die kleinste
umschlossenen Fläche (Volumen) ist die Wigner-Seitz-Zelle.
1.1.2.1 Symmetrieoperationen
Das Problem der Klassifizierung von Kristallstrukturen ist sehr komplex und wir wollen hier
nur die Grundzüge erläutern. Vom Standpunkt der Symmetrie aus betrachtet ist ein Kristall-
gitter durch alle geometrischen Operationen charakterisiert, die es in sich selbst überführen.
Solche Operationen nennen wir Symmetrieoperationen. Das zu einer Symmetrieoperati-
on gehörende geometrische Objekt bezeichnen wir als Symmetrieelement. Das Symmetrie-
element bilden alle Punkte, die bei dieser Bewegung unverändert bleiben. Zum Beispiel ge-
hört zur Operation der Spiegelung an einer Ebene als Symmetrieelement die Spiegelebene,
zur Drehung um eine Achse als Symmetrieelement die Drehachse.
10
siehe zum Beispiel M. J. Buerger, Elementary Crystallography, John Wiley & Sons, New York (1963).
8 1 Kristallstruktur
Als einfaches Beispiel betrachten wir die in Abb. 1.6 gezeigte eindimensionale Kette von
Atomen mit Abstand a. Symmetrieoperationen sind (i) Translationen um na, wobei n eine
ganze Zahl ist, (ii) die Drehung um 180○ und (iii) die Spiegelung an der Mittelsenkrechten
zwischen zwei Gitterpunkten.
Im Allgemeinen beinhalten die Symmetrieoperationen eines Kristallgitters Translationen,
Rotationen, Spiegelungen und die Inversion. Diese Symmetrieoperationen werden in
1. die Translationsgruppe, die alle Symmetrieoperationen beinhaltet, bei denen kein orts-
fester Punkt existiert, und
2. die Punktgruppe, die alle Symmetrieoperationen beinhaltet, bei denen mindestens ein
Punkt ortsfest bleibt,
unterteilt. Dies ist deshalb möglich, da wir alle Symmetrieoperationen eines Bravais-Gitters
durch eine Translation und eine Operation, bei der mindestens ein Gitterpunkt fest bleibt,
zusammensetzen können. Symmetrieoperationen, die durch die sukzessive Anwendung von
Operationen aus der Translationsgruppe und der Punktgruppe erhalten werden, führen zu
den Raumgruppen oder Gitterpunktgruppen.
11
Die geeignetste Art der graphischen Darstellung einer Kristallform oder auch ihrer Symmetrie-
gruppe, ist die stereographische Projektion. Wir erhalten sie nach folgendem Konstruktionsprin-
zip:
∎ Wir legen eine Kugel konzentrisch um den Kristall.
∎ In den Durchstosspunkten der Flächennormalen mit der Kugeloberfläche erhalten wir die Flä-
chenpole.
∎ Wir verbinden die Flächenpole der Nordhemisphäre mit dem Südpol und die der Südhemi-
sphäre mit dem Nordpol. Die Projektion der Flächenpole längs der Verbindungslinien auf die
Äquatorialebene nennen wir stereographische Projektion.
∎ Ebenso können wir mit den Durchstosspunkten von Drehachsen oder den Schnittkreisen
von Spiegelebenen verfahren und erhalten dann die stereographische Projektion der zu einer
Punktsymmetriegruppe gehörenden Symmetrieelemente.
1.1 Periodische Strukturen – Grundbegriffe und Definitionen 9
1 2 3 4 6
2 2 3 2
2 3 4
1 1 3 1 1 1
4 5 6
1̅ (i) 2̅ (m) 3̅ 4̅ 3
6̅
5 3
1 1 3 1 1
1 5
6
2 4 6 4
2 4
2 2 2
Abb. 1.7: Zur Veranschaulichung der zehn Symmetrieoperationen der Punktgruppe für ein drei-
dimensionales System. Es wird die in der Kristallographie übliche Symbolik verwendet.
2-, 3-, 4- und 6-zähligen Drehachsen, die wir mit den Symbolen 2, 3, 4 und 6 bezeich-
nen. Es kann streng bewiesen werden, dass für einen periodischen Kristall nur 2-, 3-,
4- und 6-zähligen Drehachsen möglich sind. Alle anderen Ordnungen von Drehachsen
sind inkompatibel mit der Translationssymmetrie.
2. Inversion:
Die Inversionssymmetrie wird durch die Koordinatentransformation x ′ = −x, y ′ = −y,
z ′ = −z beschrieben. Dies kann als eine Punktspiegelung an einem Inversions- oder Sym-
metriezentrum verstanden werden. Das Vorhandensein eines Inversionszentrums wird
mit dem Symbol 1 oder i charakterisiert.
3. Spiegelung an einer Ebene:
Bei der Spiegelung werden im Gegensatz zu einer Drehung nicht nur die Punkte auf einer
Achse, sondern die Punkte auf einer ganzen Ebene festgehalten. Diese Symmetrieoperati-
on kann mathematisch durch eine Koordinatentransformation ausgedrückt werden. Für
die Spiegelung an der yz-Ebene gilt zum Beispiel die Transformation: x ′ = −x, y′ = y,
z ′ = z. Das Vorhandensein einer Spiegelebene in einer Kristallstruktur wird durch das
Symbol 2 oder m charakterisiert.
Außer Drehachsen, der Spiegelebene und dem Inversionszentrum gibt es noch weitere Arten
von Symmetrieoperationen mit konstantem Punkt, die sich aber aus den genannten durch
sukzessives Ausführen zusammensetzen lassen. Dabei ist extrem wichtig, dass die einzel-
nen Symmetrieoperationen nicht notwendigerweise möglich sind. Die Definitionen dieser
Symmetrieelemente sind bei der Hermann-Mauguin- und bei der Schönflies-Nomenklatur
leider grundsätzlich unterschiedlich: (i) In der Schönflies-Nomenklatur werden n-zählige
Drehspiegelachsen definiert. Einer Drehung um 2π⇑n folgt eine Spiegelung an der Ebene
senkrecht zur Drehachse. Die Bezeichnung ist Sn . (ii) In der Hermann-Mauguin-Nomen-
klatur werden dagegen n-zählige Drehinversionsachsen eingeführt. Der Drehung um 2π⇑n
folgt hier eine Punktspiegelung, die Bezeichnung ist n.
10 1 Kristallstruktur
4. Drehinversion:
Wir können die Inversion mit einer Drehung um eine Achse durch das Inversionszen-
trum verknüpfen, um die neue Symmetrieoperation der Drehinversion zu erhalten. Sie
wird charakterisiert durch die Symbole 1, 2, 3, 4 und 6. Da das Vorhandensein eines In-
versionszentrums immer mit einer einzähligen Drehinversionsachse zusammenfällt, das
heißt i = 1 gilt, wird das Symbol i meist nicht verwendet. Ferner kann die Spiegelung an
einer Ebene durch eine Drehinversion um 180○ , d. h. durch eine Drehung um 2π⇑2 und
anschließende Inversion, realisiert werden. Da also m = 2 gilt, wird auch das Symbol m
oft nicht verwendet.
5. Drehspiegelung:
Wir können eine Drehung mit anschließender Spiegelung an einer Ebene senkrecht zur
Drehachse verknüpfen. S1 , d. h. n = 1, entspricht einer Drehung um 2π, die von einer
Spiegelung gefolgt wird. Dies ist natürlich identisch ist mit eine einfachen Spiegelung,
wobei die Spiegelebene senkrecht zur Drehspiegelachse erläuft. S1 ist also kein neues
Symmetrieelement sondern die altbekannte Spiegelung. Bei S2 , d. h. n = 2, folgt die Spie-
gelung auf eine Drehung um π, woraus wiederum ein schon bekanntes Symmetrieele-
ment, nämlich die Inversion resultiert. S3 bedeutet eine Drehung um 2π⇑3, die von einer
Spiegelung gefolgt wird. Das Ergebnis entspricht einer 3-zähligen Achse, auf der eine
Spiegelebene senkrecht steht. Bei S4 erfolgt die Drehung um 2π⇑4 gefolgt von einer Spie-
gelung. Hieraus ergibt sich ein neues Symmetrieelement, das z. B. bei einem Tetraeder
vorliegt. S6 (Drehung um 2π⇑6 und Spiegelung) entspricht zwar dem Vorliegen einer
dreizähligen Drehachse mit zusätzlichem Inversionszentrum, wird aber trotzdem als ei-
genes Symbol eingeführt und verwendet. Es ist ein sehr wichtiges Symmetrieelement der
anorganischen Chemie, das bei Oktaedern vorliegt.
12
Zwei Symmetriegruppen sind identisch, wenn sie genau die gleichen Operationen enthalten. Zum
Beispiel ist der Satz von Symmetrieoperationen eines Würfels identisch zu dem eines Oktaeders.
13
Benannt ist diese Symbolik nach den beiden Kristallographen Carl Hermann (Professor für Kris-
tallographie, geboren am 17. Juni 1898 in Wesermünde bei Bremerhaven, gestorben am 12. Sep-
tember 1961) und Charles-Victor Mauguin (Professor für Mineralogie, geboren am 19. Juli 1878
in Provins, Frankreich, gestorben am 25. April in 1958 in Villejuif, Frankreich).
1.1 Periodische Strukturen – Grundbegriffe und Definitionen 11
Tabelle 1.1: Zusammenstellung der 32 Kristallklassen. Für die Symbolik wird sowohl die Nomenklatur
nach Hermann und Mauguin sowie nach Schoenflies verwendet.
1. n entspricht C n , z. B. 6 ≡ C 6 .
2. nmm entspricht C nv , z. B. 6mm ≡ C 6v .
3. n22 entspricht D n .
12 1 Kristallstruktur
Tabelle 1.2: Die Schoenflies Notation für die Punktgruppen (C steht für „cyclic“, D für „dihedral“ und
S für „Spiegel“).
Symbol Bedeutung
Klassifizierung nach Hauptdrehachsen und Spiegelebenen
Cn (n = 2, 3, 4, 6), n-zählige Drehachse
Sn n-zählige Drehinversionsachse
Dn n-zählige Drehachse senkrecht zu einer Hauptdrehachse
T 4 drei- und 3 zweizählige Drehachsen wie beim Tetraeder
O 3 vier- und 4 dreizählige Drehachsen wie beim Oktaeder
Ci Inversionszentrum
Cs Spiegelebene
zusätzliche Symbole für Spiegelebenen
h horizontal = senkrecht zur Drehachse
v vertikal = parallel zur Drehachse
d diagonal = parallel zur Hauptdrehachse in der Ebene, die die zweifachen Drehachsen halbiert
Bezüglich der anderen Kategorien existieren einige subtile Unterschiede, die wir hier nicht
diskutieren wollen.14 Im Allgemeinen bezeichnet bei der internationalen Notation das Sym-
bol n eine Gruppe mit einer n-zähligen Drehinversionsachse, n⇑m eine Gruppe mit einer
n-zähligen Drehachse und einer Spiegelebene parallel zur Hauptdrehachse, was bis auf ei-
nige Ausnahmen C nh entspricht. Zur Veranschaulichung der Notationen sind in Abb. 1.8
einige Beispiele gezeigt.
𝐎𝐡 𝐎
𝒎𝟑𝒎 𝟒𝟑𝟐
𝐓𝐡 𝐓𝐝 𝐓
Die 7 Kristallsysteme Sinnvollerweise wird für die Beschreibung von Kristallen und Kris-
tallstrukturen kein kartesisches Koordinatensystem, sondern ein an das Kristallsystem an-
gepasstes Koordinatensystem verwendet, mit dem die Beschreibung der Kristallsymmetrie
besonders einfach wird.15 Es kann gezeigt werden, dass es sinnvoll ist, genau sieben unter-
14
W. Kleber, H.-J. Bautsch, J. Bohm, D. Klimm, Einführung in die Kristallographie, Oldenbourg Ver-
lag, München (2010).
15
J. J. Burckhardt, Die Symmetrie der Kristalle, Birkhäuser Verlag, Basel (1988).
1.1 Periodische Strukturen – Grundbegriffe und Definitionen 13
⎛ −1 0 0 ⎞
r′ = ⎜ 0 1 0 ⎟ r (zweizählige Achse) (1.1.5)
⎝ 0 0 −1 ⎠
⎛1 0 0⎞
r′ = ⎜ 0 −1 0 ⎟ r (Spiegelebene) (1.1.6)
⎝0 0 1⎠
⎛ −1 0 0 ⎞
r′ = ⎜ 0 −1 0 ⎟ r (Inversionszentrum) (1.1.7)
⎝ 0 0 −1 ⎠
Hätten wir ein anderes Koordinatensystem gewählt, so hätten wir zwar auch 3 × 3-Matrizen
für die Symmetrieoperationen erhalten, sie wären aber nicht so einfach gewesen. Wir sehen
also, dass die mit dem monoklinen Kristallsystem verbundene Wahl des Koordinatensystems
besonders für die betrachteten Kristallklassen 2, m und 2⇑m geeignet ist.
16
Christian Samuel Weiss, geboren am 26. Februar 1780 in Leipzig; gestorben am 1. Oktober 1856
bei Eger in Böhmen, deutscher Mineraloge und Kristallograph.
17
C. S. Weiss, Über die natürlichen Abtheilungen der Crystallisationssysteme, Abhandl. k. Akad. Wiss.,
Berlin 1814-1815, S. 290-336.
14 1 Kristallstruktur
Tabelle 1.3: Die sieben Kristallsystem Anzahl der Achsen und Winkel Achsen-
Kristallsysteme im dreidi- Gitter zähligkeit
mensionalen Raum. Die kubisch 3 a=b=c 3 (vier)
Anzahl der Gitter gibt α = β = γ = 90○
a=b≠c
die Anzahl der mögli-
tetragonal 2 4
α = β = γ = 90○
chen zentrierten Gitter an.
rhombisch 4 a≠b≠c 2 (zwei)
α = β = γ = 90○
hexagonal 1 a=b≠c 6
α = β = 90○ , γ = 120○
trigonal 1 a=b=c 3
(rhomboedrische α = β = γ < 120○ , ≠ 90○
Aufstellung)
monoklin 2 a≠b≠c 2
α = γ = 90○ ≠ β
triklin 1 a≠b≠c 1
α≠β≠γ
(a) (b)
in Abb. 1.9(b) nicht der Fall ist. In Abb. 1.9(a) finden wir zusätzlich zu den vier dreizäh-
ligen Drehachsen, die wir für das kubische System gefordert haben, noch drei vierzählige
Drehachsen und Spiegelebenen. Wir können uns auch noch andere Basiskonfigurationen
überlegen, die neben den vier dreizähligen Achsen noch weitere Symmetrieelemente auf-
weisen. In Abb. 1.9(b) finden wir nur noch zwei zweizählige Drehachsen und eine geringere
Zahl von Spiegelebenen. Eine systematische Analyse ergibt gerade, dass es insgesamt fünf
verschiedene Anordnungen gibt, so dass wir das kubische Kristallsystem in fünf Kris-
tallklassen unterteilen können (siehe hierzu Tabelle 1.1). Entsprechende Überlegungen
können wir für die anderen Kristallsysteme durchführen. Zählen wir dann die möglichen
Punktgruppen bzw. Kristallklassen ab, deren Symmetrieoperationen eine allgemeine Kris-
tallstruktur in sich selbst überführen, wobei ein Punkt festgehalten wird, so erhalten wir die
Zahl 32. Diese Zahl muss mit den 7 kristallographischen Punktgruppen (Kristallsystemen)
verglichen werden, die wir erhalten, wenn wir für die Basis die volle Symmetrie des Gitters
annehmen. Die möglichen Zahlen für die Punkt- und Raumgruppen sind in Tabelle 1.4
zusammengefasst.
Natürlich muss ein Festkörperphysiker nicht alle 32 Kristallklassen und 230 Raumgruppen
parat haben, er muss nur von ihrer Existenz wissen. In der Praxis beschäftigt man sich meist
nur mit wenigen konkreten Fällen und man braucht nicht alle möglichen Situationen auf
Vorrat lernen. In zwei Dimensionen gibt es nur 10 Kristallklassen und 17 Raumgruppen.
Die vierzehn Bravais-Gitter Wir betrachten nun genauer den Fall, dass wir zu allen Sym-
metrieoperationen der Punktgruppe (mindestens) einen universellen Translationsvektor des
Gitters hinzufügen. Zu beachten ist dabei, dass wir dadurch unter Umständen keine pri-
mitive Basis mehr erhalten. Es ist dann nötig zusätzlich zum Kristallsystem noch die Zen-
trierung anzugeben. Gitter mit dieser Eigenschaft heißen zentrierte Gitter, nicht-zentrierte
Gitter nennen wir primitiv und bezeichnen sie mit dem Gittersymbol P. Es wurde von Au-
guste Bravais gezeigt, dass man bei der Anwendung aller möglichen Zentrierungen zu insge-
samt 14 Gittertypen kommt, die nach ihm als Bravais-Gitter bezeichnet werden.22 Auguste
22
Diese Zählung wurde zwar zuerst von M. L. Frankheim im Jahr 1842 durchgeführt. Allerdings
erhielt Frankheim mit 15 verschiedenen Gittern ein falsches Ergebnis.
16 1 Kristallstruktur
Bravais23 war schließlich im Jahr 1845 der erste, der die Anzahl der verschiedenen Bravais-
Gittern mit 14 richtig bestimmte. Das heißt, vom Standpunkt der Symmetrie aus betrachtet
müssen wir nur 14 Bravais-Gitter unterscheiden. Unter den zentrierten Gittern unterschei-
den wir zwischen einseitig flächen- oder basiszentrierten Gittern, die wir mit den Symbo-
len A, B, C bezeichnen, je nachdem welche Fläche der Elementarzelle betroffen ist. Allseitig
flächenzentrierte Gitter bezeichnen wir mit dem Symbol F und innenzentrierte Gitter mit
dem Symbol I (vergleiche Abb. 1.11). Ein zentriertes Gitter können wir uns aus mehreren
primitiven Gittern entstanden denken, die gegeneinander durch einen universellen Trans-
lationsvektor verschoben sind. Beim innenzentrierten Gitter ist der universelle Translati-
onsvektor eine halbe Raumdiagonale und das zentrierte Gitter ist zweifach primitiv. Beim
allseitig flächenzentrierten Gitter sind alle halben Flächendiagonalen universelle Translati-
onsvektoren und das resultierende zentrierte Gitter ist dann vierfach primitiv.24
Die Verwendung von zentrierten Gittern ist sinnvoll, weil in vielen Fällen die primitiven
Elementarzellen die Symmetrie der Punktgitter nicht zum Ausdruck bringen. Ein Beispiel
dafür ist in Abb. 1.10 gezeigt. Würden wir die durch die primitiven Gittervektoren a′ und
b′ aufgespannte primitive Gitterzelle zugrundelegen, so würden wir ein schiefwinkliges Git-
ter vermuten. Die vorliegende Symmetrie wird viel besser durch das mit den Gittervektoren
a und b aufgespannte innenzentrierte Rechteckgitter beschrieben. Der von a und b einge-
schlossene Winkel beträgt 90○ und es treten zusätzlich noch zwei Spiegelebenen auf.
𝒃′ 𝒃
Abb. 1.10: Zur Verwendung von zentrier-
ten Gittern: Die von a′ und b′ aufgespann-
𝒂′
te primitive Gitterzelle spiegelt im Ge-
gensatz zur der von a und b aufgespann-
ten, nicht-primitiven rechteckigen Zelle
𝒂
nicht die volle Symmetrie des Gitters wider.
zentrierte Gitter:
′
Wir haben bei der Diskussion der 7 Kristallsysteme und 𝑏 ′ aufgespannte
Die von 𝑎bereits daraufprimitive
hingewiesen, dass
Gitterzelle spiegelt es sinn-
im Gegensatz zur der von 𝑎 und 𝑏
aufgespannten, nicht-primitiven rechteckigen Zelle nicht die volle Symmetrie des Gitters wider.
voll ist, für jedes Kristallsystem ein an die Symmetrie angepasstes Koordinatensystem zu
verwenden. Wir führen also für jedes Kristallsystem ein ganz bestimmtes Bezugssystem ein,
welches durch die drei Kristallachsen mit den Längeneinheiten a, b und c und den Achsen-
winkeln α, β und γ gegeben ist. Eine Zusammenstellung der Kristallachsen und der Ach-
senwinkel ist in Tabelle 1.3 gegeben. Durch die Kristallachsen wird ein Parallelepiped, die
so genannte Einheitszelle aufgespannt. Die Länge a, b und c der Kristallachsen bezeichnen
wir als Gitterkonstanten. Wir wollen im Folgenden die sieben Kristallsysteme und die ihnen
zugeordneten Bravais-Gitter anhand von Abb. 1.11 kurz diskutieren.
23
Auguste Bravais, geboren am 23. August 1811 in Annonay, gestorben am 30. März 1863 in Ver-
sailles.
24
Ein Sonderfall liegt beim hexagonalen System vor. Dort ist ein dreifach primitives zentriertes Gitter
möglich, das aber durch Transformation der hexagonalen Elementarzelle in eine rhomboedrische
Elementarzelle in ein primitives Gitter übergeht. Ein solches Gitter nennen wir rhomboedrisch
und kennzeichnen es mit dem Symbol R.
1.1 Periodische Strukturen – Grundbegriffe und Definitionen 17
3 rhombisch
P I C F
6 monoklin 7 triklin
P C P
Abb. 1.11: Die 14 Bravais-Gitter. Die Elementarzelle des hexagonalen Gitters ist primitiv und umfasst
nur das blau schattierte reguläre Prisma.
(a) (b)
(c) (d)
120°
Die sieben Kristallsysteme und vierzehn Bravais-Gitter erschöpfen die Möglichkeiten. Dies
ist natürlich nicht evident und schwierig zu beweisen. Für die Praxis ist es aber nicht relevant
zu verstehen, warum dies die einzigen unterscheidbaren Gittertypen sind. Es soll uns hier
genügen zu wissen, warum diese Kategorien existieren und was sie sind.25
Sind die Schnittpunkte einer Ebene zum Beispiel 4a, b und 2c, so sind die entsprechenden
Kehrwerte 14 , 11 und 12 und somit die kleinsten ganzen Zahlen mit dem gleichen Verhält-
nis 1, 4 und 2. Die Ebene ist dann durch das Zahlentripel (142) charakterisiert. Die Zah-
lentripel (hkℓ) werden als Millersche Indizes26 bezeichnet. Für einen Schnittpunkt, der im
Unendlichen liegt, wird der entsprechende Index 0. Liegt der Schnittpunkt einer Ebene bei
25
W. Kleber, H.-J. Bautsch, J. Bohm, D. Klimm, Einführung in die Kristallographie, Oldenbourg Ver-
lag, München (2010).
26
nach William Hallowes Miller, geboren am 6. April 1801 in Llandovery, Carmarthenshire, gestor-
ben am 20. Mai 1880 in Cambridge, England, britischer Mineraloge und Kristallograph.
1.1 Periodische Strukturen – Grundbegriffe und Definitionen 21
𝒃 𝒃 𝒃
𝒂 𝒂 𝒂
𝒄 (𝟐𝟎𝟎) (𝟎𝟏𝟎) 𝒄 𝒄 (𝟐𝟐𝟏)
Abb. 1.14: Millersche In-
dizes für einige Ebenen in
einem kubischen Kristall.
Die (200)-Ebene ist zwar
𝒃 𝒃 𝒃 parallel zur (100)-Ebene,
ist aber nicht äquivalent zu
dieser.
𝒂 𝒂 𝒂
einem negativen Wert, so wird dies durch einen Querstrich über dem betreffenden Index an-
gezeigt, z. B. (142). Einige Beispiele sind in Abb. 1.14 gezeigt. Wichtig ist, dass ein einziges
Zahlentripel nicht nur eine bestimmte Ebene, sondern einen ganzen Satz von (unendlich
vielen) parallelen Ebenen bezeichnet. Erscheinen die Millerschen Indizes in geschweiften
Klammern, dann beziehen sie sich auf äquivalente Ebenen in einem Kristall. Zum Beispiel
werden sämtliche Oberflächen eines Würfels mit dem Symbol {100} charakterisiert, obwohl
ihre Millerschen Indizes unterschiedlich sind.
In gleicher Weise wie Kristallebenen können wir auch Richtungen klassifizieren. Die Indi-
zes (︀uvw⌋︀ einer Kristallrichtung sind durch den Satz kleinster ganzer Zahlen gegeben, die
das gleiche Verhältnis haben wie die Komponenten eines Vektors R = uâ + v b̂ + wĉ in die-
se Richtung bezüglich der Kristallachsen. Wird eine Richtung zum Beispiel durch die Vek-
torkomponenten 8a, 4b und 2c charakterisiert, so bezeichnen wir dies Richtung mit den
Indizes (︀421⌋︀.
Für Kristalle mit einem hexagonalen Kristallgit- 𝒄
(𝟎𝟎𝟎𝟏)
ter liefern die Millerschen Indizes, wenn wir sie Indizierung der Netze
nach dem obigen Verfahren bestimmen, unter einem hexagonalen G
1.1.4 Quasikristalle
Wir haben in Abschnitt 1.1.2 bereits darauf hingewiesen, dass wir zwar auf jeden Gitterpunkt
eines Bravais-Gitters ein Molekül mit einer fünfzähligen Rotationsachse setzen können, das
Gitter dagegen keine fünfzählige Achse besitzen kann. Abb. 1.16 zeigt, was passiert, wenn
wir versuchen ein periodisches Gitter mit Strukturelementen zu konstruieren, die eine fünf-
zählige Symmetrie aufweisen. Wir sehen sofort, dass die Fünfecke nicht zusammenpassen
und wir deshalb den Raum nicht vollständig mit diesen Elementen ausfüllen können.27 Wir
erhalten ein geordnetes Gebilde, das einer quasiperiodischen Anordnung von zwei verschie-
denen Strukturelementen entspricht. Wir nennen ein solches Gebilde einen Quasikristall.
In Quasikristallen sind die Atome bzw. Moleküle zwar scheinbar regelmäßig angeordnet,
eine nähere Betrachtung zeigt aber, dass in Wahrheit eine aperiodische Struktur vorliegt.
Experimentell entdeckt wurden die Quasikristalle im Jahr 1984 von Daniel Shechtman,28
dem dafür 2011 der Nobelpreis für Chemie verliehen wurde. Er fand bei der Kristallstruk-
turanalyse einer schnell abgekühlten Aluminium-Mangan-Legierung (14% Mangan) eine
ungewöhnliche Struktur, welche bei Elektronenbeugungsaufnahmen scharfe Bragg-Reflexe
zeigte und die Symmetrie eines Ikosaeders besaß. Dies ist für kristalline Substanzen sehr un-
gewöhnlich, da bei dieser Symmetrie keine Gitterverschiebungen möglich sind und damit
keine periodische Struktur, wie sie für die Definition eines Kristalls nötig ist, vorliegt. We-
sentlich zum Verständnis diesen Befunds trugen Paul Steinhardt und Dov Levine bei, die
für diesen neuen Phasentyp den Begriff Quasikristall prägten.29
Wir wollen uns zunächst die wesentlichen Unterschiede zwischen einem Kristall und einem
Quasikristall klar machen. Wir wissen, dass in einem normalen Kristall die Atome bzw. Ba-
siseinheiten in einer periodischen Struktur angeordnet sind. Diese wiederholt sich in jeder
der drei Raumrichtungen. Jede Gitterzelle ist von Zellen umgeben, die ein identisches Muster
bilden. In einem Quasikristall sind dagegen die Atome bzw. Basisteinheiten nur quasiperi-
odisch angeordnet. Lokal finden wir zwar eine regelmäßige Struktur, auf globalem Maßstab
ist die Struktur aber aperiodisch, das heißt, jede Zelle ist von einem jeweils anderen Muster
umgeben. Ein besonders bemerkenswerter Unterschied zwischen Kristallen und Quasikris-
tallen ist, dass Letztere eine fünf-, acht-, zehn- oder zwölfzählige Symmetrie aufweisen. In
normalen Kristallen sind dagegen nur ein-, zwei-, drei-, vier-, und sechszählige Symmetrien
möglich. Das ergibt sich daraus, dass der Raum nur auf diese Art mit kongruenten Teilen ge-
füllt werden kann. Wir weisen auch darauf hin, dass Quasikristalle zwar keine periodischen
Strukturen besitzen, aber scharfe Beugungsreflexe zeigen. Es existiert ferner eine wichtige
Beziehung zwischen den Quasikristallen und der in Abb. 1.16 gezeigten Penrose-Parkettie-
rung, die Roger Penrose bereits vor der Entdeckung der Quasikristalle gefunden hatte. Wenn
wir einen Quasikristall geeignet durchschneiden, zeigt die Schnittfläche gerade das Muster
der Penrose-Parkettierung.
Um uns den Begriff quasiperiodisch verständlich zu machen, verwenden wir eine geome-
trische Betrachtung. Es ist evident, dass wir ein periodisches Muster von Atomen komplett
um einen bestimmten Abstand so verschieben können, dass jedes verschobene Atom wieder
genau die Stelle eines entsprechenden Atoms im Originalmuster einnimmt. In einem quasi-
periodischen Muster ist eine solche Parallelverschiebung des gesamten Musters nicht mög-
lich. Allerdings können wir jeden beliebigen Ausschnitt so verschieben, dass er deckungs-
gleich mit einem entsprechenden Ausschnitt ist (ggf. nach einer Rotation). Interessant ist,
dass wir jedes quasiperiodische Punktmuster aus einem periodischen Muster in einer höhe-
ren Raumdimension konstruieren können. Dies ist in Abb. 1.17 für einen eindimensionalen
24 1 Kristallstruktur
𝟏+ 𝟓
Steigung 𝒈−𝟏 mit 𝒈 = (goldener Schnitt)
𝟐
Quasikristall veranschaulicht. Um ihn zu erzeugen, können wir mit einer periodischen An-
ordnung von Punkten in einem zweidimensionalen Raum beginnen. Der eindimensionale
Raum sei ein linearer Unterraum, der den zweidimensionalen Raum in einem bestimmten
Winkel durchdringt. Wenn wir jeden Punkt des zweidimensionalen Raumes, der sich in-
nerhalb eines bestimmten Abstandes zum eindimensionalen Unterraum befindet, auf den
Unterraum projizieren und der Winkel eine irrationale Zahl darstellt (zum Beispiel der Gol-
dene Schnitt), dann erhalten wir ein quasiperiodisches Muster.
Quasikristalle kommen vor allem in ternären Legierungssystemen vor, also solchen mit drei
Legierungselementen (meist mit Aluminium, Zink, Cadmium oder Titan als Hauptbestand-
teil). Zu den seltenen Zwei-Element-Systemen mit quasikristalliner Struktur zählen Cd5.7 Yb
und Cd5.7 Ca in ikosaedrischer Struktur und Ta1.6 Te in einer dodekaedrischen Struktur. Bis
heute ist nur ein natürlich vorkommendes quasikristallines Mineral, der Icosahedrit, be-
kannt. Es handelt sich um eine Aluminium-Kupfer-Eisen-Legierung mit der Zusammenset-
zung Al63 Cu24 Fe13 , die auf der Kamtschatka-Halbinsel in Russland gefunden wurde.
bcc fcc
⌋︂
Die primitive Gitterzelle der fcc-Struktur ist rhomboedrisch. Sie besitzt eine Kantenlänge
ã = a⇑ 2 und der Winkel an den spitzen Ecken beträgt 60○ . Eine kubisch flächenzentrierte
30
Die Koordinationszahl gibt allgemein die Zahl der nächsten Nachbarn eines Atoms an, die alle den
gleichen Abstand haben.
26 1 Kristallstruktur
60°
Kristallstruktur haben viele Metalle wie z. B. Aluminium, Blei, γ-Eisen, Gold, Silber, Kalzi-
um, Strontium, Cer, Iridium, Kupfer, Nickel, Palladium, Platin und Rhodium. Nach Kupfer
wird dieser Strukturtyp auch Kupferstruktur genannt.
109°28´
A
A B
A
(b)
C
B B
A
(c) A
𝒂𝟑
A 𝒂𝟐 C
B
𝒂𝟏
(a) (d) A
Abb. 1.21: (a) Die hexagonal dichteste Kugelpackung: die primitive Zelle hat a 1 = a 2 mit einem einge-
schlossenen Winkel von 120○ . Die mittlere Ebene ist verschoben, so dass das zentrale Atom im Hexa-
gon die Position (2⇑3, 1⇑3, 1⇑2) besitzt. (b) und (c) zeigen die Stapelfolge ABAB. . . für die hexagonal
dichteste Kugelpackung und die Stapelfolge ABCABC. . ., die in einer kubisch flächenzentrierten Struk-
tur resultiert (links: Seitenansicht, rechts: Draufsicht). In (d) sind die Stapelebenen für die fcc-Struktur
veranschaulicht, sie verlaufen senkrecht zu den Flächendiagonalen.
28 1 Kristallstruktur
Tabelle 1.5: Werte für das Element c⇑a Element c⇑a Element c⇑a
c⇑a-Verhältnis von Materia-
He 1.633 Zn 1.861 Zr 1.594
lien mit der hcp-Struktur.
Be 1.581 Cd 1.886 Gd 1.592
Mg 1.623 Co 1.622 Lu 1.596
Ti 1.586 Y 1.570 Tl 1.60
auf den Kanten, die von 4 benachbarten Zellen geteilt werden und ein Atom im Zentrum)
und 4 Cl-Ionen (8 Atome auf den Ecken, die mit 8 benachbarten Zellen geteilt werden, und
6 Atome auf den Seitenflächen, die mit 2 benachbarten Zellen geteilt werden). Tabelle 1.6
enthält die Gitterkonstanten einiger Materialien mit NaCl-Struktur.
Obwohl in der CsCl-Struktur das positive Ion von 8, in der NaCl-Struktur dagegen nur von
6 negativen Ionen umgeben ist, wird für die meisten ionischen Bindungen die NaCl-Struktur
beobachtet. Dies ist erstaunlich, da für die CsCl-Struktur, wie wir in Abschnitt 3.3 sehen
werden, die Coulomb-Bindungsenergie größer sein sollte. Die Ursache liegt darin begrün-
det, dass in den meisten Fällen der Radius des Kations wesentlich kleiner ist als derjenige
des Anions (z. B. r Na+ = 0.95 Å, r Cl− = 1.81 Å). Beim Cs-Ion ist das anders (r Cs+ = 1.69 Å).
Wenn das Kation kleiner wird, stoßen die Anionen in der CsCl-Struktur bei einem Verhält-
nis r + ⇑r − = 0.732 der Ionenradien aneinander. Für noch kleinere Kationen kann die Git-
terkonstante nicht mehr kleiner werden und die Coulomb-Energie bliebe konstant. In die-
sem Fall wird dann die NaCl-Struktur günstiger, da hier ein Kontakt der Anionen erst bei
r + ⇑r − = 0.414 auftritt (siehe hierzu auch Abb. 3.9 in Abschnitt 3.3).
Wir wollen an dieser Stelle auch darauf hinweisen, dass für ein kubisch raumzentriertes Git-
ter (bcc: body centered cubic) die Zahl der nächsten Nachbarn nur 8 beträgt (im Gegensatz
zu 12 für das hcp- und fcc-Gitter, siehe Abb. 1.21) und damit für eine ungerichtete Bindung
diese Struktur eigentlich ungünstig sein sollte. Nichtsdestotrotz kristallisieren alle Alkali-
metalle sowie Ba, V, Nb, Ta, Ta, W und Mo in dieser Struktur. Die Ursache dafür ist, dass in
der bcc-Struktur die 6 übernächsten Nachbarn nur geringfügig weiter entfernt sind als die
8 nächsten Nachbarn. Es hängt dann von der Ausdehnung und Natur der Elektronenwellen-
funktion ab, ob die bcc- oder die fcc- bzw. die hcp-Struktur stabiler ist.
(a) (b) 0 ½ 0
¾ ¼
½ ½
¼ ¾
0 ½ 0
(c)
Abb. 1.24: (a) Die Kristallstruktur von Diamant mit der tetraedrischen Anordnung der Bindungen. Die
beiden Kohlenstoffatome der Basis sind durch unterschiedliche Farben gekennzeichnet. Senkrecht zur
Raumdiagonalen liegen wellenförmige Schichten vor, wobei jede Schicht aus sesselförmigen Sechs-
ringen besteht. (b) zeigt die Atompositionen in der Einheitszelle projiziert auf die Grundfläche des
Würfels. (c) zeigt das Bild eines Rohdiamanten (Foto: Katharina Surhoff).
Abb. 1.24b). Das Diamantgitter hat eine Raumausfüllung von nur etwa 34%, die wesentlich
kleiner ist als die einer dicht gepackten Struktur (fcc oder hcp). In Tabelle 1.8 sind die Git-
terkonstanten einiger Materialien mit Diamantstruktur angegeben.
Die konventionelle Zelle der Diamantstruktur besitzt 8 Kohlenstoffatome. Jedes Kohlenstoff-
atom hat 4 Kohlenstoffatome als nächste (Koordinationszahl 4) und 12 Atome als übernächs-
te Nachbarn.
(a) (b)
Ein wichtiger Unterschied zwischen der Diamant- und der Zinkblendestruktur ist die Tatsa-
che, dass erstere eine Inversionssymmetrie bezüglich des Würfelmittelpunkts besitzt, wäh-
rend letztere dies aufgrund der unterschiedlichen Atome der Basis nicht tut. Wie bei der
Diamantstruktur liegen bei der Zinkblende-Struktur senkrecht zur Raumdiagonalen wel-
lenförmige Schichten vor, wobei jede Schicht aus sesselförmigen Sechserringen besteht, die
abwechselnd drei Zn und drei S Atome enthalten (vergleiche hierzu Abb. 1.24).
Während bei der Zinkblende-Struktur die Schichten einer Atomsorte entlang der [111]-
Richtung eine ABCABC . . . Stapelung besitzen, hat die sehr ähnliche Wurtzit-Struktur eine
ABAB . . . Stapelfolge. Wurtzit kristallisiert im hexagonalen Kristallsystem in der Raumgrup-
pe P63 mc und hat zwei Formeleinheiten pro Elementarzelle (siehe Abb. 1.26). Der Aufbau
der Kristallstruktur lässt sich von der des Lonsdaleit, dem hexagonalen Diamant, ableiten.
Dies steht in Analogie zur Struktur des Sphalerit, die sich vom normalen kubischen Dia-
mant ableiten lässt. Wurzit, auch als β-Zinksulfid (β-ZnS) bezeichnet, besteht aus einer he-
xagonal dichtesten Kugelpackung aus Schwefelatomen, deren Tetraederlücken zur Hälfte mit
Zinkatomen besetzt sind. Da es in einer dichtesten Kugelpackung doppelt so viele Tetraeder-
(a) (b)
lücken wie Packungsteilchen (in diesem Fall Schwefel) gibt und nur jede zweite Lücke mit
Zink besetzt ist, ergibt sich ein Schwefel-Zink-Verhältnis von 1:1 und damit die chemische
Formel ZnS. Beide Atomsorten haben jeweils eine Koordinationszahl von 4, als Koordinati-
onspolyeder ergibt sich in beiden Fällen ein unverzerrtes Tetraeder.
Die Wurtzitstruktur zählt zu den wichtigsten Kristallstrukturtypen. Zahlreiche, auch tech-
nisch wichtige Verbindungen, kristallisieren isotyp zu Wurtzit, darunter Zinkoxid (ZnO),
Cadmiumsulfid (CdS), Cadmiumselenid (CdSe), Galliumnitrid (GaN) und Silberiodid
(AgI).
(a) (b)
Abb. 1.27: Hexagonale Kristallstruktur des Graphit in Seitenansicht (a) und Draufsicht (b). Die
rot markierten Kohlenstoffatome haben kein Nachbaratom in der darunter- und darüberliegenden
Schicht. Der Atomabstand innerhalb der Ebenen beträgt 1.42 Å, der Abstand der Ebenen aufgrund
der wesentlich schwächeren Bindung dagegen 3.35 Å.
34 1 Kristallstruktur
Basalebenen ist sehr gering, während sie einer fast metallischen Leitfähigkeit entlang der
Ebenen entspricht.
Sehr interessante Eigenschaften zeigen isolierte, zweidimensionale Kohlenstoffschichten, die
als Graphen bezeichnet werden. Alle Kohlenstoffatome sind hier sp2 -hybridisiert (verglei-
che Abschnitt 3.4.3), so dass jedes Kohlenstoffatom drei gleichwertige σ-Bindungen zu be-
nachbarten C-Atomen ausbilden kann. In Graphen ist deshalb jedes Kohlenstoffatom von
drei weiteren umgeben, woraus die auch aus den Schichten des Graphits bekannte Waben-
Struktur resultiert. Die Kohlenstoff-Kohlenstoff-Bindungslängen sind alle gleich und betra-
gen 1.42 Å. Die dritten, nicht hybridisierten 2p-Orbitale stehen wie auch im Graphit senk-
recht zur Graphenebene und bilden ein delokalisiertes π-Bindungssystem aus. Am Rand des
Wabengitters müssen andere Atomgruppen angedockt sein, die aber – je nach dessen Größe
– die Eigenschaften des Graphens kaum beeinträchtigen.
Wie oben bereits diskutiert besteht Graphen aus zwei äquivalenten Untergittern A und B, die
um die Bindungslänge a B gegeneinander verschoben sind (vergleiche Abb. 1.1). Die zwei-
atomige Einheitszelle wird durch zwei primitive Gittervektoren a 1 und a 2 aufgespannt, die
jeweils auf den übernächsten Nachbarn zeigen. Die Länge der Vektoren und damit die Git-
terkonstante a lässt sich berechnen zu
⌋︂
a = 3 a B = 2.46 Å . (1.2.1)
In der Theorie wurden einlagige Kohlenstoffschichten zum ersten Mal verwendet, um den
Aufbau und die elektronischen Eigenschaften komplexer aus Kohlenstoff bestehender Mate-
rialien beschreiben zu können. In der Praxis wurden solche strikt zweidimensionalen Struk-
turen allerdings nicht für möglich gehalten, da sie als thermodynamisch instabil galten.31 , 32
Um so erstaunlicher war, dass Konstantin Novoselov und Andre Geim im Jahr 2004 die Prä-
paration von freien Graphenschichten bekannt gaben.33 Deren unerwartete Stabilität könn-
te durch die Existenz metastabiler Zustände oder durch Faltenbildung des Graphens erklärt
werden. Im Jahr 2010 wurden Geim und Novoselov „für ihre grundlegenden Experimente mit
dem zweidimensionalen Material Graphen“ mit dem Nobelpreis für Physik ausgezeichnet.
Wir können uns leicht vorstellen, dass sich durch Stapeln solcher einlagigen Graphen-
Schichten die dreidimensionale Struktur des Graphits erzeugen lässt. Stellen wir uns
dagegen die einlagigen Schichten aufgerollt vor, so erhalten wir gestreckte Kohlenstoffnano-
röhren. Wir können in Gedanken auch einige der Sechserringe durch Fünferringe ersetzen,
wodurch sich die ebene Fläche zu einer Kugelfläche wölbt und sich bei bestimmten Zahlen-
verhältnissen Fullerene ergeben: Ersetzen wir zum Beispiel 12 von 32 Ringen, entsteht das
kleinste Fulleren C60 .
31
L. D. Landau, Zur Theorie der Phasenumwandlungen II, Phys. Z. Sowjetunion 11, 11 (1937).
32
R. E. Peierls, Quelques propriétés typiques des corpses solides, Ann. I. H. Poincaré 5, 177–222 (1935).
33
K. S. Novoselov, A. K. Geim, S. V. Morozov, D. Jiang, Y. Zhang, S. V. Dubonos, I. V. Grigorieva,
A. A. Firsov, Electric Field Effect in Atomically Thin Carbon Films, Science 306, 666–669 (2004).
1.3 Festkörperoberflächen 35
1.3 Festkörperoberflächen
An Oberflächen von Kristallen kann die Anordnung der Atome und der Abstand der Ato-
me von den Werten innerhalb des Kristalls abweichen. Dies ist evident, da die anziehen-
den Wechselwirkungskräfte, die an der Oberfläche nur ins Innere des Festkörpers gerichtet
sind, nicht von entgegengesetzt gerichteten Kräften kompensiert werden. Wir erwarten des-
halb einen geringeren Abstand der obersten Atomlage. Bei Metallen kann es aber auch zu
einer Vergrößerung des Netzebenenabstands kommen. Man spricht von einer Oberflächen-
relaxation.
36 1 Kristallstruktur
𝒂𝟏
𝑝 1×1
𝒄′𝟏
𝒂𝟐
𝑐 2×2
𝒄′𝟐
𝑝 2 × 2 𝑅45° 𝒄𝟏 𝒄𝟐
Abb. 1.28: Zur Oberflächenrekonstruktion: Die roten Atome bilden das zweidimensionale Kristallgit-
ter des ungestörten Kristalls mit Gittervektoren a1 und a2 . Dieses kann als „Substrat“ für die blauen
Atome betrachtet werden, die auf ⌋︂dieses
⌋︂ Gitter aufgebracht werden. Letztere bilden das Oberflächen-
gitter. Das Oberflächengitter p ( rot:
2 × 2) R45Kristallgitter
○ des ungestörten
mit Gittervektoren c1 und cKristalls ○
2 ist um 45 gedreht, das
blau: Oberflächengitter
Oberflächengitter c (2 × 2) ist ein zentriertes Gitter.
34
E. A. Wood, Vocabulary of surface crystallography, J. Appl. Phys. 35, 1306–1312 (1964).
1.4 Reale Kristalle 37
der Zelle zu den Eckpunkten äquivalent ist. Der Buchstabe p für eine primitive Elementarzel-
le kann auch weggelassen werden und wird normalerweise nur dann verwendet, wenn es ei-
ne zentrierte Zelle gleicher Größe gäbe. Beispiele sind in Abb. 1.28 gezeigt. Mit der Notation
nach Wood können nicht alle Überstrukturzellen dargestellt werden. Wenn die Überstruk-
turzelle nicht so gewählt werden kann, dass der Winkel zwischen ihren Basisvektoren und
denen des Grundgitters gleich ist, muss eine Matrixschreibweise verwendet werden (nach
P. L. Parks und H. H. Madden).
Um die Klassifizierung des Oberflächengitters noch präziser zu machen, gibt man noch die
Zusammensetzung und die Millerschen Indizes der Kristalloberfläche an, die als Substrat
dient, sowie die Art der Oberflächenatome, die⌋︂auf ⌋︂
diese Oberfläche aufgebracht werden.
Zum Beispiel besagt die Bezeichnung Si(100) ( 2 × 2) R45○ -Ag, dass bei der Adsorption
⌋︂
von Ag-Atomen auf einer Si(100)-Oberfläche das Oberflächengitter der Ag-Atome um 45○
gedreht ist und die Gitterkonstante um den Faktor 2 vergrößert ist.
Defekte können natürlich auch wieder ausgeheilt werden. Dies kann zum Beispiel durch
einen Temperprozess der Probe bei hoher Temperatur knapp unterhalb der Schmelztempe-
ratur geschehen. Manche Defekte können auch durch Druck oder Zug ausgeheilt werden.
Mit zunehmender Anzahl der strukturellen Defekte erhalten wir einen fließenden Übergang
zwischen einem perfekten Einkristall und einem amorphen Festkörper. Bei einem perfek-
ten Einkristall ist der mittlere Abstand L zwischen zwei Defekten unendlich groß. Bei einem
realen Kristall ist der Abstand endlich aber immer noch groß gegen die Gitterkonstante a.
Zum Beispiel ist bei einem Polykristall L durch die Kristallitgröße gegeben. Wird die De-
fektdichte so groß, dass der mittlere Abstand der Defekte in den Bereich der Gitterkonstante
kommt, so erhalten wir einen amorphen Festkörper.
1.4.1.2 Punktdefekte
Bei Punktdefekten unterscheiden wir zwischen Leerstellen (fehlende Atome auf regulären
Gitterplätzen) und Zwischengitteratomen (zusätzliche Atome auf Zwischengitterplätzen).
Bei mehratomigen Substanzen müssen wir dabei noch zwischen den einzelnen Untergit-
tern unterscheiden (siehe Abb. 1.29). Bei AB-Verbindungen, z. B. NaCl, KCl, AgCl, MnO
oder GaAs treten häufig Kombinationen von Punktdefekten auf. Die Kombination von zwei
Leerstellen auf dem A- und B-Platz bezeichnet man als Schottky-Defekt,35 die Kombination
einer Leerstelle auf dem A-Platz mit einem A-Atom auf einem Zwischengitterplatz bezeich-
net man als Frenkel-Defekt.36 Diese Kombinationen treten insbesondere bei Ionenkristallen
wie NaCl auf, um die Ladungsneutralität zu gewährleisten.
Leerstellen sind bei einer endlichen Temperatur immer in bestimmter Dichte in einem Kris-
tall vorhanden. Ihre Konzentration lässt sich mit Hilfe einer thermodynamischen Betrach-
tung ermitteln, wenn wir davon ausgehen, dass im thermodynamischen Gleichgewicht bei
35
Walter Schottky, geboren am 23. Juli 1886 in Zürich, gestorben am 14. März 1976 in Pretzfeld.
36
Jakow Iljitsch Frenkel, geboren am 10. Februar 1894 in Rostow, gestorben am 23. Januar 1952 in
St. Petersburg.
1.4 Reale Kristalle 39
- + - + -
+ - + - +
- + - + -
+ - + - +
- + - + -
Abb. 1.30: Struktur eines F-Zentrums.
denen mehrere Leerstellen oder Ionen beteiligt sind. Auf diese wollen wir hier aber nicht
eingehen.
Der in Abb. 1.31 gezeigte Zusammenhang zwischen der Photonenenergie E max bzw. der Wel-
lenlänge λ max des Maximums der Absorptionsbande und dem Abstand R NN zwischen den
nächsten Nachbarn macht klar, dass die Größe der beteiligten Ionen und damit die Gitter-
konstante des Ionenkristalls eine wichtige Rolle spielt. Man beobachtet λ max = αR NN2
mit
12 −1
α = 6 × 10 m für Alkalihalogenide mit NaCl-Struktur. Diesen Zusammenhang erhalten
wir, wenn wir annehmen, dass sich das Elektron des Farbzentrums in einem Kastenpotenzial
mit Abmessung R NN bewegt. Aus der Quantenmechanik folgt nämlich, dass der Abstand der
2
Energieniveaus proportional zu 1⇑R NN und somit λ max ∝ R NN
2
ist. Kristalle mit Farbzentren
haben eine wichtige technische Bedeutung als aktive Medien in Infrarot-Lasern. In diesen
Farbzentrenlasern werden allerdings etwas komplizierter aufgebaute Farbzentren benutzt.
max (nm)
619 412 309
KI
RbBr RbCl
KBr KCl
3
NaBr
RNN (Å)
NaCl
KF LiCl
(a) (c)
b
A D
B C
(b)
D A
b
C
B
Abb. 1.32: (a) Stufenversetzung und (b) Schraubenversetzung. Der Burgers-Vektor b verläuft bei der
Stufenversetzung senkrecht und bei der Schraubenversetzung parallel zur Versetzungslinie CD. Die
grünen Linien geben einen mögliche Wege für einen Umlauf um den Versetzungskern mit gleich vielen
Schritte nach links und rechts bzw. oben und unten an. In (c) ist eine Korngrenze (45○ Korngrenze in
SiC projiziert in [110]-Richtung) gezeigt.
1.4 Reale Kristalle 43
durch Platztausch von Atomen geschehen. Solche Defekte nennen wir Antistrukturatome
oder Anti-site Defekte (Atome der Sorte A auf dem Gitterplatz der Sorte B und umgekehrt
in einer zweiatomigen Verbindung AB, z. B. GaAs).
Substitionelle und interstitielle Fremdatome sowie Antistrukturatome können wir zu den
atomaren Defekten zählen. Ausgedehnte Defekte aufgrund chemischer Fehlordnung sind
z. B. Ausscheidungen und Fremdphasen.
Chemische Fehlordnung spielt in einigen Materialsystemen eine bedeutende Rolle. So wird
zum Beispiel die elektrische Leitfähigkeit von Halbleitermaterialien durch die Dotierung
mit einer geringen Konzentration von Fremdatomen um Größenordnungen geändert. Die
Dotieratome ersetzen dabei im Kristallgitter teilweise die Atome des Halbleitermaterials.
1
g (r1 , r2 ) = ∐︁n(r1 ) n(r2 )̃︁ (1.5.1)
n 02
charakterisieren. Nehmen wir der Einfachheit halber an, dass unser Festkörper nur aus ei-
ner Atomsorte aufgebaut ist, so gibt g(r1 , r2 ) die Wahrscheinlichkeit dafür an, dass sich am
Ort r2 ein Teilchen befindet, wenn am Ort r1 bereits ein Teilchen vorhanden ist. Die Wahr-
scheinlichkeit wird mit Hilfe der mittleren Teilchendichte n 0 für große Abstände auf den
Wert eins normiert.
Amorphe Festkörper sind vom makroskopischen Standpunkt aus gesehen im Allgemeinen
homogen und isotrop. Wir können deshalb annehmen, dass die Paarkorrelationsfunktion
nur vom Abstand r = ⋃︀r2 − r1 ⋃︀ abhängt. Sie gibt dann die mittlere Teilchendichte n(r) an, die
wir im Mittel im Abstand r von einem gewählten Bezugsatom anfinden, d. h.
n(r)
g(r) = . (1.5.2)
n0
1.5 Nicht-kristalline Festkörper 45
𝑽𝜟𝒓
Volumen der
Kugelschale
𝑵𝜟𝒓
Anzahl der Abb. 1.33: Zur Ableitung der radialen Vertei-
Atome lungsfunktion.
Häufig wird zur Beschreibung der Verteilung von Atomen in einem amorphen Festkörper
auch die radiale Verteilungsfunktion ρ(r) verwendet. Hierzu betrachten wir eine Kugelscha-
le der Dicke ∆r um ein beliebiges Atom (siehe Abb. 1.33). Das Volumen der Kugelschale ist
für ∆r ≪ r
4
V∆r = π ((r + ∆r)3 − r 3 ) ≃ 4πr 2 ∆r . (1.5.3)
3
Die Zahl der Atome, die in dieser Kugelschale liegen, sei N ∆r . Wir können damit die mittlere
Dichte der Atome im Abstand r angeben als
N ∆r
n(r) = ̂︁ lim [︁ . (1.5.4)
∆r→0 V∆r
Hierbei deutet ∐︀̃︀ den Mittelwert über alle Atome an. Mit dieser mittleren Dichte können wir
die radiale Verteilungsfunktion als
N ∆r
ρ(r) = 4πr 2 n(r) = 4πr 2 ̂︁ lim [︁ = 4πr 2 n 0 g(r) . (1.5.5)
∆r→0 V∆r
definieren. Die radiale Verteilungsfunktion gibt die mittlere Zahl der Atome pro Längen-
einheit an. Um die Bedeutung dieser Verteilungsfunktion zu verstehen, betrachten wir zwei
Grenzfälle:
1. Kristalliner Festkörper:
Die Kugelschale enthält nur bei ganz bestimmten Abständen r = r j , die durch die Kris-
tallstruktur und die Gitterkonstanten vorgegeben sind, Atome. Die Größe n(r) bzw. g(r)
und damit ρ(r) wird bei diesen Werten unendlich groß, da die Zahl N ∆r auch für V∆r → 0
endlich bleibt. Wir erhalten also eine δ-Funktion
)︀
⌉︀
⌉︀0 für r ≠ r j
ρ(r) = N(r)δ(r − r j ) = ⌋︀ . (1.5.6)
⌉︀
⌉︀∞ für r = r j
]︀
Integrieren wir die δ-Funktion, so erhalten wir gerade die Zahl N(r j ) der Atome im
Abstand r j . Haben wir keinen perfekten Kristall, so werden die Atompositionen etwas
schwanken, was zu einer Verbreiterung der Peaks in ρ(r) bei r = r j führt.
46 1 Kristallstruktur
400 400
𝝆 𝒓
(1/nm)
(1/nm)
𝝆𝐙𝐮𝐟𝐚𝐥𝐥 𝒓
200 200
0 0
0.0 0.5 1.0 1.5 2.0 2.5 3.0 0.0 0.4 0.8 rc 1.2
r/a r (nm)
Abb. 1.34: Radiale Verteilungsfunktion bei einem einkristallinen (a) und einem amorphen Festkör-
per (b).
2. Amorpher Festkörper:
Für einen amorphen Festkörper ist n(r) = n 0 = const bzw. g(r) = 1. Damit erhalten wir
für die radiale Verteilungsfunktion
ρ(r) = 4πr 2 n 0 ≡ ρZufall . (1.5.7)
Dieses Ergebnis ist einsichtig, da wir in einem amorphen Körper eine völlig zufällige
Abstandsverteilung erwarten.
Experimentell wird dieses Verhalten aber nicht beobachtet. Man findet vielmehr, dass
die radiale Verteilungsfunktion für sehr kleine r < r c eher wie diejenige eines kristallinen
Festkörpers aussieht und erst bei größeren r in ρZufall übergeht:
)︀
⌉︀
⌉︀ρ Kristall für r < r c
ρ(r) = ⌋︀ . (1.5.8)
⌉︀
⌉︀ ρ für r > r c
]︀ Zufall
Dies ist einsichtig, da wir auch für einen amorphen Festkörper erwarten, dass um jedes
Atom herum eine gewisse Nahordnung mit einem gut definierten mittleren Atomab-
stand existiert. Es existiert allerdings keine Fernordnung, weshalb die Verteilungsfunk-
tion für große r > r c dann in ρZufall übergeht. Der charakteristische Radius r c liegt in der
Größenordnung des Atomabstandes (siehe hierzu Abb. 1.34).
1.5.2 Flüssigkristalle
Bisher haben wir nur Systeme betrachtet, die entweder kristallin oder amorph waren. Es gibt
aber auch Mischformen, also Strukturen, die hinsichtlich mancher Eigenschaften kristallin,
hinsichtlich anderer jedoch amorph sind. Beispiele sind Flüssigkristalle,38 die wir hier näher
diskutieren wollen, aber auch Flusslinien in Supraleitern.
38
Der österreichische Botaniker und Chemiker Friedrich Reinitzer (1857–1927) hat im Jahr 1888
an der Substanz Cholesterinbenzoat festgestellt, dass diese bei 145.5 ○ C schmilzt aber milchig trüb
1.5 Nicht-kristalline Festkörper 47
bleibt. Erst bei einer Temperatur von 178.5 ○ C wurde die Probe klar. Beim Abkühlen wiederholte
sich der Vorgang in umgekehrter Reihenfolge. Zwischen 145.5 ○ C und 178.5 ○ C besaß die Probe
die viskosen Eigenschaften von Flüssigkeiten und zusätzlich die optischen bzw. lichtbrechenden
Eigenschaften von Kristallen. Aus diesem Grund musste die Verbindung im flüssigen Zustand ei-
ne gewisse Ordnung ausbilden. Da sie sowohl die Eigenschaften von Flüssigkeiten und Kristallen
besitzt, bezeichnete man sie als Flüssigkristall.
39
In smektischen Phasen liegen sowohl Richtungs- als auch Schwerpunktskorrelationen vor. Insge-
samt sind 12 smektische Phasen bekannt. In der smektischen A-Phase (SmA), sind die Moleküle
im Mittel senkrecht zur Schichtebene orientiert. In der smektischen C-Phase (SmC) dagegen bil-
den sie im Mittel einen von 90○ verschiedenen Winkel zur Schichtebene aus, man spricht von einer
verkippten Phase. Es existieren auch höher geordnete Phasen, in denen die Moleküle innerhalb der
Schicht eine Positionsfernordnung besitzen, z. B. SmI und SmF.
48 1 Kristallstruktur
unpolarisiertes
Licht
Polarisator
Glasplatte
und Elektrode
polarisiertes
Licht
Flüssig-
Kristall
Glasplatte
und Elektrode
Polarisator
Spiegel
Spannung aus Spannung an
Elektrode Polarisator
Flüssigkristall Glasplatte
Abb. 1.36: Zur prinzi-
piellen Funktionsweise Spiegel
von LCD-Anzeigen.
ändert. Die Polarisationsebene des Lichts wird dann nicht gedreht, es kann den zweiten Po-
larisator nicht durchdringen und somit nicht reflektiert werden. In das Display zum Beispiel
eines Taschenrechners fällt das Tageslicht ein und wird je nach Stellung der Flüssigkristalle
entweder ungehindert durchgelassen oder eben nicht. Damit kann man einzelne Stellen auf
dem Display verdunkeln und so ein Bild vortäuschen.
Wir wollen diese Verfahren kurz vorstellen, bevor wir in Kapitel 2 auf die Strukturanalyse mit
Beugungsmethoden eingehen. Der Vorteil der direkten Abbildungsverfahren ist ohne Zwei-
fel die Tatsache, dass eine unmittelbare Strukturanalyse vorgenommen werden kann, ohne
dass erst über Rechenverfahren aus den Messergebnissen auf die Struktur zurückgerech-
net werden muss. Die direkten Messverfahren eignen sich auch sehr gut für die Abbildung
von Gitterdefekten (Realstruktur), während Beugungsmethoden hauptsächlich zur detail-
lierten Bestimmung der Gitterstruktur (Idealstrukltur) und der Gitterkonstanten geeignet
sind. Der Nachteil der direkten Verfahren ist deren Oberflächensensitivität (RSM) und das
geringe Probenvolumen (TEM), das bei der Messung erfasst wird.
1.6.1 Elektronenmikroskopie
Der typische Aufbau eines Transmissions-Elektronenmikroskops (TEM) ist in Abb. 1.37 ge-
zeigt. Mit einer Elektronenquelle (Kathode, z. B. Wolfram-Haarnadelquelle, LaB6 -Kathode
oder Feldemissionsquelle) werden freie Elektronen erzeugt, die auf eine Energie von typi-
scherweise einigen 100 keV beschleunigt werden. Mit Hilfe von Kondensorlinsen wird ei-
ne optimale „Elektronenbeleuchtung“ des zu untersuchenden Objekts realisiert. Im Objekt
werden die Elektronen von den Atomen des Kristallgitters gestreut. Atome mit hoher Kern-
ladungszahl streuen dabei die Elektronen stärker als solche mit niedriger Kernladungszahl.
In der Brennebene der Objektivlinse hinter dem Objekt werden die stark gestreuten Elek-
tronen durch Blenden absorbiert, so dass Atome mit hoher bzw. niedriger Kernladungszahl
dunkel bzw. hell erscheinen. Das zu untersuchende Objekt muss sehr dünn sein (typischer-
weise dünner als 100 nm), da die Elektronen sonst das Objekt nicht durchdringen können.
Das von weiteren Linsen vergrößerte Bild kann auf einem Leuchtschirm beobachtet werden
oder mit Hilfe einer CCD-Kamera oder Photoplatte registriert werden. Als Linsen werden
heute überwiegend Magnetlinsen verwendet. Die Brennweite dieser Linsen kann über den
Spulenstrom geregelt werden.
50 1 Kristallstruktur
Isolator
Elektronenquelle
Kondensor
Objektivlinse
Probenebene
Probe
Projektions-
linsen Beobachter
La2/3Ba1/3MnO3
SrTiO3
Weise kann eine lokale Elementanalyse durchgeführt werden (EELS: Electron Energy Loss
Spectroscopy).
1.6.2 Rastersondentechniken
Die Rastersondentechniken haben seit ihrer Einführung in den 1980er Jahren eine stürmi-
sche Entwicklung erfahren. Die beiden wichtigsten Verfahren sind die
∎ Rastertunnelmikroskopie (STM: Scanning Tunneling Microscopy) und die
∎ Rasterkraftmikroskopie (AFM: Atomic Force Microscopy).
Die für beugungsbasierte Methoden bestehende Auflösungsgrenze d ≈ λ wird bei diesen
Verfahren dadurch umgangen, dass man zu einer Nahfeldtechnik übergeht. Diese basiert
auf einer Abrasterung der Oberfläche mit einer sehr feinen Spitze in sehr kleinem Abstand.
Die Ortsauflösung wird dabei durch den Durchmesser ∆x ≪ λ der Spitze bestimmt. Diese
Technik wird auch beim wohl bekannten Stethoskop verwendet. Der Sondendurchmesser
ist hier etwa 1 cm, wodurch man eine Auflösung erhält, die weit unterhalb der Wellenlänge
von akustischen Wellen (einige Meter) liegt. Bei den Rastersondentechniken liegt der Son-
dendurchmesser im atomaren Bereich, weshalb bei der Abbildung eine atomare Auflösung
erzielt werden kann.
Abb. 1.39 zeigt schematisch die Funktionsweise eines Rastertunnelmikroskops. Die Mess-
größe M(z) ist hierbei der zwischen Messspitze und Probe fließende Tunnelstrom. Die-
ser hängt exponentiell vom Abstand ∆z zwischen Spitze und Probenoberfläche ab (M(z) =
I(z) ∝ e−κ ∆z , die charakteristische Abklinglänge 1⇑κ liegt typischerweise im Ångström-Be-
reich). Üblicherweise wird die Spitze über die Probe gerastert und dabei mit Hilfe eines
Rückkoppelkreises der Abstand mit Hilfe eines piezoelektrischen Stellelements so geregelt,
dass der Tunnelstrom zwischen Spitze und Probe konstant bleibt. Die an das Piezostellele-
ment gegebene Steuerspannung enthält dann die Information über das Höhenprofil der Pro-
be.40 Die Rastertunnelmikroskopie wurde 1981 von Binnig und Rohrer entwickelt, die da-
40
Es soll hier darauf hingewiesen werden, dass man mit dem STM nicht die Atome, sondern die für
den Tunnelstrom verantwortliche elektronische Struktur an der Oberfläche sieht. Bei einer Gra-
phit-Oberfläche sieht man deshalb z. B. nur jedes zweite Atom.
52 1 Kristallstruktur
Rastertunnelmikroskopie
(a) (b)
𝑰
Rück- STM
kopplung
𝑽
piezo-
elektrisches
Stellelement (c)
𝜟𝒙 𝒛
𝜟𝒛 AFM
𝒙
Si(111) 7 x 7 Oberfläche
Abb. 1.39: (a) Zur prinzipiellen Funktionsweise von Rastersondenmikroskopen. Rechts ist jeweils ein
STM- (b) und ein AFM-Bild (c) einer Si-Oberfläche im Ultrahochvakuum gezeigt. Einige ins Auge fal-
lende Besonderheiten sind: (i) die Atome sind deutlich als rotumrandete (künstlich eingefärbte) Krei-
se sichtbar und (ii) die Oberfläche hat keine Ähnlichkeit mit einer (111) Ebene des Diamantgitters.
Die Atome der Oberfläche (und die Lage darunter) haben sich rearrangiert, um ihre freien Bindun-
gen gegenseitig bestmöglichst abzusättigen. Die zweidimensionale Elementarzelle des Oberflächengit-
ters ist ziemlich kompliziert mit einer Gitterkonstante die 7 mal größer ist als die Gitterkonstante des
Si-Volumengitters. Man spricht deshalb auch von der 7 × 7 Struktur der (111) Oberfläche. Der 7 × 7
Oberflächenkristall enthält auch Defekte, insbesondere sind Leerstellen gut zu erkennen (Bilder: Omi-
cron GmbH).
für im Jahr 1986 den Nobelpreis für Physik erhielten.41 Beim Rasterkraftmikroskop ist die
Messgröße die zwischen Spitze und Probe wirkende Kraft. Verwendet man eine magnetische
Spitze, kann die magnetische Kraft zwischen Spitze und einer magnetischen Oberfläche ver-
wendet werden (MFM: Magnetic Force Microscopy).
41
Gerd Karl Binnig (geboren am 20. Juli 1947 in Frankfurt am Main) und Heinrich Rohrer (geboren
am 6. Juni 1933 in Buchs, Kanton Sankt Gallen, gestorben am 16. Mai 2013 in Wollerau, Schweiz),
erhielten im Jahr 1986 zusammen mit Ernst August Friedrich Ruska (geboren am 25. Dezember
1906 in Heidelberg, gestorben am 27. Mai 1988 in Berlin) den Nobelpreis für Physik. Ruska wurde
für seine fundamentalen Beiträge zur Entwicklung der Elektronenoptik ausgezeichnet, Binnig und
Rohrer für die Konstruktion des Rastertunnelmikroskops.
Literatur 53
Literatur
A. Bravais, Études Cristallographiques, Gauthier Villars, Paris (1866).
M. J. Buerger, Elementary Crystallography, John Wiley & Sons, New York (1963).
W. Borchardt-Ott, Kristallographie: Eine Einfuhrung fur Naturwissenschaftler, Springer-
Verlag, Berlin (2009).
J. J. Burckhardt, Die Symmetrie der Kristalle, Birkhäuser Verlag, Basel (1988).
J. S. Fedorov, Symmetry of crystals, übersetzt aus dem Russischen von David und Katherine
Harker, New York, American Crystallographic Association, Monograph 7, (1971).
R. J. Haüy, Essai d’une théorie sur la structure des cristaux, Paris (1784); Traité de minéralogie,
Paris (1801).
J. Kepler in Harmonice Mundi (1619).
W. Friedrich, P. Knipping, M. von Laue, Interferenz-Erscheinungen bei Röntgenstrahlen, Baye-
rische Akademie der Wissenschaften, Sitzungsberichte, S. 303–322 (1912); Abdruck in
Ann. Phys. 39, 97–100 (1912) und Ann. Phys. 41, 971–1002 (1913).
W. Kleber, H.-J. Bautsch, J. Bohm, D. Klimm, Einführung in die Kristallographie, Oldenbourg
Verlag, München (2010).
L. D. Landau, Zur Theorie der Phasenumwandlungen II, Phys. Z. Sowjetunion 11, 11 (1937).
D. Levine, P. Steinhardt, Quasicrystals: A New Class of Ordered Structures, Phys. Rev. Lett. 53,
2477–2480 (1984).
K. S. Novoselov, A. K. Geim, S. V. Morozov, D. Jiang, Y. Zhang, S. V. Dubonos, I. V. Grigo-
rieva, A. A. Firsov, Electric Field Effect in Atomically Thin Carbon Films, Science 306,
666–669 (2004).
R. E. Peierls, Quelques propriétés typiques des corpses solides, Ann. I. H. Poincaré 5, 177–222
(1935).
A. Schoenflies, Synthetisch-geometrische Untersuchungen über Flächen zweiten Grades und
eine aus ihnen abgeleitete Regelfläche, Dissertation, Friedrich-Wilhelms-Universität zu
Berlin (1877).
D. Shechtman, I. Blech, D. Gratias, J. Cahn, Metallic Phase with Long-Range Orientational
Order and No Translational Symmetry, Phys. Rev. Lett. 53, 1951–1953 (1984).
E. A. Wood, Vocabulary of surface crystallography, J. Appl. Phys. 35, 1306–1312 (1964).
2 Strukturanalyse mit
Beugungsmethoden
Durch die grundlegenden Arbeiten von Max
von Laue, Walter Friedrich und Paul Knip-
ping im Jahr 1912 wurde eindeutig nach-
gewiesen, dass es sich bei kristallinen Fest-
körpern um eine regelmäßige Anordnung
von Atomen handelt. Der Nachweis wurde
über die Beugung von Röntgenstrahlen an
Kristallen geführt. Heute wissen wir, dass
elektromagnetische Wellen und Materiewel-
len (Neutronen, Elektronen) an Kristallgit-
tern gebeugt werden, wenn ihre Wellenlänge Beugungsbild eines Quasikristalls (Dirk Frettlöh, FU Berlin)
von der gleichen Größenordnung wie die Git-
terkonstante der Kristallstrukturen ist. Beu-
gungsmethoden sind heute bei der Aufklärung des atomaren Aufbaus von Kristallen unver-
zichtbar. Sie geben insbesondere Aufschluss über (i) die Größe der Elementarzelle, (ii) die
Zahl und Anordnung der Atome in der Elementarzelle und (iii) die Verteilung der Elektro-
nendichte in der Elementarzelle. Im Gegensatz zu den in Abschnitt 1.6 diskutierten direkten
Abbildungsmethoden, die Aufschluss über die lokale Realstruktur eines Festkörpers geben,
mitteln die Beugungsmethoden über ein sehr großes Volumen des Festkörpers und geben
sehr genaue Daten über die Idealstruktur von Festkörpern. Die direkten Abbildungsverfah-
ren eignen sich also besonders gut für die Untersuchung von Abweichungen von der pe-
riodischen Struktur (Defekte, Oberflächen, Grenzflächen) und geben nur relativ ungenaue
Informationen über den periodischen Aufbau von Festkörpern. Im Gegensatz dazu eignen
sich die Beugungsmethoden besonders gut für die Analyse der periodischen Struktur von
Festkörpern und nur wenig für die Untersuchungen von lokalen Abweichungen von dieser
Periodizität.
Die in diesem Kapitel diskutierte Beugung von Wellen an periodischen Strukturen ist von
fundamentaler Bedeutung für die Festkörperphysik. Wir werden am Beispiel der Beugung
wichtige Grundbegriffe wie das reziproke Gitter und die Brillouin-Zonen einführen. Diese
Begriffe werden uns an verschiedenen Stellen (z. B. bei der Diskussion der elektronischen
Struktur von Festkörpern) wieder begegnen. Einige Konzepte bezüglich der Streutheorie
sind auch wichtig für andere Gebiete der Physik wie die Kern- und Teilchenphysik, wo In-
formationen über die Struktur von Kernen und Teilchen aus Streuexperimenten gewonnen
werden.
56 2 Strukturanalyse
R = n 1 a1 + n 2 a2 + n 3 a3 (2.1.1)
die im Allgemeinen nicht die Periodizität des Bravais-Gitters hat. Wir können dann folgende
Definition für das reziproke Gitter geben:
Der Satz aller Wellenvektoren G, die ebene Wellen mit der Periodizität des Bravais-Gitters
ergeben, bildet das zum Bravais-Gitter reziproke Gitter.
ΨG (r) = ΨG (r + R) (2.1.3)
oder
e ıG⋅R = 1 (2.1.5)
für alle R gelten muss. Dies führt uns zu einer äquivalenten Definition des reziproken Gitters:
Sei R = n 1 a1 + n 2 a2 + n 3 a3 ein Bravais-Gitter. Das hierzu reziproke Gitter besteht aus allen
Vektoren G, für die gilt:
e iG⋅R = 1 . (2.1.6)
2.1 Das reziproke Gitter 57
2.1.2 Fourier-Analyse
Aus der Fourier-Analyse ist uns bekannt, dass wir eine periodische Funktion in eine Fourier-
Reihe entwickeln können.1 , 2 , 3 Falls die Funktion f (r) die Periodizität des Bravais-Gitters
besitzt, muss gelten:
f (r) = f (r + R) . (2.1.7)
1 −ık⋅r 3
fk = ∫ f (r) e d r. (2.1.9)
Vc
Zelle
Hierbei wird über eine primitive Gitterzelle mit dem Volumen Vc integriert.
Falls f (r) zum Beispiel die Elektronendichte in einem Kristall ist und damit die Periodizität
des Bravais-Gitters besitzt, so finden wir
f (r) = f (r + R)
(2.1.10)
∑ fk e
ık⋅r
= ∑ f k e ık⋅(r+R) = ∑ f k (e ık⋅r ⋅ e ık⋅R ) .
k k k
Hieraus folgt sofort, dass e ık⋅R = 1 erfüllt sein muss. Da R ein Vektor des Bravais-Gitters ist,
muss deshalb k = G gelten, d. h. die erlaubten Wellenvektoren sind nur reziproke Gittervek-
toren. Wir können also folgende Schlussfolgerung ziehen:
In der Fourier-Zerlegung einer Funktion mit der Periodizität des Bravais-Gitters können
nur Wellenvektoren auftauchen, die zum reziproken Gitter dieses Bravais-Gitters gehören.
R = n 1 a1 + n 2 a2 + n 3 a3 (2.1.11)
1
Otto Föllinger, Laplace-, Fourier- und z-Transformation, bearbeitet von Mathias Kluw, 8. überar-
beitete Auflage, Hüthig, Heidelberg (2003).
2
Burkhard Lenze, Einführung in die Fourier-Analysis, 2. durchgesehene Auflage, Logos Verlag, Ber-
lin (2000).
3
M. J. Lighthill, Introduction to Fourier Analysis and Generalised Functions, Cambridge University
Press, Cambridge (2003).
58 2 Strukturanalyse
aus, wobei n 1 , n 2 und n 3 ganze Zahlen und a1 , a2 und a3 die primitiven Gittervektoren sind.
Die Vektoren aus dem hierzu reziproken Gitter schreiben wir als
2π 2π 2π
b1 = a2 × a3 b2 = a3 × a1 b3 = a1 × a2 . (2.1.14)
Vc Vc Vc
(a) 𝒚 (b) 𝒗
[11]
𝒃𝟐
𝒂𝟐 𝟗𝟎° − 𝜸 𝒂𝟐
(11)
𝜸 𝜸
𝜸 𝒂𝟏 𝒂𝟏
𝟗𝟎° − 𝜸
𝒙 𝒖
𝒃𝟏
Abb. 2.1: Zum Zusammenhang zwischen Raumgittervektoren (a) und Vektoren des reziproken Git-
ters (b) für ein zweidimensionales Gitter. Die kartesischen Koordinaten im direkten Raum sind (x, y),
im reziproken Raum (u, v). Es ist jeweils die zweidimensionale Einheitszelle dargestellt. In (a) ist auch
die (11) Linie und der auf ihr senkrecht stehende reziproke Gittervektor [11] eingezeichnet.
4
Hierbei benutzen wir, dass a ⋅ (a × b) = b ⋅ (a × a) = 0.
2.1 Das reziproke Gitter 59
Da G ⋅ R = 2πn mit ganzzahligem n gelten muss, müssen offenbar h, k und ℓ auch ganzzahlig
sein. Wir können also für die reziproken Gittervektoren folgende Definition angeben:
aufgespannt. Dabei sind die reziproken Gittervektoren durch (2.1.14) bestimmt und die
Koeffizienten h, k und ℓ müssen ganzzahlig sein.
Ohne Beweis (siehe hierzu Übungsaufgaben) wollen wir folgende Tatsachen festhalten:
2.1.3.1 Beispiele
Den Gittervektoren a1 , a2 und a3 bzw. den reziproken Gittervektoren b1 , b2 und b3 können
wir Matrizen
⎛ a 1x a 2x a 3x ⎞ ⎛b 1x b 2x b 3x ⎞
A = ⎜a1 y a2 y a3 y ⎟ und B = ⎜b 1 y b 2 y b 3 y ⎟ (2.1.18)
⎝ a 1z a 2z a 3z ⎠ ⎝ b 1z b 2z b 3z ⎠
zuordnen, die die kartesischen Komponenten der Vektoren enthalten. Zwischen den Matri-
zen besteht der Zusammenhang
⎛1 0 0⎞ −1
AT B = 2π ⎜0 1 0⎟ oder B = 2π (AT ) , (2.1.19)
⎝0 0 1⎠
⎛1 0 0⎞ 2π ⎛
1 0 0⎞
A = a ⎜0 1 0⎟ und B= ⎜0 1 0⎟ . (2.1.20)
⎝0 0 1⎠ a ⎝0 0 1⎠
5
Die Zeilenvektoren der zu A transponierten Matrix AT sind die Spaltenvektoren von A.
60 2 Strukturanalyse
Das reziproke Gitter des kubisch primitiven Gitters ist also wiederum ein kubisch primi-
tives Gitter.
2. Kubisch flächenzentriertes Gitter:
Für das kubisch flächenzentrierte Gitter erhalten wir (siehe hierzu Abb. 2.2a)
−1 1 1 ⎞
a⎛
0 1 1⎞
2π ⎛
A= ⎜1 0 1⎟ und B= ⎜ 1 −1 1 ⎟ . (2.1.21)
2 ⎝1 1 0⎠ a ⎝ 1 1 −1⎠
Vergleichen wir diese Matrix mit derjenigen eines kubisch raumzentrierten Gitters (sie-
he (2.1.22)), so sehen wir, dass das reziproke Gitter der kubisch flächenzentrierten Struk-
tur dem kubisch raumzentrierten Kristallgitter entspricht.
Die drei primitiven Gittervektoren schließen beim kubisch flächenzentrierten Gitter
einen Winkel von 60○ ein und spannen eine primitive Zelle auf, deren Volumen nur ein
Viertel des Volumens der konventionellen Zelle beträgt.
3. Kubisch raumzentriertes Gitter:
Für das kubisch raumzentrierte Gitter erhalten wir (siehe hierzu Abb. 2.2b)
−1 1 1 ⎞
a⎛ 2π ⎛
0 1 1⎞
A= ⎜ 1 −1 1 ⎟ und B= ⎜1 0 1⎟ . (2.1.22)
2 ⎝ 1 1 −1⎠ a ⎝1 1 0⎠
Vergleichen wir diese Matrix wiederum mit der eines kubisch flächenzentrierten Git-
ters (siehe (2.1.21)), so sehen wir, dass das reziproke Gitter der kubisch raumzentrier-
ten Struktur dem kubisch flächenzentrierten Kristallgitter entspricht. Die drei primitiven
𝒛 𝒂𝟏
𝒚
𝒙
𝒂𝟐
𝒂𝟏
𝒂𝟑
𝒂𝟐
𝒛
𝒂𝟑 𝒚
(a) (b) 𝒙
Gittervektoren schließen beim kubisch raumzentrierten Gitter einen Winkel von 109○ 28′
ein und spannen eine primitive Zelle auf, deren Volumen nur halb so groß ist wie das der
konventionellen Zelle.
Die Konstruktion der ersten Brillouin-Zone des reziproken Gitters erfolgt völlig analog zur
Konstruktion der Wigner-Seitz Zelle des direkten Gitters (siehe hierzu Abb. 2.3 und Ab-
schnitt 1.1.1). Wir legen den Ursprung in einen Gitterpunkt des reziproken Gitters, verbin-
den diesen Punkt mit den Nachbarpunkten und zeichnen durch die Mittelpunkte der Ver-
bindungslinien Flächen (Linien in 2D), die auf den Verbindungslinien senkrecht stehen. Wir
nennen diese Flächen Bragg-Flächen, da wir später sehen werden, dass alle k-Vektoren, die
auf diesen Flächen enden, die Bragg-Bedingung erfüllen. Die erste Brillouin-Zone ist nun
genau der Bereich im reziproken Raum, der vom Ursprung aus erreicht werden kann, ohne
irgendeine Bragg-Ebene zu überschreiten. In analoger Weise können wir eine Brillouin-Zo-
ne n-ter Ordnung als den Bereich im reziproken Raum definieren, der durch Überschreiten
von genau (n − 1) Bragg-Flächen (aber nicht weniger) erreicht werden kann (siehe hierzu
Abb. 2.3). Wie wir später sehen werden sind die Brillouin-Zonen von großer Bedeutung für
die Beschreibung der Beugung sowie der elektronischen Struktur von Festkörpern.
Da das reziproke Gitter des bcc-Gitters ein fcc-Gitter ist, ist die 1. Brillouin-Zone des bcc-
Gitters die Wigner-Seitz Zelle des fcc-Gitters. Die erste Brillouin-Zone hat die Gestalt eines
Rhombendodekaeders (siehe Abb. 2.4a). Andererseits ist das reziproke Gitter des fcc-Gitters
6
Léon Nicolas Brillouin, siehe Kasten auf Seite 63.
1. Brillouin-Zone und Brillouin-Zonen höherer Ordnung
15
62 2 Strukturanalyse
(a) (b)
ein bcc-Gitter. Deshalb ist die 1. Brillouin-Zone des fcc-Gitters die Wigner-Seitz Zelle des
bcc-Gitters. Wir erhalten ein Polyeder (siehe Abb. 2.4b).
Schreiben wir
so sind die ganzen Zahlen h, k und ℓ die Millerschen Indizes der Ebenen.
Statt dieses Theorem zu beweisen,7 wollen wir uns seine Bedeutung veranschaulichen. Wir
benutzen dazu folgende Sachverhalte:
1. Für alle Punkte R des Bravais-Gitters gilt e ıG⋅R = 1, wenn G ein reziproker Gittervektor
ist.
2. Ebene Wellen haben in Ebenen senkrecht zum Wellenvektor den gleichen Wert.
Wir betrachten nun das in Abb. 2.5 gezeigte zweidimensionale Bravais-Gitter. Wir können
die Ebenenschar als Wellenfronten von ebenen Wellen mit Wellenvektor k auffassen und
7
Der Beweis dieses Theorems kann in Festkörperphysik, N. W. Ashcroft, N. D. Mermin, Oldenbourg
Verlag, München (2012) gefunden werden.
64 2 Strukturanalyse
𝑮
Abb. 2.5: Zum Zusammenhang zwischen
Gitterebenen und Millerschen Indizes in 𝟏𝟐
einem zweidimensionalen Bravais-Gitter
mit den primitiven Gittervektoren a1
und a2 . Gezeigt sind die (12) Ebenen. 𝒂𝟐
Der zugehörige reziproke Gittervektor
steht senkrecht auf dieser Ebenenschar. 𝒂𝟏
zwar so, dass auf jeder Ebene die ebene Welle den gleichen Wert hat (o. B. d. A. den Wert 1).
Daraus folgt
für alle Gitterpunkte R auf der Ebenenschar. Da die Punkte R aber die Punkte eines Bravais-
Gitters sind, muss k = G ein reziproker Gittervektor sein. Da k senkrecht auf den Ebenen
(Wellenfronten) steht, muss dies also auch für G gelten.
Wir müssen jetzt noch zeigen, dass es einen kleinsten reziproken Gittervektor Gmin gibt.
Dies sehen wir leicht anhand von Abb. 2.6 ein. Wegen k = 2π⇑λ entspricht ein minimaler
Gittervektor einer größtmöglichen Wellenlänge λmax der ebenen Welle. Offenbar muss aber
λ ≤ d gelten, damit die ebene Welle auf allen Punkten des Bravais-Gitters den gleichen Wert
hat. Daraus folgt
2π 2π
⋃︀Gmin ⋃︀ = = . (2.1.26)
λmax d
(a)
≈ 𝟒𝝅/𝒅
(b)
Abb. 2.6: Zur Verdeutlichung der Existenz
eines minimalen reziproken Gittervektors
Gmin = 2π⇑d. In (a) ist λ = d⇑2 und die
≈ 𝟐𝝅/𝒅
ebene Welle hat den gleichen Wert auf allen (c)
Gitterpunkten. Dies trifft auch für (b) zu,
wo λ = λmax = d. In (c) ist λ = 2d. Hier 𝒂𝟐
kann die ebene Welle nicht mehr auf allen
𝒂𝟏 ≈ 𝝅/𝒅 (𝟏𝟎) 𝒅
Gitterpunkten den gleichen Wert haben.
28
2.2 Beugung von Wellen an periodischen Strukturen 65
Zusammenfassend können wir Folgendes festhalten: Jede Kristallstruktur hat zwei Gitter,
nämlich das direkte, auch Raum- oder Kristallgitter bezeichnete, und das reziproke Gitter.
Die beiden Gitter sind über (2.1.14) miteinander verknüpft. Wir werden im Folgenden se-
hen, dass das reziproke Gitter mit dem Beugungsmuster bei der Beugung von Wellen an
einem Kristallgitter verbunden ist.
1. Die Wellenlänge der benutzten Wellen liegt im Bereich der Gitterkonstante des Kristalls.
2. Die Wellen werden elastisch gestreut, d. h. ohne Energieverlust.
2d sin θ = nλ n = 1, 2, 3, . . . . (2.2.1)
Die ganze Zahl n gibt hierbei die Ordnung des Reflexes an. Wir sehen, dass die Bragg-Be-
dingung nur für λ ≤ 2d erfüllt werden kann. Deshalb können wir nicht sichtbares Licht mit
einer Wellenlänge (etwa 400 bis 800 nm) verwenden, die groß gegen den Abstand d der Kris-
tallebenen (im Ångström-Bereich) ist.
Die Bragg-Bedingung ist eine direkte Konsequenz der Periodizität des Kristallgitters, die es
uns erlaubt, alle Gitterpunkte des Kristallgitters auf parallelen Ebenen unterzubringen. Es ist
allerdings zu beachten, dass die sehr vereinfachende Betrachtung von Bragg die Zusammen-
setzung der Basis völlig außer Acht lässt. Wir werden später sehen, dass die Zusammenset-
zung der Basis für die relative Intensität der verschiedenen Beugungsreflexe entscheidend
ist.
𝛉 𝛉
𝛉𝛉
𝒅
Abb. 2.7: Zur Ableitung
der Bragg-Bedingung.
8
siehe Kasten auf Seite 68.
2.2 Beugung von Wellen an periodischen Strukturen 67
∎ Für Röntgenlicht reflektiert jede Ebene nur etwa 10−3 bis 10−5 der einfallenden Intensität.
Es tragen deshalb 103 bis 105 Gitterebenen zur Interferenz bei. Diese Vielstrahlinterfe-
renz einer großen Anzahl von interferierenden Wellen führt zu einer außerordentlichen
Schärfe der Reflexe.
∎ Für eine einfallende Welle mit vielen Wellenlängen sind natürlich viele Reflexe möglich.
∎ Es gibt viele verschiedene Möglichkeiten, ein Bravais-Gitter in Ebenenscharen zu unter-
teilen. Es gibt deshalb viele verschiedene Netzebenenabstände d und deshalb selbst bei
Bestrahlung mit monochromatischem Röntgenlicht viele verschiedene Streuwinkel θ,
für die konstruktive Interferenz beobachtet wird.
∎ θ ist der halbe Streuwinkel.
𝒌′
𝜑′ 𝒓
0
𝜑
Abb. 2.8: Zur Ableitung der von Laue Bedingung für kon-
𝒌 𝒌 = 𝒌′ struktive Interferenz bei der Streuung am dreidimensiona-
len Punktgitter.
33
68 2 Strukturanalyse
Wir führen die Einheitsvektoren in Richtung der einlaufenden und der gestreuten Welle
⧹︂ k k λ
k= = = k (2.2.3)
⋃︀k⋃︀ 2π⇑λ 2π
⧹︂ k′ k′ λ ′
k′ = ′ = = k (2.2.4)
⋃︀k ⋃︀ 2π⇑λ 2π
2.2 Beugung von Wellen an periodischen Strukturen 69
⋃︀r⋃︀ cos φ = r ⋅ ⧹︂
k (2.2.5)
Benutzen wir dies in (2.2.2), so können wir die Bedingung für konstruktive Interferenz
schreiben als
(k⧹︂′ − ⧹︂
k) ⋅ r = nλ n = 1, 2, 3, . . . (2.2.7)
k′ − k = ∆k = G . (2.2.10)
9
Paul Peter Ewald, geboren am 23. Januar 1888 in Berlin, gestorben am 22. August 1985 in Ithaca,
New York. Ewald promovierte an der Ludwig-Maximilians-Universität München bei Arnold Som-
merfeld. 1921 wurde er a.o. Professor an der TH Stuttgart, 1928 erhielt er dort ein eigenes kleines
Institut, das mit dem Röntgeninstitut von Richard Glocker eng kooperierte. Von 1932 bis 1933 war
er Rektor der Technischen Hochschule Stuttgart. Ewald war der erste, der die Röntgeninterferenzen
der Kristalle mit einer theoretischen Grundlage versah und die Einzelheiten der Röntgenstreu-
ungsversuche von Max von Laue (1911/12) verständlich machen konnte. Ewald begründete die
dynamische Theorie der Röntgeninterferenzen, die auch auf andere Strahlungsarten (Elektronen,
Neutronen, Licht) angewendet werden kann. Er erhielt dafür unter anderem die höchste Auszeich-
nung der Deutschen Physikalischen Gesellschaft, die Max-Planck-Medaille.
70 2 Strukturanalyse
𝒌′
𝑮
Beugungsreflex tritt nun immer nur genau dann auf, wenn auf der Ewald-Kugel ein Gitter-
punkt des reziproken Gitters zu liegen kommt. In diesem Fall weist die gebeugte Röntgen-
strahlung in die Richtung von k′ = k + G. Wir sehen, dass wir durch Änderung des Betra-
ges von k oder seiner Richtung immer erreichen können, dass Gitterpunkte des reziproken
Gitters auf der Ewald-Kugel zu liegen kommen und wir dadurch die Beugungsbedingung
erfüllen.
Andererseits wissen wir aus Abschnitt 2.1.5, dass für jede Ebenenschar ein reziproker Git-
tervektor Gmin ∥ G existiert, so dass
2π
⋃︀G⋃︀ = n⋃︀Gmin ⋃︀ = n , (2.2.12)
d
wobei d der Abstand der Ebenen in der betrachteten Ebenenschar ist. Einsetzen in (2.2.11)
ergibt
2π
n = 2k sin θ , (2.2.13)
d
woraus sich mit k = 2π⇑λ sofort die Bragg-Bedingung ergibt. Wir sehen also, dass die von
Laue- und Bragg-Bedingung äquivalent sind.
𝒌′
𝑮 𝑘 ′ sin 𝜃 = 𝑘 sin 𝜃
𝛉 𝛉
Netzebene 𝛉
Abb. 2.10: Zur Ableitung der Bragg- ℎ𝑘ℓ ⊥ 𝑮 𝑘 sin 𝜃
Bedingung aus den Laueschen Gleichungen. 𝒌
2.2 Beugung von Wellen an periodischen Strukturen 71
(k′ )2 = k 2 + 2k ⋅ G + G2 , (2.2.14)
2k ⋅ G + G2 = 0 (2.2.15)
folgt. Mit dem Einheitsvektor G ⧹︂ = G⇑⋃︀G⋃︀ und der Tatsache, dass auch −G ein reziproker Git-
tervektor ist, falls dies für G zutrifft, erhalten wir
⧹︂ =
k⋅G
G
. (2.2.16)
2
Dies ist eine äquivalente Form der von Laue Bedingung (2.2.10). Wir sehen, dass die Pro-
⧹︂ genau G⇑2 sein muss. Dies ist aber, wie Abb. 2.11 zeigt,
jektion des Wellenvektors k auf G
gerade für alle Punkte auf der Mittelebene zwischen 0 und G erfüllt. Vergleichen wir dies
mit der Konstruktionsvorschrift der Brillouin-Zonen, so erhalten wir folgenden wichtigen
Sachverhalt:
Jeder Wellenvektor vom Zentrum zum Rand einer Brillouin-Zone erfüllt die von Laue Be-
dingung.
(a) (b)
𝑮 𝒌′
jeder Wellenvektor vom Zentrum zum Rand einer Brillouin-Zone erfüllt die von
2.2.4 Allgemeine Beugungstheorie
Laue Bedingung
37
In einer etwas allgemeineren Formulierung der Beugung wollen wir annehmen, dass wir
keine Mehrfachstreuprozesse in der Probe haben, d. h. ein einmal gebeugter Strahl soll
kein zweites Mal gebeugt werden. Ferner nehmen wir an, dass eine feste Phasenbeziehung
zwischen der einlaufenden Welle und jeder der von einem Streuzentrum auslaufenden
Kugelwellen (kohärente Streuung) besteht. Diese kinematische Näherung ist äquivalent
zur Bornschen Näherung in der quantenmechanischen Streutheorie. Für Neutronen und
Röntgenstrahlung ist diese Näherung meistens adäquat, für Elektronen müssen allerdings
häufig Mehrfachstreuprozesse berücksichtigt werden.
Bei unserer Diskussion der Streuamplituden gehen wir von Abb. 2.12 aus. Die von einer
Punktquelle Q auslaufenden Kugelwellen können in genügend großem Abstand von der
72 2 Strukturanalyse
B
P
𝒌 = 𝒌′
Abb. 2.12: Schematische Darstellung der Streu-
ung: Die Quelle Q ist genügend weit von der L
zu untersuchenden Probe entfernt, so dass die
bei der Probe ankommenden Kugelwellen als
ebene Wellen approximiert werden können.
Das gleiche gilt für den Beobachtungspunkt B. Q
Quelle gut durch ebene Wellen approximiert werden. Die Amplitude am Ort P des Streu-
zentrums zur Zeit t kann deshalb als
geschrieben werden.10
Die relativen Phasen der einlaufenden Welle an verschiedenen Punkten P sind durch den
positionsabhängigen Phasenfaktor in (2.2.17) gegeben. Erlauben wir nun die Streuung der
einlaufenden Welle in der betrachteten Probe, so wird jeder Probenpunkt P Kugelwellen
emittieren, deren Amplitude und relative Phase zur einlaufenden Welle durch eine komplexe
Streudichte ρ(r) beschrieben werden kann. Die Zeitabhängigkeit dieser Kugelwellen soll in
unserer Betrachtung durch die Zeitabhängigkeit der einlaufenden Welle bestimmt werden
(erzwungene Schwingung). Die am Beobachtungspunkt B ankommenden Wellen können
deshalb durch
′ ′
e ık ⋅(L −r)
ΨB (t) = ΨP (r, t)ρ(r) (2.2.18)
⋃︀L′ − r⋃︀
beschrieben werden. Für große Abstände des Beobachters B können wir ⋃︀L′ − r⋃︀ ≃ L′ setzen
und erhalten durch Einsetzen von (2.2.17) in (2.2.18)
Ψ0 ık⋅L ık′ ⋅L′ −ı ω 0 t ′
ΨB (t) = ′
e e e ρ(r)e ık⋅r e−ık ⋅r . (2.2.19)
L
Wir nutzen nun noch aus, dass wir für große Abstände von Q und B (L, L′ ≫ r) in guter
Näherung annehmen können, dass für alle Positionen P in der Probe die Wellenvektoren k
10
Es soll hier darauf hingewiesen werden, dass die wohldefinierte Phase der einlaufenden Welle na-
türlich nur für eine ideale kohärente Lichtquelle gilt. Bei realen Lichtquellen werden Photonen
mehr oder weniger unkorreliert emittiert. Bei der Bestimmung der Intensität müssen wir dann
über eine große Zahl von individuellen Streuprozessen mitteln.
2.2 Beugung von Wellen an periodischen Strukturen 73
und k′ etwa gleich sind und wir k ∥ L und k′ ∥ L′ setzen können. Wir können dann nähe-
rungsweise schreiben:
Ψ0 ı(k L+k ′ L′ ) −ı ω 0 t ′
ΨB (t) = e e ρ(r)e ı(k−k )⋅r . (2.2.20)
L′
Die gesamte Streuamplitude am Beobachtungspunkt erhalten wir, indem wir über alle Posi-
tionen P im Probenvolumen aufintegrieren:
′
ΨB (t) ∝ e−ı ω 0 t ∫ ρ(r)e ı(k−k )⋅r d 3 r . (2.2.21)
Für Streuprozesse an einem starren Gitter ist ρ(r) zeitunabhängig und die Zeitabhängig-
keit von ΨB enthält nur die Frequenz ω 0 . Dies entspricht elastischer Streuung. Erlauben wir
dagegen Schwingungen des Gitters, so erhalten wir auch gestreute Wellen mit ω ≠ ω 0 . Dies
entspricht inelastischer Streuung.
In Beugungsexperimenten wird nicht die Amplitude sondern die Intensität
2
I(∆k) ∝ ⋃︀ΨB ⋃︀2 ∝ ⋀︀∫ ρ(r)e−ı ∆k⋅r d 3 r⋀︀ (2.2.22)
gemessen, wobei wir den Streuvektor ∆k = k′ − k eingeführt haben. Wir erkennen, dass die
Streuintensität dem Absolutquadrat der Fourier-Transformierten der Streudichte ρ(r) ent-
spricht. Wir können daraus ableiten, dass wir umso größere ∆k und damit Wellenvektoren k
der einlaufenden Welle benötigen, je kleiner die Strukturen sind, die wir auflösen wollen.
Die Tatsache, dass wir in Beugungsexperimenten nur die Intensität messen können, führt
zu einigen Schwierigkeiten. Könnten wir nämlich die komplexe Streuamplitude messen, so
könnten wir einfach eine inverse Fourier-Transformation vornehmen und hätten die gesuch-
te Streudichte bestimmt. Dies ist leider nicht möglich, da wir beim Experiment die Phasenin-
formation verlieren. Um aus I(∆k) auf die gesuchte Streudichte und damit die Kristallstruk-
tur zu schließen, müssen wir deshalb umgekehrt vorgehen. Wir wählen eine wahrscheinliche
Modellstruktur aus, berechnen I(∆k) und vergleichen die berechnete Intensität mit der ge-
messenen. Wir variieren dann die strukturellen Parameter so lange, bis wir eine genügend
gute Übereinstimmung zwischen Rechnung und Experiment erhalten haben.
Wir können nun einige Eigenschaften der Fourier-Transformation benutzen, um das obige
Ergebnis weiter zu diskutieren. Zunächst nutzen wir aus, dass für eine reelle Funktion das
Betragsquadrat seiner Fourier-Transformierten der Fourier-Transformierten seiner Auto-
korrelationsfunktion entspricht. Wir können also schreiben:11 , 12 , 13
11
Otto Föllinger, Laplace-, Fourier- und z-Transformation, bearbeitet von Mathias Kluw, 8. überar-
beitete Auflage, Hüthig, Heidelberg (2003).
12
Burkhard Lenze, Einführung in die Fourier-Analysis, 2. durchgesehene Auflage, Logos Verlag, Ber-
lin (2000).
13
M. J. Lighthill, Introduction to Fourier Analysis and Generalised Functions, Cambridge University
Press, Cambridge (2003).
74 2 Strukturanalyse
Die Autokorrelationsfunktion der Streudichte besitzt Maxima, immer wenn r einem Vektor
zwischen zwei Atomen in der Kristallstruktur entspricht.
Wir können weiter den Faltungssatz benutzen, der besagt, dass die Fourier-Transformierte
der Faltung zweier Funktionen gleich dem Produkt der Fourier-Transformierten der beiden
Originalfunktionen ist. Die Faltung zweier reeller Funktionen f und g ist dabei durch
∞
h(r) = f ⊗ g ≡ ∫ f (r′ )g(r − r′ )d 3 r ′ (2.2.25)
−∞
gegeben. Es ist leicht einzusehen, dass wir die Streudichte ρ(r) der gesamten Kristallstruk-
tur, die ja aus Gitter und Basis besteht, als Faltung einer Gitterfunktion g(r) und einer Streu-
funktion ρ B (r) der Basis schreiben können. Die Gitterfunktion g besteht dabei nur aus einer
Summe von δ-Funktionen, g(r) = ∑R δ(r − R), wobei wir über alle N Gitterpunkte R des
Bravais-Gitters in der betrachteten Probe aufsummieren müssen. Durch Anwendung des
Faltungssatzes können wir dann für die Streuamplitude schreiben:
ΨB ∝ FT(g ⊗ ρ B ) = FT(g) ⋅ FT(ρ B ) . (2.2.26)
Für die Fourier-Transformierte der Gitterfunktion, die häufig auch als Interferenzfunktion
bezeichnet wird, erhalten wir14
)︀
⌉︀
⌉︀N für ∆k = G
FT(g) = ∫ ∑ δ(r − R)e−ı ∆k⋅r d 3 r = ∑ e−ı ∆k⋅R = ⌋︀ . (2.2.27)
⌉︀
⌉︀0 für ∆k ≠ G
R R ]︀
Wir erhalten das bekannte Ergebnis, dass konstruktive Interferenz nur dann auftritt, wenn
∆k = G (von Laue Bedingung). Das Gitter wählt uns also die möglichen Streuvektoren
∆k = G aus.
Um die Streuamplitude von Gitter und Basis zu erhalten, müssen wir jetzt noch mit der
Fourier-Transformierten der Streudichte der Basis multiplizieren. Diese wird als Struktur-
faktor S G bezeichnet und ist gegeben durch:
Der Strukturfaktor wird häufig auch mit den Millerschen Indizes (hkℓ) versehen, da diese
den reziproken Gittervektor G festlegen.15 Die gesamte Streuamplitude am Beobachtungsort
14
Zur Herleitung der Fourier-Transformierten der δ-Funktion sowie einer Summe von δ-Funktio-
nen siehe M. J. Lighthill, Introduction to Fourier Analysis and Generalised Functions, Cambridge
University Press, Cambridge (2003).
15
Falls keine Absorption der Strahlung im untersuchten Festkörper erfolgt, ist ρ B (r) eine reelle Funk-
tion, d. h. es gilt ρ hkℓ = ρ ∗h k ℓ und damit S hkℓ = S h k ℓ . Diesen Sachverhalt bezeichnet man als Friedel-
Regel.
2.2 Beugung von Wellen an periodischen Strukturen 75
ΨB ∝ N ∫ ρ B (r)e−ıG⋅r d 3 r = N ⋅ S G (2.2.29)
Zelle
Wir können nun den Faltungssatz nochmals anwenden, um Gleichung (2.2.28) noch weiter
zu zerlegen. Wir können nämlich die Funktion ρ B wiederum als Faltung einer Basisfunktion
b(r) = ∑ j δ(r − r j ) und einer Atomfunktion ρ A schreiben. Erstere besteht aus einer Summe
j
von δ-Funktionen, die uns die Positionen r j der Atome in der Basis angeben. Die Atom-
j
funktion ρ A beschreibt die Streudichte des Atoms an der Position r j . Die Anwendung des
Faltungssatzes ergibt
und damit
Die Fourier-Transformierte der Streudichte ρ A (r̃) um das j-te Basisatom können wir schrei-
j
ben als
FT(ρ A ) = ∫ ρ A (r̃)e−ıG⋅r̃ d 3 r̃ .
j j
(2.2.33)
Atom
Hierbei gibt r̃ den Ortsvektor vom Zentrum des betrachteten j-ten Atoms zu einem Volu-
menelement seiner Elektronenhülle an (siehe Abb. 2.13). Damit erhalten wir insgesamt
⎨ ⎬
⎝ ⎠
SG = ∑ e −ıG⋅r j ⎝
⋅ ⎝ ∫ ρ A (r̃)e
j −ıG⋅r̃ 3 ⎠
d r̃ ⎠ = ∑ f j e−ıG⋅r j . (2.2.34)
⎝ ⎠
j ⎪ Atom ⎮ j
16
Anmerkung: Wir könnten die von Laue Bedingung auch aus (2.2.29) ableiten, indem wir ρ(r), d. h.
die Streudichteverteilung des gesamten Kristalls, Fourier-zerlegen. Da ρ(r) gitterperiodisch sein
sollte, gilt
ρ(r) = ∑ ρ G e ıG⋅r .
G
Für genügend große Kristalle findet man, dass das Integral nur Beiträge liefert, falls G = k′ − k =
∆k.
76 2 Strukturanalyse
𝒓
Gitterpunkt 𝑹
Abb. 2.13: Zu den Bezeichnungen bei 𝒓𝒋
der Ableitung des Atomformfaktors. Basisatom 𝒋
Den Ausdruck in den rechteckigen Klammern nennt man den Atomformfaktor oder ato-
maren Streufaktor:
42
f j = FT(ρ A ) = ∫ ρ A (r̃)e−ıG⋅r̃ d 3 r̃ .
j j
(2.2.35)
Atom
Wir sehen, dass der Strukturfaktor durch die Summe der Fourier-Transformierten der La-
dungsverteilung der einzelnen Basisatome gegeben ist, wobei jeder Term noch mit einem
geeigneten Phasenfaktor multipliziert werden muss, der von der Position r j des Atoms in
der Basis abhängt. Für eine Basis mit nur einem Atom erhalten wir S G = f .
Für Atome mit einer kugelförmigen Ladungsverteilung vereinfacht sich die Integration
in (2.2.35), da die atomare Ladungsverteilung ρ A nur von ⋃︀r̃⋃︀ abhängt. Wir erhalten (wir
j
ersetzen r̃ durch r)
RA π 2π
f (G) = ∫ ρ A (r)e−ıG⋅r d 3 r = ∫ dr ∫ d ϑ ∫ dφρ A (r)r 2 sin ϑe−ıGr cos ϑ . (2.2.36)
Atom 0 0 0
Die Integration über r erfolgt dabei bis zum Rand R A des Atoms. Führen wir die Integration
über die Polarwinkel aus, so erhalten wir
RA
sin Gr
f (G) = ∫ 4πr 2 ρ A (r) dr . (2.2.37)
Gr
0
wobei a B der Bohrsche Radius ist. Setzen wir diese Ladungsverteilung in (2.2.37) ein und
lassen die Integrationsgrenze R A → ∞ gehen, so erhalten wir den Atomformfaktor zu
1
f (G) = . (2.2.39)
2 2
[︀1 + ( 12 a B G) ⌉︀
Grenzfall G → 0 näher zu betrachten. Da hier sin Gr⇑Gr → 1, vereinfacht sich die Integrati-
on in (2.2.37) zu
RA
f (G → 0) = ∫ 4πr 2 ρ A (r)dr = Z . (2.2.40)
0
Dieser Grenzfall ist für sehr kleine Streuvektoren, also in Vorwärtsrichtung realisiert. Da die
Streuintensität proportional zu f 2 ist, ist sie bei kleinen Streuwinkeln also proportional zu Z 2
und wird damit ausschließlich durch die Elektronenzahl des Atoms bestimmt. Für Röntgen-
j
streuung ist die Streuamplitude ρ A durch die Elektronendichte des j-ten Atoms bestimmt.
Wir erwarten deshalb, dass die Streuintensität etwa proportional zu Z 2 ist. Wir sehen also,
dass leichte Elemente neben schweren Elementen durch Röntgenbeugung nur schwer nach-
gewiesen werden können.
Zusammenfassend wollen wir folgenden wichtigen Sachverhalt festhalten:
Bei der Strukturanalyse mittels Beugungsmethoden kann die Form und die Abmessungen
der Einheitszelle aus der Lage der Röntgenreflexe bestimmt werden. Der Inhalt der Ein-
heitszelle, also die Basis, muss dagegen aus den Intensitäten der Reflexe bestimmt werden.
Wir sehen, dass wir eine starke Abschwächung der Intensität verschiedener Beugungsreflexe
erhalten können.
folgt dann:
S hk ℓ = f )︀1 + e−ı π(k+ℓ) + e−ı π(h+ℓ) + e−ı π(h+k) ⌈︀
)︀
⌉︀
⌉︀
⌉︀
⌉︀
4f falls alle h, k, ℓ gerade oder ungerade
= ⌋︀0 falls ein Index gerade und die anderen . (2.2.44)
⌉︀
⌉︀
⌉︀
⌉︀
]︀ beiden ungerade oder umgekehrt
Wir sehen, dass für das fcc-Gitter keine Reflexe auftreten können, für die die Indizes teilweise
gerade und ungerade sind.
1. Für T > 0 erhalten wir thermisch angeregte Schwingungen des Kristallgitters (siehe Ka-
pitel 5).
2. Selbst für T = 0 erhalten wir so genannte Nullpunktsschwingungen, deren Existenz wir
mit einer quantenmechanischen Betrachtung verstehen können.
Wir wollen im Folgenden auf den Einfluss der Gitterschwingungen auf die beobachteten
Beugungsreflexe eingehen. Bei einer naiven Betrachtung könnten wir vermuten, dass durch
die Bewegung der Atome die elastischen Beugungsreflexe stark verbreitert würden. Wir wer-
den allerdings sehen, dass dies nicht der Fall ist. Die Beugungsreflexe bleiben scharf, aller-
dings nimmt ihre Intensität ab.
Bei Raumtemperatur sind die typischen Schwingungsamplituden der Atome in der Größen-
ordnung von bis zu 10 % des Atomabstandes. Die Abweichungen von der strengen Periodi-
zität des Gitters, die durch diese Schwingungen erzeugt werden, sind also signifikant. Auf-
grund der Schwingungen des Gitters erhalten wir auch gestreute Wellen mit ω ≠ ω 0 . Dies
entspricht inelastischer Streuung. Bei der inelastischen Streuung wird beim Streuprozess
Energie von der einlaufenden Welle auf das Gitter übertragen und umgekehrt.
Aus der kohärenten elastischen Streuung am starren Kristallgitter erhalten wir Informatio-
nen über die Anordnung der Atome im Kristallgitter. Diese steckt in den erlaubten Streuvek-
toren ∆k = G (von Laue Bedingung) und der für diese Streuvektoren gemessenen Streuin-
tensität, die durch den Strukturfaktor S G gegeben ist. Um Auskunft über die Dynamik des
Gitters zu bekommen (diese werden wir im Detail erst in Kapitel 5 diskutieren), müssen
wir die in Abschnitt 2.2.4 gemachten Überlegungen vertiefen und in der Streutheorie die
zeitliche Veränderung der Position der Gitteratome berücksichtigen.
Wir schreiben die momentane Position r eines Atoms als
wobei R ein Gittervektor, r j die Ruheposition des Atoms in der Gitterzelle und u(t) die
momentane Auslenkung des Atoms aus seiner Ruhelage r j ist. Wir benutzen ferner den all-
gemeinen Ausdruck (2.2.21) für die gesamte am Beobachtungspunkt B erhaltene Streuam-
plitude
Wir nutzen nun aus, dass die Auslenkung u(t) der Atome klein gegenüber dem Gitterab-
stand a ist. Da 1⇑∆k ∼ 1⇑Gmin = a⇑2π und u ≪ a folgt ∆k ⋅ u(t) ≪ 1. Wir können deshalb
80 2 Strukturanalyse
Wir werden zunächst nur den konstanten und linearen Entwicklungsterm berücksichtigen.
Die Diskussion des quadratischen Terms folgt im nächsten Abschnitt. Er führt zu einer Re-
duzierung der elastischen Streuintensität, die durch den Debye-Waller-Faktor angegeben
wird.
Setzen wir (2.2.48) in (2.2.47) ein, so erhalten wir
Den elastischen Beitrag haben wir bereits in Abschnitt 2.2.4 diskutiert. Wir haben dort gese-
hen, dass wir eine endliche Streuintensität nur dann bekommen, wenn die von Laue Bedin-
gung ∆k = G erfüllt ist. Der genaue Wert der Streuintensität war durch den Strukturfaktor
S G gegeben.
Wir wollen nun den zweiten Term auf der rechten Seite von (2.2.49) diskutieren, den wir
inelastischen Streuprozessen zuordnen können. Hierzu müssen wir einen vernünftigen An-
satz für die Auslenkung u(t) der Atome machen. Wie wir in Kapitel 5 sehen werden, ist ein
geeigneter Ansatz eine Überlagerung von ebenen Wellen
mit Amplituden uq , die vom Wellenvektor und der Temperatur abhängen. Setzen wir diesen
Ansatz in (2.2.49) ein, so erhalten wir für die inelastische Streuamplitude
Wir sehen sofort, dass wir eine endliche Streuintensität nur für die modifizierte Streubedin-
gung
∆k ± q = G (2.2.52)
erhalten. Bilden wir das Zeitmittel, so sehen wir, dass sich eine endliche Streuintensität nur
unter der Bedingung
ω0 ± ωq = ω (2.2.53)
17
Wir benutzen: ex = 1 + x + 12 x 2 + . . .
2.2 Beugung von Wellen an periodischen Strukturen 81
ergibt. Wir können (2.2.52) und (2.2.53) mit dem Planckschen Wirkungsquantum multipli-
zieren und erhalten
Diese Ausdrücke können wir als Impuls- und Energieerhaltung bei einem inelastischen
Streuprozess interpretieren. Wir werden in der Tat in Kapitel 5 sehen, dass wir die Quanten
der Gitterschwingungen – wir werden diese als Phononen bezeichnen – als Teilchen mit
Energie ħω q und Quasiimpuls ħq auffassen können. Der Impuls ħG wird an den Kristall als
Ganzes übertragen.
im Folgenden zeigen, dass dieser Term in einer Abnahme der elastischen Beugungsintensität
resultiert.
Wir schreiben die Position des j-ten Atoms in einer Einheitszelle als r(t) = R + r j + u(t),
wobei R ein Gittervektor, r j die Ruheposition des j-ten Atoms in der Basis und u(t) die
momentane Auslenkung des j-ten Atoms aus seiner Ruhelage sind. Wir betrachten nun die
Streuamplitude in Richtung k′ = k + G:
ΨB ∝ N S G = N ∑ f j e−ıG⋅r j . (2.2.56)
j
Wir ersetzen nun r j durch r j + u(t) und bilden den zeitlichen Mittelwert ∐︀. . .̃︀ t .18 Dabei
nehmen wir vereinfachend ferner an, dass die Basis aus gleichen Atomen besteht, d. h. u(t)
ist für alle Atome der Basis gleich. Wir erhalten dann
Dabei ist S Gstat der so genannte statische Strukturfaktor.19 Da G ⋅ u ≪ 1, können wir die Ex-
ponentialfunktion entwickeln und erhalten
T
18 1
Zeitlicher Mittelwert einer Funktion f (t): ∐︀ f (t)̃︀ t = lim T ∫ f (t)dt.
T→∞ 0
19
Man beachte: S Gstat ≠ S G (T = 0) aufgrund von Nullpunktsschwingungen.
82 2 Strukturanalyse
Da bei einer zufälligen thermischen Bewegung der Atome die Richtung von u und G völlig
unkorreliert ist, gilt
∐︀ıu(t) ⋅ G̃︀ t = 0 . (2.2.59)
Führen wir den Winkel ϑ = ∢(u, G) ein, so können wir den quadratischen Term schreiben
als
1
2
∐︀(u(t) ⋅ G)2 ̃︀ = 21 ∐︁u 2 (t)G 2 cos2 ϑ̃︁ t = 16 G 2 ∐︁u 2 (t)̃︁ t . (2.2.60)
Hierbei ist ∐︀u 2 (t)̃︀ das mittlere thermische Auslenkungsquadrat. Der Faktor 1⇑3 entsteht
dabei durch die Mittelung von cos2 ϑ über eine Kugel.20
Setzen wir das Ergebnis (2.2.60) in (2.2.58) ein, so erhalten wir
∐︁u 2 (t)̃︁
∐︀S G ̃︀ t = S Gstat )︀1 − 16 G 2 ∐︁u 2 (t)̃︁ t + . . .⌈︀ ≃ S Gstat e− 6 G
1 2
, (2.2.61)
wobei wir für die Näherung im letzten Term wiederum die Entwicklung der Exponential-
funktion zugrunde gelegt haben. Für die im Experiment beobachtete elastische Streuinten-
sität I ∝ S G2 erhalten wir
∐︁u 2 (t)̃︁
I = I 0 e− 3 G
1 2
. (2.2.62)
Der Exponentialfaktor wird als Debye-Waller-Faktor bezeichnet21 , 22 .
Um die Temperaturabhängigkeit des Debye-Waller-Faktors zu analysieren, müssen wir be-
achten, dass die mittlere potenzielle Energie ∐︀Ũ︀ t eines harmonischen Oszillators in 3 Di-
mensionen gerade 32 k B T beträgt (dies folgt aus dem Gleichverteilungssatz). Wir können also
schreiben
∐︀Ũ︀ t = 12 k∐︀u 2 (t)̃︀ t = 12 Mω 2 ∐︀u 2 (t)̃︀ t = 32 k B T . (2.2.63)
⌈︂ ist k die Kraftkonstante, M die Atommasse und für die Schwingungsfrequenz gilt
Hierbei
ω = k⇑M. Einsetzen in (2.2.62) ergibt:
k T
− MBω 2 G 2
I hkℓ = I 0 e . (2.2.64)
Dabei sind (hkℓ) die Millerschen Indizes, bzw. die Indizes des reziproken Gittervektors G =
hb1 + kb2 + ℓb3 . Das Resultat (2.2.64) ist in Abb. 2.15a dargestellt.
Wir können aus (2.2.64) folgende Schlüsse ziehen:
1. Die Intensität der elastischen Beugungsreflexe nimmt mit zunehmender Temperatur ab,
verschwindet aber nicht.
2. Bei fester Temperatur nimmt die Intensität mit wachsendem h + k + ℓ ab.
2π
20 ∫0 dφ ∫0π dϑ sin ϑ cos 2 ϑ
Es gilt: cos2 ϑ = 2π dφ ∫0π dϑ sin ϑ
= 13 .
∫0
21
P. Debye, Interferenz von Röntgenstrahlen und Wärmebewegung, Ann. d. Phys. 348, 49–92 (1913).
22
I. Waller, Zur Frage der Einwirkung der Wärmebewegung auf die Interferenz von Röntgenstrahlen,
Zeitschrift für Physik A 17, 398–408 (1923).
2.2 Beugung von Wellen an periodischen Strukturen 83
(a)
10
0 (b) 10
(200) Bragg T=0
(400) 8 Reflex
I (bel. Einh.)
(600) 6
Ihkl / I0
(800) 4
2 diffuser T>0
(10,00)
10
-1 Untergrund
0
0 100 200 300 400 40 45 50 55 60
T (K) (°)
Abb. 2.15: (a) Abnahme der elastischen Streuintensität mit zunehmender Temperatur und zunehmen-
dem h + k + ℓ. Die Kurven wurden nach (2.2.64) für Mω 2 ⇑G 2 = 2 × 10−19 J berechnet. In (b) ist die
Umverteilung der elastischen Streuintensität aus dem Bragg-Reflex in einen inelastischen Untergrund
bei Erhöhung der Temperatur veranschaulicht.
Die für einen elastischen Beugungsreflex beobachtete Intensität I hkℓ ist nur durch die kohä-
rente, elastische Streuung gegeben. Diese resultiert in einem scharfen Beugungsreflex, dessen
Intensität mit wachsender Temperatur abnimmt. Die inelastisch gebeugten Strahlen resul-
tieren in einem diffusen Untergrund, dessen Intensität mit zunehmender Temperatur wächst
(siehe Abb. 2.15b).
Wir wollen abschließend noch anmerken, dass nicht nur die elastische Streuintensität son-
dern auch die inelastische Streuintensität um den Debye-Waller-Faktor reduziert wird. Dies
wollen wir hier nicht explizit zeigen. Allgemein kann gezeigt werden, dass die Potenz, mit
der die Auslenkung u in der Entwicklung (2.2.48) vorkommt, der Zahl der am Streuprozess
teilnehmenden Gitterschwingungen (Phononen) entspricht. Der konstante Term entspricht
also (elastischen) Null-Phononen-Prozessen, der lineare Term Ein- und der quadratische
Zwei-Phononen-Prozessen. Prozesse noch höherer Ordnung können wegen ∆k ⋅ u ≪ 1 in
sehr guter Näherung vernachlässigt werden.
2.2.7.1 Zahlenbeispiele
Abnahme von I bei Raumtemperatur: Mit einer Gitterkonstanten a von einigen
Ångström folgt G = n 2π a
∼ 1011 m−1 . Mit einer typischen Schwingungsfrequenz von
ω ∼ 10 s und typischen Atommasse M ∼ 10−25 kg erhalten wir Mω 2 ⇑G 2 ≃ 10−19 J. Bei
14 −1
Raumtemperatur (k B T ≃ 4 × 10−21 J) ergibt sich daraus Mk BωT2 G 2 ∼ 0.04 und damit für I⇑I 0
ein Wert von ≃ 0.96. Wir sehen, dass die Abnahme der Intensität der Beugungsreflexe nicht
dramatisch ist.
− 2Mħ ω G 2
I hkℓ = I 0 e . (2.2.65)
Mit den obigen Zahlen erhalten wir ħG 2 ⇑2Mω ∼ 0.05 und damit I⇑I 0 ∼ 0.95. Wir sehen,
dass selbst bei T = 0 aufgrund der quantenmechanischen Nullpunktsschwingungen nur et-
wa 95 % der gestreuten Intensität aus elastischen Streuprozessen resultiert.
p2 ħ2 k 2 E γ2
R= = = . (2.2.68)
2M 2M 2Mc 2
Für E γ = 100 keV und M = M n = 1.67 × 10−27 kg (Neutronenmasse) folgt R = 8.5 ×
10−19 J = 5.3 eV. Diese Rückstoßenergie ist wesentlich größer als die natürliche Linien-
breite des Strahlungsübergangs, der im Bereich von 10−7 eV liegt.
Die thermische Verbreiterung der Spektrallinie eines Atoms aufgrund seiner thermischen
Bewegung ist ∆ν ≃ ν(v th ⇑c), da die mittlere thermische Geschwindigkeit v th ≪ c. Den dar-
aus resultierenden Dopplereffekt
∐︀∆ω 2 ̃︀ ∐︀∆v 2 ̃︀
= (2.2.69)
ω2 c2
können wir unter Benutzung von 12 M∐︀v 2 ̃︀ ≃ k B T zu
ω2 ω 2 2k B T
∐︀∆ω 2 ̃︀ = ∐︀∆v 2
̃︀ = (2.2.70)
c2 c2 M
abschätzen. Wir erhalten daraus
E 02
∐︀∆E 2 ̃︀ = ħ 2 ∐︀∆ω 2 ̃︀ = 4k B T = R ⋅ 4k B T . (2.2.71)
2Mc 2
2.2 Beugung von Wellen an periodischen Strukturen 85
Für E 0 = 100 keV und M = M n erhalten wir für T = 300 K für die Energieverschmierung
∐︀∆E 2 ̃︀1⇑2 ≃ 0.7 eV ≃ 0.1R. Wir sehen also, dass sowohl die Rückstoßenergie und die Dopp-
lerverbreiterung wesentlich größer sind als die natürliche Linienbreite und deshalb keine
Resonanzabsorption, d. h. die Absorption eines emittierten γ-Quants durch ein gleicharti-
ges Atom, auftreten kann (siehe hierzu Abb. 2.16).
Die Situation ändert sich völlig, wenn wir ein in ein Kristallgitter eingebautes Atom betrach-
ten. Dem Rückstoß des freien Atoms entspricht hier die Emission oder Absorption eines
Quants der Gitterschwingung, d. h. eines Phonons (siehe hierzu Kapitel 5). Wir können auch
rückstoßfreie γ-Emission oder Absorption erhalten, wenn kein Phonon emittiert oder ab-
sorbiert wird. Die dadurch erhaltene Linie nennen wir Null-Phononenlinie oder Mößbauer-
Linie.
86 2 Strukturanalyse
10
Emission Absorption
8
I (bel. Einh.)
6
natürliche
Abb. 2.16: Bei der Emission eines 4 Linienbreite
γ-Quants von einem freien Atom ist
die natürliche Linienbreite wesentlich 2 -R +R
kleiner als die Rückstoßenergie R. Die
entsprechenden Linien für Emission
bei E 0 − R und Absorption bei E 0 + R 0
-2 -1 0 1 2
haben keinen Überlapp, so dass keine
Resonanzabsorption stattfinden kann. (E-E0) / R
In Analogie zu (2.2.64) in Abschnitt 2.2.7 können wir die Intensität der Mößbauer-Linie
relativ zur Gesamtintensität durch
k T
I − B2 k 2
D(T) = = e MωPh (2.2.72)
I0
ausdrücken. Hierbei ist k der Wellenvektor des γ-Quants und ω Ph die Phononenfrequenz.
Für T = 0 erhalten wir aufgrund der Nullpunktsschwingungen
2
I − ħ k2
D(0) = = e 2M ħωPh . (2.2.73)
I0
Die rückstoßfreie Emission und Absorption von Kern-Gammastrahlung, wird heute inten-
siv für die so genannte Mößbauer-Spektroskopie verwendet. Die Mößbauer-Spektroskopie
ist eine Kernspektroskopiemethode. Etwa 40 Elemente besitzen die für die Beobachtung des
Mößbauer-Effektes nötigen niederenergetischen Gammaübergänge. Die Mößbauer-Spek-
troskopie an Eisen hat aufgrund des häufigen Vorkommens dieses Elementes in der Erd-
kruste Bedeutung für viele Forschungsgebiete, so etwa für die Festkörperchemie, die Metall-
urgie, die Geologie, die Biologie, die Medizin, oder die Entwicklung von Magnetspeichern.
Die Energie des Kernübergangs des Isotops 57 Fe vom Grundzustand mit Kernspin I = 1⇑2
zum ersten angeregten Zustand mit I = 3⇑2 beträgt 14.4 keV. Wegen der äußerst geringen
energetischen Breite der Emissionslinie führen geringfügige Energieverschiebungen des Zu-
standes des Atomkerns in einem typischen Energiebereich von 10−4 eV zu einer Zerstörung
der Resonanzbedingung und es findet keine Absorption mehr statt. Solche Energieverschie-
bungen und quantenmechanische Aufspaltungen werden über elektrische und magnetische
Felder von der chemischen und kristallographischen Umgebung des Eisenatomkerns verur-
sacht und diese sind charakteristisch für jede Eisenverbindung, also quasi der Mößbauer-
Fingerabdruck jedes eisenhaltigen Minerals. Das Problem lautet also: Wie kann man einen
so geringen Energieunterschied bei einem Energieübergang von 14.4 keV messen? Dies ge-
lingt nur mit Hilfe des Mößbauer-Effekts, also der rückstoßfreien Resonanzabsorption. Man
kann die Energieverschiebungen vermessen, indem die Energie des von der radioaktiven
2.3 Experimentelle Methoden 87
Quelle emittierten γ-Quants mittels des Dopplereffekts, d. h. durch Bewegen der Quelle mit
einer bekannten Geschwindigkeit, so weit geändert wird, bis wieder Resonanzabsorption
stattfindet.
2.3.1 Wellentypen
Beugungsexperimente können nicht nur mit elektromagnetischen Wellen (Röntgen-Strah-
lung), sondern auch mit Materiewellen (z. B. Elektronen, Neutronen, Helium-Atomen)
durchgeführt werden. Letzteren können wir über die de Broglie23 Beziehung eine Wellen-
länge
h
λ= (2.3.1)
p
zuordnen. Für nicht-relativistische Teilchen besteht zwischen der kinetischen Energie E und
dem Impuls eines Teilchens mit der Masse M der Zusammenhang
⌋︂
p = 2ME . (2.3.2)
h
λ = ⌋︂ . (2.3.3)
2ME
Die Abhängigkeit der Wellenlänge von der Energie ist für einige Wellentypen in Abb. 2.17
dargestellt. Wir sehen, dass für Neutronen eine Energie von 0.08 eV einer Wellenlänge von
1 Å entspricht. Diese Energie ist nahe bei der thermischen Energie k B T ≃ 0.025 eV für T =
300 K. Wir sprechen deshalb bei den für Beugungsexperimente verwendeten Neutronen von
thermischen Neutronen.
23
Louis Victor de Broglie, geboren am 15. August 1892 in Dieppe, Frankreich, gestorben am 19. März
1987 in Louveciennes, Frankreich, Nobelpreis für Physik 1929 für die Entdeckung der Wellennatur
der Elektronen.
88 2 Strukturanalyse
1
10
(Å)
0
10
Abb. 2.17: Die de Broglie Wellen-
𝑬 ≃ 𝒌𝐁 ⋅ 𝟑𝟎𝟎 𝐊
länge von Photonen, Elektronen,
Neutronen und Heliumatomen als
Funktion der Teilchenenergie ange-
geben in Einheiten von 100 keV für
Photonen, 1 keV für Elektronen und -1
1 eV für Neutronen und Heliumato- 10 -2 -1 0
10 10 10
me. Der hinterlegte Bereich markiert Photonen: 100 keV
den thermischen Energiebereich für Energie Elektronen: 1 keV
Neutronen zwischen 20 und 30 meV. Neutronen, Helium: 1 eV
51
Bei der Auswahl der Wellenart für Beugungsexperimente müssen wir Folgendes beachten:
1. Die Wellenlänge muss in der Größenordnung der Gitterkonstante des Kristallgitters lie-
gen, d. h. λ ∼ 1 Å, um die Bragg-Bedingung erfüllen zu können.
2. Die Dämpfung der Wellen im Festkörper sollte nicht zu groß sein. Die Intensität der Wel-
le nach Durchdringen der Dicke d ist durch I = I 0 e−µd gegeben, wobei µ die Absorpti-
onskonstante bzw. 1⇑µ die Absorptionsdicke ist. Für Untersuchungen der Kristallstruk-
tur sollte diese mindestens so groß sein wie die Kristallabmessungen, also typischerweise
1–10 mm.
In Tabelle 2.1 fassen wir einige wichtige Größen von Röntgenstrahlung und einigen Mate-
riewellen zusammen. Es werden allerdings keine Angaben zur Absorptionsdicke gemacht,
da diese stark von der Energie der Strahlung sowie der Dichte und Massenzahl des bestrahl-
ten Materials abhängt. Die typischen Werte für die Absorptionsdicke liegen für Elektronen
im nm- bis µm-Bereich. Deshalb müssen für die Elektronenbeugung die zu untersuchen-
den Proben auf kleine Dicken abgedünnt werden, was in vielen Fällen einen erheblichen
Aufwand bedeutet. Für Röntgenstrahlung und Neutronen liegen die Absorptionsdicken da-
gegen typischerweise im mm- bis cm-Bereich.
2.3.1.1 Röntgenstrahlung
Röntgenstrahlung kann durch Beschuss eines Metalltargets (z. B. Cu, Mo) mit hochenergeti-
schen Elektronen erzeugt werden.24 Bei der Abbremsung der schnellen Elektronen entsteht
Röntgenstrahlung, die aus einem kontinuierlichen Bremsspektrum besteht, dem charakte-
ristische Röntgenlinien überlagert sind. Das Bremsspektrum entsteht durch die Abbremsung
der Strahlelektronen im Target. Die charakteristischen Röntgen-Linien entstehen durch das
Herausschlagen von Elektronen aus den inneren Schalen der Targetatome und anschlie-
ßendes Wiederauffüllen mit Elektronen aus höheren Schalen. Die so genannte K-, L- oder
M-Strahlung entsteht dabei durch den Übergang von Elektronen aus den äußeren Schalen
in die K-, L- oder M-Schale.
Für Cu- und Mo-Anoden erhalten wir für die Wellenlänge der charakteristischen K α 1 -Linie:
Die obige Tabelle zeigt, dass man mit den üblichen Röntgenröhren keine hohe Brilli-
anz25 erzeugen kann. Die heute erreichten Werte liegen üblicherweise unterhalb von 108
Photonen/mm2 s mrad2 0.1 %BW (BW = Bandbreite). Wesentlich höhere Werte im Bereich
von 1020 Photonen/mm2 s mrad2 0.1 %BW erreicht man heute mit Synchrotron-Strahlungs-
quellen der dritten Generation. Die Röntgenstrahlung wird hier durch die Ablenkung der
hochenergetischen Elektronen eines Beschleunigerrings durch Magnetfelder erzeugt. Rönt-
genstrahlung ist heute mit einer sehr hohen Intensität und guter Monochromasie verfügbar.
Sie eignet sich aufgrund ihrer großen Absorptionsdicke sehr gut für Strukturuntersuchun-
gen. Allerdings werden leichte Elemente mit Röntgenstrahlung schlecht gesehen, da der
Streuquerschnitt mit Z 2 geht.
2.3.1.2 Elektronen
Die in einen Kristall eingeschossenen Strahlelektronen werden an den Gitterbausteinen
durch Coulomb-Wechselwirkung mit den Hüllenelektronen sowie den Kernen der Gitter-
atome gestreut. Die im Unterschied zur Röntgenstrahlung zusätzliche Wechselwirkung mit
den Atomkernen ist bei der Berechnung des atomaren Streufaktors zu berücksichtigen. Aus
Abb. 2.17 entnehmen wir, dass Elektronen mit einer Wellenlänge von etwa 1 Å eine Energie
von nur etwa 150 eV besitzen. Die Reichweite von solchen niederenergetischen Elektronen
in Festkörpern ist sehr klein (1–5 nm für E = 10–1000 eV), weshalb sich die Elektronen-
beugung hauptsächlich für die Untersuchung von Kristalloberflächen eignet (z. B. LEED:
24
W. C. Röntgen, Über eine neue Art von Strahlen, vorläufige Mitteilung, in Aus den Sitzungsberichten
der Würzburger Physik, medic. Gesellschaft, Würzburg (1895).
25
Die Brillianz einer Lichtquelle ist durch die Zahl der Photonen pro Flächeneinheit, Zeiteinheit,
Winkelelement und Frequenzband gegeben.
90 2 Strukturanalyse
Low Energy Electron Diffraction; RHEED: Reflection High Energy Electron Diffraction).
Mit der Elektronenbeugung können insbesondere sehr dünne Oberflächenschichten (z. B.
Oxidschichten auf Metallen) untersucht werden. Diese lassen sich mit Röntgenbeugung nur
schlecht erfassen.
In Elektronenmikroskopen (siehe Abschnitt 1.6.1) werden typischerweise Elektronenener-
gien von einigen 100 keV verwendet. Die de Broglie Wellenlänge beträgt dann nur einige
pm. In diesem Fall lässt sich die Braggsche Beugungsbedingung nur dann erfüllen, wenn
der Winkel zwischen Strahlrichtung und Gitterebene nicht größer als etwa 2○ ist. Der Vor-
teil der Elektronenbeugung ist, dass der Elektronenstrahl sehr gut fokussiert werden kann
und deshalb Beugungsexperimente an sehr kleinen Probenausschnitten (z. B. an einzelnen
Kristalliten in polykristallinen Proben) gemacht werden können. In Elektronenmikrosko-
pen arbeitet man in Transmission. Die starke Streuung der Strahlelektronen erfordert, um
Mehrfachstreuungen klein zu halten, eine sehr aufwändige Dünnschliffpräparation der zu
untersuchenden Proben (typische Probendicken: < 100 nm).
2.3.1.3 Neutronen
Die Masse des Neutrons ist 1836 mal größer als die des Elektrons. Deshalb ist bei gleicher
de Broglie Wellenlänge die Energie des Neutrons um den gleichen Faktor geringer. Aus
Abb. 2.17 entnehmen wir, dass zu einer Wellenlänge von 1 Å Neutronen mit Energien ge-
hören, die etwa der thermischen Energie k B T ≃ 25 meV bei Raumtemperatur entsprechen.
Die verwendeten Neutronenquellen müssen also für die Strukturuntersuchung so genann-
te thermische Neutronen in genügend hoher Intensität liefern. Kernreaktoren liefern heu-
te einen Fluss von etwa 1015 Neutronen/cm2 s (Hochflussreaktor in Grenoble, Garchinger
Forschungsreaktor FRM II). Mit so genannten Spallationsquellen, bei denen Protonen auf
ein Target (z. B. Pb) geschossen werden und dadurch Neutronen erzeugt werden, können
Flüsse von mehr als 1016 Neutronen/cm2 s erzielt werden, allerdings bei gepulstem Betrieb.
In Abb. 2.18 ist das Dreiachsen-Spektrometer PUMA am Garchinger Forschungsreaktor
FRM II gezeigt. Zur Monochromatisierung von Neutronen werden üblicherweise Einkris-
tallspektrometer, bei denen die Beugungsbedingung zur Wellenlängenselektion verwendet
wird, oder Flugzeitspektrometer, bei denen Neutronen mit bestimmter Energie über ihre
Flugzeit zwischen zwei rotierenden Blenden ausgewählt werden, eingesetzt.
Neutronen sind ungeladene Teilchen, so dass die Coulomb-Wechselwirkung, die bei Elek-
tronen dominiert, hier keine Rolle spielt. Neutronen wechselwirken mit den Kernen der
Gitteratome. Während allerdings der atomare Streufaktor bei der Röntgenstrahlung einer
systematischen Abhängigkeit (proportional zur Ordnungszahl) folgt, hängt er für Neutro-
nen stark vom jeweiligen Kern ab. So kann der atomare Streufaktor für zwei benachbarte
Elemente des Periodensystems (tatsächlich sogar für zwei Isotope des gleichen Elements)
sehr unterschiedlich sein. Ein typisches Beispiel ist die Untersuchung der Ordnung in einer
FeCo-Legierung. Kühlt man eine FeCo-Legierung genügend langsam ab, so können sich die
Fe und Co Atome in einer geordneten Struktur anordnen, die einer CsCl-Struktur (siehe Ab-
schnitt 1.2.7) entspricht. Untersucht man diese Struktur mit Röntgenbeugung, so kann man
wegen des fast identischen Streufaktors von Fe und Co (Nachbarn im Periodensystem) kaum
zwischen einer geordneten und einer ungeordneten Struktur unterscheiden. Für Neutronen
2.3 Experimentelle Methoden 91
Reaktor
FRM II
Geschwindigkeitsselektor
Analysator-
Detektor-Einheit
mit Probentisch
Abb. 2.18: Das Dreiachsen-Spektrometer PUMA für thermische Neutronen am Garchinger For-
schungsreaktor FRM II (Quelle: FRM II).
unterscheidet sich dagegen der atomare Streufaktor von Fe und Co um den Faktor 2.5, so
dass Neutronenbeugungsexperimente eine genaue Analyse der Ordnung erlauben.
Ein spezifischer Vorteil von Neutronen ist die Tatsache, dass leichte Elemente, insbesonde-
re Wasserstoff, ein großes Streuvermögen haben. Man benutzt Neutronenbeugung deshalb
mit Vorliebe für die Lokalisierung von Wasserstoffatomen in Kristallgittern (insbesondere in
organischen Systemen). Insgesamt sind aber die Absorptionsdicken von Neutronen relativ
groß, so dass sie sich in idealer Weise für die Strukturanalyse von Kristallen eignen. Neutro-
nen besitzen außerdem ein magnetisches Moment. Die magnetische Wechselwirkung dieses
Moments mit den Gitteratomen erlaubt die Untersuchung von magnetischen Strukturen in
Festkörpern. Die Untersuchung von magnetischen Strukturen in Festkörpern ist eine Do-
mäne der Neutronenbeugung.
(a) Detektor-
(c)
6H-SiC in
ebene (0001)-Orientierung
Kristall
6-zählige Symmetrie
der hexagonalen
Struktur
kontinuierliches
Röntgenlicht
Goniometer
(d)
(b)
Si
4-zählige Symmetrie
der Diamant-
Struktur
Abb. 2.19: (a) Schematische Darstellung des Laue-Verfahrens. (b) Zur Veranschaulichung der Entste-
hung des Punktgitters bei Laue-Verfahren. (c) Laue-Aufnahme von 6H-SiC in (0001)-Orientierung.
59
Man erkennt die 6-zählige Symmetrie der hexagonalen Struktur. (d) Laue-Aufnahme eines Si-Kristalls
(4-zählige Symmetrie des Diamantgitters).
Millerschen Indizes (hkℓ) gehört. Jede Ebenenschar greift sich sozusagen aus dem konti-
nuierlichen Röntgenspektrum genau die Wellenlänge heraus, für die bei dem vorgegebene
Winkel zwischen Ebenen und einfallenden Röntgenstrahl die Bragg-Bedingung erfüllt ist.
Fällt der Röntgenstrahl zum Beispiel entlang einer n-zähligen Drehachse ein, so muss das
zugehörige Punktmuster in der Detektorebene ebenfalls eine n-zählige Symmetrie haben.
Diese Tatsache wird zur Bestimmung der Kristallsymmetrie und der Orientierung von Ein-
kristallen verwendet. Das Laue-Verfahren ist allerdings unpraktisch für die Strukturbestim-
mung, da man häufig eine Überlagerung von Reflexen mit solchen höherer Ordnung erhält.
Den Grund für das Auftreten eines Punktmusters beim Laue-Verfahren können wir uns ein-
fach klar machen, wenn wir zunächst die Beugung an einem eindimensionalen Punktmus-
ter betrachten. Die Bragg-Bedingung ist dabei für eine koaxiale Kegelfamilie erfüllt (siehe
Abb. 2.19b). Beim Übergang zu einem 2- bzw. 3-dimensionalen Punktmuster ist die Bedin-
gung auf den gemeinsamen Punkten von zwei bzw. drei aufeinander senkrecht stehenden
Kegelfamilien erfüllt. Die Schnittpunkte der Kegelfamilien ergeben das beobachtete Punkt-
muster.
Intensität (counts)
(001) (002) (003) (004)
4
10
Sr2CrWO6 (004)
Sr2CrWO6 (008)
Sr2CrWO6 (002)
Sr2CrWO6 (006)
mono- Kristall
chromatische 𝝎 10
3
Röntgen-
Strahlung 𝟐𝜽 10
2
1
10
Detektor 100
20 40 60 80 100
2 (°)
(d)
La1/3Ca2/3MnO3 on SrTiO3
(b)
Intensität (a.u.)
4
𝝋
𝝎 FWHM = 0.023°
𝟐𝜽 2
𝝌
𝝎 Kristall mit 0
23.80 23.85 23.90 23.95
epitaktischem Film (°)
Abb. 2.20: (a) Schematische Darstellung des Drehkristall-Verfahrens. (b) Drehachsen bei einem
Vierkreis-Diffraktometer. (c) Röntgenspektrum eines (001) orientierten Sr2 CrWO6 -Films auf 64 einem
(001) SrTiO3 -Einkristall. Im Spektrum sind wegen der Orientierung von Film und Substrat nur (00ℓ)-
Reflexe enthalten. Die c-Achse von Sr2 CrWO6 ist etwa doppelt so groß wie diejenige von SrTiO3 , wes-
halb die Röntgen-Reflexe sehr nahe beieinander liegen. Für Sr2 CrWO6 sind die (00ℓ) mit ungeradzah-
ligem ℓ ausgelöscht. (d) Rocking-Kurve des (002) Reflexes eines epitaktischen La2⇑3 Ca1⇑3 MnO3 Films,
der auf einem einkristallinen SrTiO3 Substrat aufgewachsen wurde.
(a) Pulver-
mono- Probe Film
chroma-
tische 𝟐𝜽
Röntgen-
Strahlung
talls verwendet man allerdings eine feinkörnige Pulverprobe. Die einzelnen Kristallite der
Pulverprobe weisen alle möglichen Kristallrichtungen auf, so dass die Beugungsbedingung
immer für Netzebenen mit beliebigen Millerschen Indizes erfüllt werden kann. Im Gegen-
satz zum Laue-Verfahren, wo θ fest und λ beliebig war, ist also hier λ fest und θ beliebig. 67
Röntgenstrahlen, die an Netzebenen mit gleichen Millerschen Indizes reflektiert werden, lie-
gen auf einem Kegelmantel um den einfallenden Strahl und bilden mit ihm den Winkel 2θ.
Auf einem ringförmig um die Probe angeordneten Detektor (z. B. Film) werden kreisähn-
liche Bogenstücke dieser Kegelmäntel detektiert (siehe Abb. 2.21). Ein großer Vorteil des
Debye-Scherrer-Verfahren liegt darin begründet, dass es keine Einkristalle benötigt.
Literatur
N. W. Ashcroft, N. D. Mermin, Festkörperphysik, Oldenbourg Verlag, München (2012).
P. Debye, Interferenz von Röntgenstrahlen und Wärmebewegung, Ann. d. Phys. 348, 49–92
(1913).
O. Föllinger, Laplace-, Fourier- und z-Transformation, bearbeitet von Mathias Kluw, 8. über-
arbeitete Auflage, Hüthig, Heidelberg (2003).
Ch. Hammond, The Basics of Crystallography and Diffraction, Oxford University Press
(2009).
B. Lenze, Einführung in die Fourier-Analysis, 2. durchgesehene Auflage, Logos Verlag, Berlin
(2000).
M. J. Lighthill, Introduction to Fourier Analysis and Generalised Functions, Cambridge Uni-
versity Press, Cambridge (2003).
W. C. Röntgen, Über eine neue Art von Strahlen, vorläufige Mitteilung, in Aus den Sitzungs-
berichten der Würzburger Physik, medic. Gesellschaft, Würzburg (1895).
L. Spieß, G. Teichert, R. Schwarzer, H. Behnken, Ch. Genzel, Moderne Röntgenbeugung,
Vieweg+Teubner Fachverlage GmbH, Wiesbaden (2009).
I. Waller, Zur Frage der Einwirkung der Wärmebewegung auf die Interferenz von Röntgen-
strahlen, Zeitschrift für Physik A 17, 398–408 (1923).
3 Bindungskräfte in Festkörpern
Bisher haben wir Festkörper nur hinsichtlich ih-
rer Struktur klassifiziert. Wir haben also nur Ar Cl- K+ Cl-
die räumliche Anordnung der Atome diskutiert Ar Ar
aber noch nicht betrachtet, was einen Festkör- Ar K+ Cl- K+
per überhaupt zusammenhält. Dies wollen wir Ar Ar
Cl- K+ Cl-
in diesem Kapitel nachholen, indem wir uns mit Ar
den in Festkörpern vorliegenden Bindungskräf-
Ar-Kristall KCl-Kristall
ten beschäftigen. (Van der Waals) (ionisch)
Generell können wir gleich zu Beginn festhalten,
Na+ Na+ C C
dass für die Bindungskräfte in Festkörpern allein
elektrostatische Wechselwirkungen verantwort- C
e- Na+
lich sind. Magnetische Wechselwirkungen haben
nur einen verschwindend kleinen Einfluss und Na+ Na+ C C
die Gravitation spielt überhaupt keine Rolle. Wir
werden die Bindungskräfte in Festkörpern trotz- Natrium Diamant
dem in verschiedene Kategorien einteilen, näm- (metallisch) (kovalent)
lich die
∎ Van der Waals Bindung: Diese beschreibt die Bindung zwischen neutralen Atomen und
Molekülen mit einer Edelgaskonfiguration der Elektronenhülle.
∎ ionische Bindung: Diese beschreibt die Bindung zwischen positiven und negativen Ionen,
wobei die Elektronenkonfiguration der Ionen einer Edelgaskonfiguration entspricht.
∎ kovalente Bindung: Dieser Bindungstyp beschreibt die Bindung zwischen neutralen Ato-
men, deren Elektronenhülle keine Edelgaskonfiguration hat. Die Elektronenhüllen der
beteiligten Atome überlappen teilweise, so dass sich die an der Bindung beteiligten Elek-
tronen auf mehrere Atome verteilen können.
∎ metallische Bindung: Bei diesem Bindungstyp geben die Atome einen Teil ihrer Elek-
tronen ab. Diese bilden einen „See“ von Elektronen, in dem die positiven Ionen verteilt
sind.
∎ Wasserstoffbrückenbindung: Bei diesem Bindungstyp handelt es sich um einen speziel-
len Bindungstyp mit weitgehendem ionischen Charakter, der vor allem für organische
Substanzen von großer Bedeutung ist.
96 3 Bindungskräfte
3.1 Grundlagen
3.1.1 Bindungsenergie und Schmelztemperatur
Bevor wir die einzelnen Bindungsarten diskutieren, wollen wir zunächst eine allgemeine
Definition der Bindungsenergie oder der Gitterenergie eines kristallinen Festkörpers geben:
Die Bindungsenergie entspricht der Energiedifferenz zwischen der Summe der Energie al-
ler freien Atome/Moleküle und der Gesamtenergie des aus diesen Atomen/Molekülen auf-
gebauten kristallinen Festkörpers.
Wir können auch sagen, dass die Bindungsenergie der Arbeit entspricht, die wir verrichten
müssen, um einen kristallinen Festkörper in seine Bestandteile (Atome, Moleküle) zu zer-
legen. Abhängig vom Bindungstyp variiert die Bindungsenergie von Festkörpern um etwa
3 Größenordnungen. Während die Bindungsenergie eines Neon-Kristalls nur 1.92 kJ/mol
beträgt, ist sie für Wolfram 859 kJ/mol (siehe Abb. 3.1).
Es ist anschaulich klar, dass ein direkter Zusammenhang zwischen Bindungsenergie und der
Schmelztemperatur von Festkörpern besteht. Je höher die Bindungsenergie, desto größer ist
die Temperatur, bei der die Bindungen im Kristall aufgrund der großen thermischen Ener-
gie aufgebrochen werden. Ein ähnlicher Zusammenhang besteht zwischen Bindungsenergie
und der Kompressibilität von Festkörpern, die den Zusammenhang zwischen Druck und
Volumenänderung angibt. Besitzt ein Festkörper eine niedrige Bindungsenergie, so sind die
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18
1
H Schmelztemperatur (°C) He
-259.14 -272
0.05868 Bindungsenergie (kJ/mol)
Li Be B C N O F Ne
2 180.54 1278 2300 3500 -209.9 -218.4 -219.62 -248.6
Alkalimetalle Erdalkalimetalle Übergangsmetalle
158 320 561 711 474 251 81.0 1.92
Seltene Erden andere Metalle Halbmetalle/Halbleiter
Na Mg Nichtmetalle Halogene Edelgase
Al Si P S Cl Ar
3 97.8 650 660.37 1410 44.1 112.8 -100.98 -189.3
107 145 327 446 331 275 135 7.74
K Ca Sc Ti V Cr Mn Fe Co Ni Cu Zn Ga Ge As Se Br Kr
4 63.65 839 1539 1660 1890 1857 1245 1535 1495 1453 1083 419.58 29.78 937.4 817 217 -7.2 -157.2
90.1 178 376 468 512 395 282 413 424 428 336 130 271 372 285.3 237 118 11.2
Rb Sr Y Zr Nb Mo Tc Ru Rh Pd Ag Cd In Sn Sb Te I Xe
5 38.89 764 1523 1852 2468 2617 2200 2250 1966 1552 961.93 320.9 156.61 231.9 630 449.5 113.5 -111.9
82.2 166 422 603 730 658 661 650 554 376 284 112 243 303 265 211 107 15.9
Cs Ba * Hf Ta W Re Os Ir Pt Au Hg Tl Pb Bi Po At Rn
6 28.5 725 2150 2996 3410 3180 3045 2410 1772 1064.43 -38.87 303.5 327.5 271.3 254 302 -71
77.5 183 621 782 859 775 788 670 564 368 65 182 196 210 144 19.5
Fr Ra ** Rf Db Sg Bh Hs Mt Uun Uuu Uub
7 27 700
? ? ? ? ? ? ? ? ?
160
* La Ce Pr Nd Pm Sm Eu Gd Tb Dy Ho Er Tm Yb Lu
920 795 935 1010 1072 822 1311 1360 1412 1470 1522 1545 824 1656
?
431 417 357 328 206 179 400 391 294 302 317 233 154 428
** Ac Th Pa U Np Pu Am Cm Bk Cf Es Fm Md No Lr
1050 1750 1600 1132 640 639.5 994 1340
? ? ? ? ? ? ?
410 598 536 456 347 264 385
beteiligten Bindungen „weich“ und wir erwarten eine hohe Kompressibilität. Wir können
also direkt aus der Messung der Schmelztemperatur oder der Kompressibilität Rückschlüsse
auf die Bindungsenergie von Festkörpern ziehen. Eine Zusammenstellung der Schmelztem-
peraturen und der Bindungsenergien der chemischen Elemente ist in Abb. 3.1 gegeben.
ħ2 2
ℋ Ψ(r) = ⌊︀− ∇ + V (r)}︀ Ψ(r) = E Ψ(r) . (3.1.1)
2m
Eine einfache Lösung ergibt sich aber nur für das Wasserstoffatom (V (r) = −e 2 ⇑r), bei
dem wir es mit einem Zweikörperproblem (ein Elektron plus ein Proton) zu tun haben.
Bei Atomen mit mehreren Elektronen lassen sich Näherungslösungen angeben, wenn man
die Wechselwirkung eines Elektrons mit dem Kern und allen weiteren Elektronen in ein
effektives Zentralpotenzial Veff (r) steckt und dann wiederum nur ein Zweikörperproblem
zu lösen hat. Der Effekt der anderen Elektronen wird dabei durch eine kontinuierliche
Ladungsverteilung repräsentiert, die das Kernpotenzial mehr oder weniger stark abschirmt.
Die Lösungen der Schrödinger-Gleichung werden üblicherweise in Kugelkoordinaten ange-
geben:
Hierbei ist R nl (r) die Radialfunktion und Yl m (ϑ, φ) sind die Kugelflächenfunktionen, die
für jedes kugelsymmetrische Potenzial die gleiche Form haben. Die elektronischen Zustände
eines Atoms werden nach den Einelektronenzuständen des kugelsymmetrischen Potenzials
klassifiziert. Hierfür benutzen wir die Zahlen n, l, m, die so genannten Quantenzahlen:
0 0 0
0.6 330 30 l=0 0.6 330 30 l=1 0.6 330 30 l=1
m=0 m=0 m=1
0.4 0.4 0.4
300 60 300 60 300 60
0.2 0.2 0.2
0.0 270 90
0.2
0.4
240 120
𝝋
0.6 210 150
180
Abb. 3.2: Polardarstellung des Absolutquadrats der normierten Kugelflächenfunktionen. Die Länge
des Vektors vom Ursprung zu den gezeigten Kurven gibt ⋃︀Yl m (ϑ)⋃︀2 für die verschiedenen Winkel ϑ
an. Alle Diagramme sind rotationssymmetrisch um die z-Achse, die hier als vertikale Achse gewählt
wurde.
Wir erwarten deshalb für Bindungstypen (z. B. kovalente Bindung), die mit dem Überlapp
dieser Wellenfunktionen in benachbarten Atomen zusammenhängen, eine gewisse Rich-
tungsabhängigkeit. Sind allerdings für eine bestimmte Hauptquantenzahl alle möglichen l-
und m-Zustände besetzt, so ergibt die Summe aller Kugelflächenfunktionen gerade wieder-
3.1 Grundlagen 99
0.6
0.10
0.5
0.4
1s 0.08 3s
0.06
0.3
n,l
r R n,l
2
2 2
r R
2
0.2 0.04
0.1 0.02
0.0 0.00
0 1 2 3 4 5 0 6 12 18 24 30
r / aB r / aB
0.20
0.10
0.15
2s 0.08 3p
0.06
0.10
r R n,l
n,l
2 2
2 2
rR
0.04
0.05
0.02
0.00 0.00
0 3 6 9 12 15 0 6 12 18 24 30
r / aB r / aB
0.20
0.10
0.15
2p 0.08 3d
0.06
0.10
n,l
r R n,l
2 2
2 2
rR
0.04
0.05
0.02
0.00 0.00
0 3 6 9 12 15 0 6 12 18 24 30
r / aB r / aB
Abb. 3.3: Radiale Aufenthaltswahrscheinlichkeiten des Elektrons für einige Zustände des Wasserstof-
fatoms (man beachte die unterschiedlichen Skalen).
um eine kugelsymmetrische Verteilung. Diese Konfiguration ist für die Edelgase gegeben,
weshalb sie auch Edelgaskonfiguration genannt wird. Wir werden später sehen, dass für die
Edelgase eine völlig ungerichtete Van der Waals Wechselwirkung vorliegt. Sind bei einem
Atom alle Elektronenzustände mit einer bestimmten Hauptquantenzahl aufgefüllt, so spre-
chen wir auch von einer abgeschlossenen Elektronenschale. Sind alle Zustände mit einer
bestimmten Drehimpulsquantenzahl aufgefüllt, so sprechen wir von einer vollkommen ge-
füllten Unterschale.
Die Radialfunktion bestimmt die mittlere Aufenthaltswahrscheinlichkeit eines Hüllenelek-
trons als Funktion des Abstands r vom Kern. Wollen wir wissen, wie groß die Wahrschein-
lichkeit dafür ist, das Elektron in einem bestimmten Abstand zwischen r und r + dr vom
Kern aufzufinden, so müssen wir die Größe
π 2π
2
W(r)dr = ∫ ∫ ⋂︀Ψn,l ,m (r, ϑ, φ)⋂︀ r 2 dr sin ϑ d ϑ dφ = r 2 R 2n,l (r) dr (3.1.3)
0 0
100 3 Bindungskräfte
berechnen. Hierbei haben wir die Tatsache ausgenutzt, dass die Kugelflächenfunktionen
Yl m (ϑ, φ) so normiert sind, dass die Integration über den vollen Raumwinkel gerade eins
ergibt. Sie können daher bei der Betrachtung der radialen Abhängigkeit der Aufenthalts-
wahrscheinlichkeiten ignoriert werden. Die Wahrscheinlichkeit W(r) = r 2 R 2n,l (r) nennen
wir radiale Aufenthaltswahrscheinlichkeit. Sie unterscheidet sich wesentlich von der Wel-
lenfunktion R n,l (r). Der Grund dafür ist die Veränderung des Phasenraums mit r. Unter
Phasenraum verstehen wir das Volumen der zwischen r und r + dr liegenden Kugelschale.
Dieses Volumen geht für r → 0 gegen null. So ist für den 1s-Zustand die Wellenfunktion
R nl (r) am Ursprung zwar endlich und fällt von dort mit zunehmendem r exponentiell ab,
die radiale Aufenthaltswahrscheinlichkeit r 2 R 2n,l (r) steigt hingegen von null auf einen ma-
ximalen Wert bei r max an, um dann von dort für r → ∞ auf null abzufallen.
Als weitere Quantenzahl, die natürlich nicht aus der nicht-relativistischen Schrödinger-Glei-
chung erhalten wird, kommt noch die Spin-Quantenzahl s = ± 12 hinzu. Dadurch verdoppelt
sich die Zahl der möglichen Zustände pro Hauptquantenzahl von n 2 auf 2n 2 , da jeder Zu-
stand ⋃︀n, l, m̃︀ noch zwei unterschiedliche Spinrichtungen haben kann. Insgesamt kann der
Zustand eines Hüllenelektrons eindeutig durch die vier Quantenzahlen n, l, m, s charakteri-
siert werden. Da Elektronen Fermionen sind, kann jeder der durch ein bestimmtes Quadru-
pel von Quantenzahlen charakterisierte Zustand nur von einem Elektron besetzt werden.
Die Klassifizierung der elektronischen Zustände der Hüllenelektronen der Atome führt auch
zum Periodensystem der Elemente. Die Struktur des Periodensystems ergibt sich durch das
Auffüllen der Zustände beginnend von der niedrigsten Energie. Zunächst haben wir im Pe-
riodensystem sieben Perioden (Reihen), wobei in der n-ten Periode gerade die Zustände mit
Hauptquantenzahl n aufgefüllt werden. In der 1. Periode wird mit dem Einbau der 1s-Elek-
tronen beim H- und He-Atom begonnen. In der 2. Periode geht es dann mit den 2s- und
2p-Elektronen weiter usw. Da zu jeder Hauptquantenzahl n wegen l ≤ n − 1 verschiedene
Drehimpulsquantenzahlen gehören können, haben wir ferner eine Einteilung jeder Peri-
ode in Haupt- und Nebengruppen (Spalten). Bei den Hauptgruppen 1 und 2 (entsprechend
Ia und IIa in der alten Notation) werden jeweils die zwei s-Elektronen eingebaut, bei den
Hauptgruppen 13 bis 18 (entsprechend IIIa bis VIIIa) werden die sechs p-Zustände aufge-
füllt. Dazwischen liegen die Nebengruppen 3 bis 12, bei denen die zehn d-Elektronen ein-
gebaut werden. Wegen l ≤ n − 1 haben wir für n = 1 nur s-Elektronen, s- und p-Elektronen
für n = 2, s-, p- und d-Elektronen für n = 3 usw. Es gibt aber auch einige Besonderheiten
beim Auffüllen der Elektronenschalen. So würden wir erwarten, dass nach den 3p-Zustän-
den die 3d-Zustände aufgefüllt werden. Dies ist allerdings nicht so. Es werden zuerst die
4s-Zustände aufgefüllt und danach erst die 3d-Zustände. Die erste Serie von Übergangsme-
tallen (Sc bis Zn) steht deshalb in der 4. Periode. Das gleiche gilt für die 4d- (Y bis Cd) und
die 5d-Übergangsmetalle (La bis Hg). Das Auffüllen der 4 f - und 5 f -Zustände beginnt so-
gar erst nach dem Auffüllen der 6s-Zustände und 7s-Zustände (Lanthaniden und Actiniden,
auch als Seltene Erden bezeichnet). Die Ursache dafür ist die Tatsache, dass die s-Elektro-
nen eine endliche Aufenthaltswahrscheinlichkeit am Kernort haben und dadurch für sie der
Abschirmeffekt der übrigen Elektronen kleiner ist. Sie haben deshalb eine höhere Bindungs-
energie und deshalb niedriger liegende Energieniveaus. Die Reihenfolge des Termschemas
des Vielelektronenatoms weicht also hier von dem des Wasserstoffatoms ab.
Haupt- und Nebengruppen
neu
alt
1,00794
4,002602
1H
Periodensystem der Elemente 2He
3.1 Grundlagen
1s2
1s1
Helium
Wasserstoff
6,941 9,012182 rel. Atommasse 12,011
Elementsymbol: 10,811 12,011 14,00674 15,9994 18,9984032 20,1797
Ra kein stabiles Isotop bekannt
3Li 4Be Ordnungszahl 6C Elementsymbol 5B 6C 7N 8O 9F 10Ne
[He] [He] [He] Elektronen-
Ne gasförmig [He] [He] [He] [He] [He] [He]
2s1 2s2 2s22p2 konfiguration Hg flüssig (bei 20°C) 2s22p1 2s22p2 2s22p3 2s22p4 2s22p5 2s22p6
Lithium Beryllium Elementname Kohlenstoff Bor Kohlenstoff Stickstoff Sauerstoff Fluor Neon
22,89768 24,3050
Al fest 26,981539 28,0855 30,973762 32,066 35,4527 39,948
19K 20Ca 21Sc 22Ti 23V 24Cr 25Mn 26Fe 27Co 28Ni 29Cu 30Zn 31Ga 32Ge 33As 34Se 35Br 36Kr
[Ar] [Ar] [Ar] [Ar] [Ar] [Ar] [Ar] [Ar] [Ar] [Ar] [Ar] [Ar] [Ar]3d10 [Ar]3d10 [Ar]3d10 [Ar]3d10 [Ar]3d10 [Ar]3d10
4s1 4s2 3d14s2 3d24s2 3d34s2 3d54s1 3d54s2 3d64s2 3d74s2 3d84s2 3d104s1 3d104s2 4s24p1 4s24p2 4s24p3 4s24p4 4s24p5 4s24p6
Kalium Calcium Scandium Titan Vanadium Chrom Mangan Eisen Cobalt Nickel Kupfer Zink Gallium Germanium Arsen Selen Brom Krypton
85,4678 87,62 88,90586 91,224 92,90638 95,94 [98] 101,07 102,90550 106,42 107,8682 112,411 114,816 118,710 121,760 127,60 126,90447 131,29
37Rb 38Sr 39Y 40Zr 41Nb 42Mo 43Tc 44Ru 45Rh 46Pd 47Ag 48Cd 49In 50Sn 51Sb 52Te 53I 54Xe
[Kr] [Kr] [Kr] [Kr] [Kr] [Kr] [Kr] [Kr] [Kr] [Kr] [Kr] [Kr] [Kr]4d10 [Kr]4d10 [Kr]4d10 [Kr]4d10 [Kr]4d10 [Kr]4d10
5s1 5s2 4d15s2 4d25s2 4d35s2 4d55s1 4d55s2 4d65s2 4d75s2 4d85s2 4d105s1 4d105s2 5s25p1 5s25p2 5s25p3 5s25p4 5s25p5 5s25p6H
Rubidium Strontium Yttrium Zirconium Niobium Molybdän Technetium Ruthenium Rhodium Palladium Silber Cadmium Indium Zinn Antimon Tellur Jod Xenon
132,90543 137,327 178,49 180,9479 183,84 186,207 190,23 192,217 195,078 196,96655 200,59 204,3833 207,2 208,98038 [209] [210] [222]
57 – 71
55Cs 56Ba 72Hf 73Ta 74W 75Re 76Os 77Ir 78Pt 79Au 80Hg 81Tl 82Pb 83Bi 84Po 85At 86Rn
[Xe] [Xe]
La-Lu [Xe]4f14 [Xe]4f14 [Xe]4f14 [Xe]4f14 [Xe]4f14 [Xe]4f14 [Xe]4f14 [Xe]4f14 [Xe]4f14 [Xe]4f145d10 [Xe]4f145d10 [Xe]4f145d10 [Xe]4f145d10 [Xe]4f145d10 [Xe]4f145d10
Lantha-
6s1 6s2 5d26s2 5d36s2 5d46s2 5d56s2 5d66s2 5d76s2 5d86s2 5d106s1 5d106s2 6s26p1 6s26p2 6s26p3 6s26p4 6s26p5 6s26p6
Cäsium Strontium noide Hafnium Tantal Wolfram Rhenium Osmium Iridium Platin Gold Quecksilber Thallium Blei Bismut Polonium Astat Radon
[223] [226] [261] [262] [263] [264] [265] [268] [269] [272] [277] [289] [289] [293]
89 – 103
87Fr 88Ra 104Rf 105Db 106Sg 107Bh 108Hs 109Mt 110Uun 111Uuu 112Uub 113Uut 114Uuq 115Uup 116Uuh 117Uus 118Uuo
[Rn] [Rn]
Ac-Lr [Rn]5f14 [Rn]5f14 [Rn]5f14 [Rn]5f14 [Rn]5f14 [Rn]5f14 [Rn]5f14 [Rn]5f14 [Rn]5f14 [Rn]5f146d10 [Rn]5f146d10 [Rn]5f146d10 [Rn]5f146d10 [Rn]5f146d10 [Rn]5f146d10
7s1 7s2 Actinoide 6d27s2 6d37s2 6d47s2 6d57s2 6d67s2 6d77s2 6d87s2 6d97s2 6d107s2 7s27p1 7s27p2 7s27p3 7s27p4 7s27p5 7s27p6
Francium Radium Rutherfordium Dubnium Seaborgium Bohrium Hassium Meitnerium Ununilium Unununium Ununbium Ununtrium Ununquadium Ununpentium Ununhexium Ununseptium Ununoctium
Die Elemente mit den Ordnungszahlen 113, 115 und 117 wurden noch nicht synthetisiert
138,9055 140,116 140,90765 144,24 [145] 150,36 151,964 157,25 158,92534 162,50 164,93032 167,26 168,93421 173,04 174,967
57La 58Ce 59Pr 60Nd 61Pm 62Sm 63Eu 64Gd 65Tb 66Dy 67Ho 68Er 69Tm 70Yb 71Lu
[Xe] [Xe] [Xe] [Xe] [Xe] [Xe] [Xe] [Xe] [Xe] [Xe] [Xe] [Xe] [Xe] [Xe] [Xe]
5d16s2 4f26s2 4f36s2 4f46s2 4f56s2 4f66s2 4f76s2 4f86s2 4f96s2 4f106s2 4f116s2 4f126s2 4f136s2 4f14s2 4f145d16s2
Lanthan Cer Praseodym Neodym Promethium Samarium Europium Gadolinium Terbium Dysprosium Holmium Erbium Thulium Ytterbium Lutetium
91,224 92,90638 95,94 91,224 92,90638 95,94 91,224 92,90638 95,94 91,224 92,90638 95,94 91,224 92,90638 95,94
89Ac 90Th 91Pa 92U 93Np 94Pu 95Am 96Cm 97Bk 98Cf 99Es 100Fm 101Md 102No 103Lr
[Rn] [Rn] [Rn] [Rn] [Rn] [Rn] [Rn] [Rn] [Rn] [Rn] [Rn] [Rn] [Rn] [Rn] [Rn]
6d17s2 6d27s2 5f26d17s2 5f36d17s2 5f46d17s2 5f67s2 5f77s2 5f76d17s2 5f96d17s2 5f107s2 5f117s2 5f127s2 5f137s2 5f147s2 5f146d17s2
Actinium Thorium Protactinium Uran Neptunium Plutonium Americum Curium Berkelium Californium Einsteinium Fermium Mendelevium Nobelium Lawrencium
101
12
102 3 Bindungskräfte
Die Elektronenkonfiguration, die relative Atommasse und die Ordnungszahl der einzelnen
Elemente kann dem in Abb. 3.4 gezeigten Periodensystem entnommen werden.
Zum Abschluss unseres Exkurses in die Atomphysik wollen wir noch kurz die charakteris-
tischen Bindungsenergien diskutieren. Für das Wasserstoffatom gilt:
me 4 1
En = − . (3.1.4)
(4πє 0 ) 2ħ n 2
2 2
me 4 ħ2
EH = = = 13.605 693 009(84) eV (3.1.5)
(4πє 0 )2 2ħ 2 2ma B2
bezeichnet man als die Rydberg-Energie. Die charakteristische Länge
4πє 0 ħ 2
aB = = 0.529 177 210 67(12) Å (3.1.6)
me 2
ist der Bohrsche Radius.
Johannes Diderik van der Waals (1837–1923), Nobelpreis für Physik 1910
Johannes Diderik van der Waals wurde am 23. Novem-
ber 1837 in Leiden, Niederlande geboren. Er erhielt im
Jahr 1910 den Nobelpreis für Physik für seine Untersuchun-
gen am gasförmigen und flüssigen Zustand von Materie.
Seine Arbeiten erlaubten die Erzeugung tiefer Temperatu-
ren nahe am absoluten Nullpunkt.
Van der Waals war Autodidakt. Er nutzte die Möglichkeit,
an der Universität von Leiden auch ohne klassische Ausbil-
dung zur Prüfung zugelassen zu werden. Er machte erstmals
1873 mit seiner Doktorarbeit „Over de Continuiteit van den
Gas – en Vloeistoftoestand“ auf sich aufmerksam. Van der
Waals wurde im Jahr 1877 zum Professor für Physik an der
Universität von Amsterdam ernannt. Diese Stellung nahm © The Nobel Foundation.
er bis 1907 ein. Die van der Waals Kräfte, schwache attrakti- Johannes Diderik Van der Waals (1837 --
ve Wechselwirkungskräfte zwischen neutralen Atomen und Molekülen werden heute Nobelpreis
nach für Physik 1910
ihm benannt.
Bei der Fortsetzung seiner im Rahmen seiner Doktorarbeit begonnenen Forschungsarbei-
ten wusste er, dass das ideale Gasgesetz aus der kinetischen Gastheorie abgeleitet wer-
den kann, falls man annahm, dass die Gasmoleküle kein Volumen und keine attraktive
Wechselwirkung besitzen. Er verwarf allerdings diese beiden Hypothesen und führte im
Jahr 1881 zwei neue Parameter ein, die die Größe und Wechselwirkung der Gasmolekü-
le repräsentieren. Dadurch konnte er eine genauere Zustandsgleichung ableiten, die wir
heute als Van der Waals Gleichung kennen. Er stellte fest, dass die eingeführten Parame-
ter für verschiedene Gase unterschiedlich groß sind. Er erweiterte deshalb seine Analyse
und gelangte zu einer Gleichung, die für alle Gase gleich ist. Für diese Arbeit erhielt er
im Jahr 1910 den Nobelpreis für Physik. Sie bildete die Grundlage für die später erfolgte
Verflüssigung von Wasserstoff und Helium durch Sir James Dewar, England, und Heike
Kamerlingh Onnes, Niederlande.
Van der Waals erhielt mehrere Auszeichnungen, u. a. die Ehrendoktorwürde der University
of Cambridge sowie die Ehrenmitgliedschaft der Imperial Society of Naturalists of Moscow,
der Royal Irish Academy und der American Philosophical Society. Er war ferner korre-
spondierendes Mitglied des Institute de France und der Königlichen Akademie der Wis-
senschaften in Berlin, assoziiertes Mitglied der Royal Academy of Sciences von Belgien und
auswärtiges Mitglied der Chemical Society of London, der National Academy of Sciences
der USA und der Accademia dei Lincei in Rom.
Van der Waals starb am 9. März 1923 in Amsterdam.
A = αA ⋅ E ,
pind (3.2.1)
104 3 Bindungskräfte
(a) (b) +
+
𝒑𝑨 (𝒕) B A 𝒑𝑨 +
𝒆− +
= 𝒆𝒓 𝒕 +
+𝒒𝑩 𝑹 +𝒒𝑨
+
+ +
(c)
𝒑𝑩 𝝑𝑨 𝒑𝑨
𝝑𝑩
𝒑𝑨 = 𝟎
𝑹
𝑬𝑩 𝑬𝑨
das von der Polarisierbarkeit α A des Atoms A und der Feldstärke E abhängt. Wird das elek-
trische Feld z. B. durch die Ladung q B eines Ions B im Abstand R erzeugt (siehe Abb. 3.5b),
so gilt
α A ⋅ q B ⧹︂
A =
pind R. (3.2.2)
4πє 0 R 2
⧹︂ der Einheitsvektor entlang der Verbindungsachse zwischen A und B. Die po-
Hierbei ist R
tenzielle Energie des Atoms A ist gegeben durch
E pot = −pind
A ⋅ E = −(α A E) ⋅ E . (3.2.3)
Wird das elektrische Feld nicht durch ein Ion sondern durch ein neutrales Atom mit perma-
nentem Dipolmoment pB erzeugt, so erhalten wir2
E pot = −
αA ⧹︂ ⋅ cos ϑ B − pB )2
(3p B ⋅ R
(4πє 0 R 3 )2
α A p2B
=− ⋅ (3 cos2 ϑ B + 1) . (3.2.4)
(4πє 0 R 3 )2
Für die Van der Waals Bindung ist die Wechselwirkung neutraler Atome entscheidend.
Hierbei ist wichtig, dass für eine im zeitlichen Mittel kugelsymmetrische Ladungsverteilung
in der Elektronenhülle, wie sie bei den Edelgasen vorliegt, auch das zeitgemittelte Dipol-
moment ∐︀p A ̃︀ verschwindet. Allerdings liegt immer ein momentanes Dipolmoment p A vor
(siehe Abb. 3.5a), zu dem das elektrische Feld
EA =
1 ⧹︂ ⋅ cos ϑ A − p A )
(3p A ⋅ R (3.2.5)
4πє 0 R 3
2
Das von einem Dipol pB erzeugte elektrische Feld ist gegeben durch
1
E(pB ) = (3p B ⋅ R
⧹︂ ⋅ cos ϑ B − pB ) ,
4πє 0 R 3
wobei ϑ B der Winkel zwischen pB und der Verbindungsachse der Atome A und B ist.
3.2 Die Van der Waals Bindung 105
B = α B ⋅ EA ,
pind (3.2.6)
welches seinerseits wieder am Ort des Atoms A ein elektrisches Feld
EB =
1 ⧹︂ ⋅ cos ϑ B − pB )
(3p B ⋅ R (3.2.7)
4πє 0 R 3
erzeugt. Durch die gegenseitige Beeinflussung der beiden Atome wird deren kugelsymme-
trische Ladungsverteilung permanent gestört, so dass im zeitlichen Mittel das Dipolmoment
nicht mehr verschwindet.
Da die beiden induzierten Dipolmomente parallel zur Verbindungsachse der Atome ausge-
⧹︂ und cos ϑ A = 1, so dass wir aus (3.2.5)
richtet sind, ist p ∥ R
2p A ⧹︂ 2p B ⧹︂
EA = R, EB = R (3.2.8)
4πє 0 R 3 4πє 0 R 3
erhalten. Für die potenzielle Wechselwirkungsenergie erhalten wir
E pot (R) = −pind
B ⋅ E A = −p A ⋅ E B
ind
(3.2.9)
A = α A ⋅ E B und p B = α B ⋅ E A
und weiter wegen pind ind
𝑬 𝑬 𝑬
𝜟𝑬𝐅 𝑬𝐅
𝑬𝐅 𝑬𝐅
Abb. 3.6: Zur Veranschau-
lichung des Pauli-Prinzips.
Energie E F (diese Energie bezeichnen wir als Fermi-Energie, vergleiche Kapitel 7) auffüllen
müssen. Wollen wir nun diese beiden Potenzialkästen zum Überlapp bringen, so müssen
einige Elektronen auf höhere Energieniveaus ausweichen, da alle Zustände bis E F bereits be-
setzt sind. Dies führt zu einer Anhebung der Gesamtenergie und damit zu einer abstoßenden
Wechselwirkung. 16
Wir werden die abstoßende Wechselwirkung hier nicht im Detail diskutieren, sondern nur
festhalten, dass experimentelle Daten gut mit einem empirischen Potenzial der Form b⇑R 12
angenähert werden können, so dass wir insgesamt E pot (R) = Rb12 − Ra6 erhalten. Üblicher-
weise schreibt man das Gesamtpotenzial in der Form
σ 12 σ 6
E pot (R) = 4є ⌊︀( ) − ( ) }︀ (3.2.12)
R R
mit den neuen Parametern є und σ (siehe Tabelle 3.1) mit a = 4єσ 6 und b = 4єσ 12 . Die-
ses empirische Paarwechselwirkungspotenzial wird Lennard-Jones-Potenzial genannt (siehe
Abb. 3.7).
0.06
Ar
𝝐 = 𝟎. 𝟎𝟏𝟎𝟒 𝐞𝐕
0.04
𝝈 = 𝟑. 𝟒𝟎 Å
Epot (eV)
0.02
𝑹𝟎
0.00
−𝝐
-0.02
Abb. 3.7: Das Lennard-Jones-Potenzial 0.8 1.0 1.2 1.4 1.6 1.8
berechnet für є und σ von Argon. R /
17
3.2 Die Van der Waals Bindung 107
Wir können nun noch das Minimum von E pot und den zugehörigen Gleichgewichtsab-
̃0 für die Paarwechselwirkung berechnen. Aus
stand R
dE pot 6σ 6 12σ 12
= 0 = 4є ⌊︀ 7 − 13 }︀ . (3.2.13)
dR R R
erhalten wir
̃0 = 21⇑6 ⋅ σ = 1.1225 σ
R (3.2.14)
und
Ẽpot (R 0 ) = −є . (3.2.15)
3.2.3 Gleichgewichtsgitterkonstante
Um den Gleichgewichtsabstand der Atome im Kristallgitter zu berechnen, müssen wir das
Lennard-Jones-Potenzial zunächst über alle Paare i j von Atomen im Gitter aufsummieren.
Wir erhalten dann die gesamte potenzielle Energie zu
⎨ 6⎬
⎝ σ σ ⎠
12
∑ 4є ⎝⎝( ) − ( ) ⎠⎠ .
N
U tot = (3.2.16)
2 i≠ j ⎝ r i j ri j ⎠
⎪ ⎮
Die Summe beschreibt gerade die Bindungsenergie eines einzelnen Atoms j, das mit allen an-
deren Atomen i wechselwirkt. Um die Gesamtenergie zu erhalten, müssen wir diesen Beitrag
mit N⇑2 multiplizieren, wobei N die Gesamtzahl aller Atome ist. Der Faktor 12 ist notwen-
dig, da wir bei einer paarweisen Wechselwirkung den Beitrag jedes Atoms nur einmal zäh-
len dürfen. Um die Summation auszuführen, schreiben wir r i j = α i j R, wobei R der nächste
Nachbarabstand ist. Wir erhalten
σ 12 σ 6
U tot = 2Nє ⌊︀A 12 ( ) − A 6 ( ) }︀ (3.2.17)
R R
1
Ak = ∑ k k = 6, 12 . (3.2.18)
α
i≠ j i j
Hierbei ist N die Anzahl der Atome und die Zahlen A k sind die so genannten Gittersummen,
die von der vorliegenden Kristallstruktur abhängen.
Den Gleichgewichtsatomabstand R 0 erhalten wir aus
dU tot σ 12 σ6
= 0 = −2Nє ⌊︀12A 12 13 − 6A 6 7 }︀ (3.2.19)
dR R R
zu4
A 12 1⇑6
R 0 = (2 ) ⋅σ . (3.2.20)
A6
4
Da A 12 < A 6 gilt, finden wir einen Gleichgewichtsatomabstand, der kleiner ist als der Wert
̃0 = 21⇑6 σ des Minimums des Paarpotenzials. Dies können wir auf den Druck der weiter außen
R
liegenden Atome zurückführen.
108 3 Bindungskräfte
1 A2
U tot (R 0 ) = − Nє 6 . (3.2.21)
2 A 12
Wir können uns nun fragen, für welche Struktur diese Bindungsenergie minimal wird. Of-
fensichtlich müssen wir Strukturen betrachten, bei denen die Atome möglichst dicht gepackt
sind. Wertet man die Gittersummen aus, so stellt man fest, dass sich die einzelnen dicht ge-
packten Strukturen nur wenig unterscheiden (siehe Tabelle 3.2).Wir sehen ferner, dass die
Gittersummen für die bcc-Struktur wesentlich niedriger sind, weshalb Edelgaskristalle nicht
in dieser Struktur vorkommen. Da für die anziehende Wechselwirkung A 6 entscheidend ist
und dieser Wert für die hcp-Struktur größer ist, erwarten wir eine hcp-Struktur für Edelgas-
kristalle. Die Rechnung ergibt
)︀
⌉︀
⌉︀8.61016 fcc-Struktur
U tot (R 0 ) = −Nє ⌋︀ . (3.2.22)
⌉︀
⌉︀8.61107 hcp-Struktur
]︀
Experimentell beobachten wir allerdings für Edelgaskristalle fcc-Strukturen. Um diese Dis-
krepanz zu verstehen, müssen wir die im nächsten Abschnitt diskutierten Quantenkorrek-
turen berücksichtigen.
Für die fcc-Struktur erhalten wir mit den in der Tabelle angegebenen Gittersummen
R 0 = 1.09 σ . (3.2.23)
Dieser Wert stimmt hervorragend mit den in obiger Tabelle gezeigten experimentellen Wer-
ten überein.
3.2.3.1 Nullpunktsschwingungen
Die zu leichteren Atomen hin zunehmende Abweichung der experimentellen R 0 ⇑σ Werte
vom Theoriewert 1.09 kann auf Nullpunktsfluktuationen zurückgeführt werden. Die Ab-
weichungen sind für leichte Atome am größten. Für kleine Auslenkungen um die Ruhe-
lage können wir das Lennard-Jones-Potenzial durch ein harmonisches Potenzial annähern.
Die quantenmechanische Grundzustandsenergie für dieses Potenzial ist E 0 = 12 ħω und nicht
null, wir sprechen von so genannten Nullpunktsschwingungen. Klassisch gilt für den harmo-
nischen Oszillator
Für die maximale Auslenkung ist E kin = 0 und E pot (x max ) = 12 kx max
2
. Hierbei ist k die Kraft-
konstante, die über k = Mω mit der Atommasse M und der Schwingungsfrequenz ω zu-
2
3.2 Die Van der Waals Bindung 109
3.2.4 Kompressibilität
Die Kompressibilität κ eines Festkörpers ist gegeben durch (siehe hierzu auch Kapitel 4)
1 ∂V 1
κ=− ⋁︀ = . (3.2.27)
V ∂p T=const B
Hierbei ist V das Volumen und p der Druck. Der Kompressions- oder Bulk-Modul B ist der
Kehrwert von κ, er gibt die Kraft pro Fläche an, die pro relative Volumenänderung benötigt
wird.
Die innere Energie eines Systems können wir bei T = 0 (hier ist TdS = 0) in differentieller
Form als
dU = −pdV (3.2.28)
schreiben. Mit p = −dU⇑dV erhalten wir für den Bulk-Modul
∂p ∂2 U ∂2 u
B = −V =V 2
=v 2 . (3.2.29)
∂V ∂V ∂v
Hierbei ist u = U⇑N und v = V ⇑N mit N = Anzahl der Atome.
⌋︂
Abstand von benachbarten Atomen ist allerdings nicht a, sondern R = a⇑ 2, da wir ja Ato-
⌋︂
⌋︂
me auf den Mittelpunkten der Seitenflächen ⌋︂
sitzen haben. Daraus folgt dann v = R 3 ⇑ 2.
Damit erhalten wir ∂v⇑∂R = 3R 2 ⇑ 2 oder ∂⇑∂v = ( 2⇑3R 2 )(∂⇑∂R) und wir können für
das Bulk-Modul schreiben:
⌋︂ ⌋︂ ⌋︂
∂ ∂u R3 2 ∂ 2 ∂u 2 ∂ 1 ∂u
B = v ( ) = ⌋︂ (
2 ∂R 3R 2 ∂R
)= R ( 2 )
∂v ∂v 2 3R 9 ∂R R ∂R
⌋︂ ⌋︂
2 2 ∂u 1 ∂2 u 2 1 ∂ 2 u 2 ∂u
= R (− 3 + 2 ) = ( − ). (3.2.30)
9 R ∂R R ∂R 2 9 R ∂R 2 R ∂R
Im Gleichgewicht gilt natürlich (∂u⇑∂R)R=R 0 = 0 und wir erhalten für den Bulk-Modul
⌋︂
2 1 ∂2 u
B 0 = B(R = R 0 ) = ( ) . (3.2.31)
9 R 0 ∂R 2 R=R 0
4є A 6 5⇑2 75.2є
B0 = A 12 ( ) = , (3.2.32)
σ3 A 12 σ3
wobei das zweite Gleichheitszeichen nur für ein fcc-Gitter gilt. In Tabelle 3.3 ist ein Vergleich
zwischen theoretischen und experimentell beobachteten Werten gegeben. Wir sehen, dass
die Abweichungen größer sind als bei den Gitterkonstanten. Dies liegt daran, dass hier die
zweite Ableitung des Potenzials eingeht.
Atom A (eV) I (eV) Atom A (eV) I (eV) Tabelle 3.4: Ionisationsenergie I und
−0.7542 −1.39
Elektronenaffinität A verschiedener Ato-
H 13.598 Si 7.900
me (Quelle: H. Hotop, W. C. Lineberger, J.
Li −0.62 5.392 P −0.74 10.487 Phys. Chem. Ref. Data 4, 539 (1975)).
C −1.27 11.260 S −2.08 10.360
O −1.46 13.618 Cl −3.61 12.968
F −3.40 17.427 Br −3.36 11.814
Na −0.55 5.139 I −3.06 10.451
Al −0.46 5.986 K −0.50 4.341
sein sollte, um einen energetisch günstigen Zustand zu erreichen. Die Werte für die Ionisa-
tionsenergie und Elektronenaffinität sind in Tabelle 3.4 aufgelistet. Wir sehen, dass I für die
Alkalimetalle sehr klein und A für die Halogene sehr groß ist. Dies ist anschaulich klar, da
erstere durch Abgabe eines Elektrons und letztere durch Aufnehmen eines Elektrons in die
energetisch günstige Edelgaskonfiguration der Elektronenhülle übergehen können.
Für einen NaCl-Ionenkristall sieht die Energiebilanz folgendermaßen aus
1. Na + I → Na+ + e−
2. e− + Cl → Cl− + A (3.3.1)
3. Na+ + Cl− → Na+ Cl− + E Mad .
Hierbei ist E Mad die Madelung-Energie,6 die aus der elektrostatischen Wechselwirkung
zwischen den positiven und negativen Ionen resultiert. Für NaCl ist I(Na) = 5.14 eV
und A(Cl) = −3.61 eV. Die Größe der Madelungenergie kann grob durch die Cou-
lomb-Wechselwirkung von zwei Punktladungen mit Ladung q 1,2 = ±e abgeschätzt wer-
den. Für NaCl erhalten wir E Mad = q 1 q 2 ⇑4πє 0 a = −e 2 ⇑4πє 0 a ≃ −5 eV für a ≃ 2.8 Å und
є 0 = 8.85 × 10−12 A s⇑V m. Wir werden den genauen Wert der Madelungenergie später
diskutieren. Die Bindungsenergie E B für den Ionenkristall ergibt sich zu
E B = E Mad + A + I (3.3.2)
Die Bindungsenergie eines stabilen Ionenkristalls ist negativ. Sie ergibt sich als Summe der
negativen Madelung-Energie und Elektronenaffinität und der positiven Ionisationsenergie.
Für NaCl erwarten wir mit den obigen Abschätzungen eine Bindungsenergie E B ≃ −3 eV pro
Ionenpaar.
3.3.1 Madelungenergie
Wir wollen nun die Madelung-Energie näher analysieren. Da die Coulomb-Wechselwirkung
zwischen den einzelnen Ionen proportional zu 1⇑r ist, erhalten wir eine langreichweitige
Wechselwirkung. Um die Madelung-Energie zu erhalten, müssen wir über die Wechselwir-
kung zwischen allen Ionen aufsummieren. Hierbei erhalten wir positive und negative Bei-
6
Erwin Madelung, geboren am 18. Mai 1881 in Bonn, gestorben 1. August 1972 in Frankfurt.
112 3 Bindungskräfte
träge durch Ionen gleicher und unterschiedlicher Ladung. In Analogie zur gesamten poten-
ziellen Energie bei der Van der Waals Wechselwirkung (vergleiche (3.2.16)) erhalten wir
N q2
U tot = ∑ ⌊︀∓ + λe−r i j ⇑ρ }︀ . (3.3.3)
2 i≠ j 4πє 0 r i j
Der Faktor 12 ist hierbei notwendig, da wir bei der Summation jedes Paar i j = ji zweimal
zählen.7 Das Vorzeichen ± berücksichtigt die Tatsache, dass Ionenpaare das gleiche oder das
7
In vielen Lehrbüchern wird über die Zahl N I = N⇑2 der Ionenpaare summiert, weshalb dann der
Faktor 1⇑2 fehlt.
3.3 Die ionische Bindung 113
entgegengesetzte Vorzeichen haben können. Der zweite Term in der Summe berücksichtigt
die kurzreichweitige Abstoßung von zwei Ionen aufgrund des Pauli-Prinzips. Diese Wech-
selwirkung kann empirisch gut mit dem Born-Mayer- oder auch Buckingham-Potenzial ge-
nannten Term λe−r i j ⇑ρ beschrieben werden. Die Parameter λ und ρ geben die Stärke und die
Reichweite der abstoßenden Wechselwirkung an und können aus den experimentellen Wer-
ten für die Gitterkonstante und die Kompressibilität bestimmt werden. Wir wollen ferner
darauf hinweisen, dass zwischen den Ionenpaaren natürlich auch eine Van der Waals Wech-
selwirkung auftritt. Diese ist aber um etwa 2 Größenordnungen kleiner als die Coulomb-
Wechselwirkung und wird hier vernachlässigt.
Zur Auswertung der Summe (3.3.3) berücksichtigen wir zunächst, dass die Reichweite der
abstoßenden Wechselwirkung sehr klein ist. Wir müssen deshalb nur über die Zahl Z NN der
nächsten Nachbarn aufsummieren. Wir können also r i j = R (Abstand der nächsten Nach-
barn) setzen und erhalten für den Beitrag aufgrund des Pauli-Prinzips
N
UP = Z NN λe−R⇑ρ . (3.3.4)
2
Für den Beitrag aus der Coulomb-Wechselwirkung erhalten wir unter Benutzung von r i j =
̃
α i j R (R = Abstand zum nächsten Nachbarn)
N q2 ±1 N q2
UC = − ∑ = −α (3.3.5)
2 4πє 0 R i≠ j ̃
αi j 2 4πє 0 R
Die Madelung-Konstante ist abhängig von der Kristallstruktur. Bei der NaCl-Struktur (fcc)
+
ist ein Na⌋︂ -Ion im Abstand R von 6 Cl− ⌋︂
-Ionen umgeben, es folgen dann⌋︂12 Na+ -Ionen im
Abstand 2R, 8 Cl -Ionen im Abstand 3R, 6 Na+ -Ionen im Abstand 4R, usw. Wir er-
−
8
In drei Dimensionen ist die Berechnung der Summe schwierig und erfordert besondere Metho-
den, siehe z. B. Ewald-Methode in Einführung in die Festkörperphysik, Charles Kittel, Oldenbourg
Verlag, München (2006), Anhang B.
114 3 Bindungskräfte
12
NaCl
𝑹 𝜶 = 1.747
8
𝒁𝐍𝐍 𝝀 𝐞𝐱𝐩 − 𝝀 = 1090 eV
𝝆
𝝆 = 0.321 Å
4
U (eV)
෩
𝑼
0
-4
𝑹𝟎
Wir können nun (3.3.4) und (3.3.5) zusammenfassen. Um die Bindungsenergie bezogen auf
̃ zu bekommen, teilen wir noch durch N⇑2 und erhalten
ein Ionenpaar, U,
2
̃ = −α q
U + Z NN λe−R⇑ρ . (3.3.7)
4πє 0 R
Wir sehen, dass die elektrostatische Energie pro Ionenpaar gerade durch die Coulomb-Ener-
gie zwischen nächsten Nachbarn multipliziert mit der Madelung-Konstante gegeben ist. Das
̃ 0) =
resultierende Gesamtpotenzial ist in Abb. 3.8 dargestellt. Für NaCl erhalten wir U(R
−8.25 eV in guter Übereinstimmung mit dem experimentell gemessenen Wert von −8.15 eV.
Da die Madelung-Konstante für die CsCl-Struktur (sc-Gitter) am größten ist, würde man
erwarten, dass alle Ionenkristalle eine CsCl-Struktur bevorzugen. Dies ist allerdings nicht
der Fall, wie die NaCl-Struktur (fcc-Gitter) von Kochsalz belegt. Der Grund dafür liegt in
dem Verhältnis der Radien der beteiligten Ionen. Der Begriff des Ionenradius ist hierbei so
zu verstehen, dass der Gleichgewichtsabstand R 0 zweier benachbarter Ionen gerade durch
die Summe der Ionenradien r A und r B der beteiligten Ionen gegeben ist. Der Ionenradius
eines bestimmten Elements hat, wenn dieses Element in verschiedenen Verbindungen vor-
kommt, immer nahezu den gleichen Wert. Da die ionische Bindung nicht gerichtet ist, wird
ein Ionenkristall die Struktur bevorzugen, die eine möglichst dichte Packung der beteilig-
ten Ionen erlaubt. Dabei muss allerdings berücksichtigt werden, dass sich Ionen mit unter-
schiedlicher Ladung berühren können, da sonst die Bindungsenergie herabgesetzt wird.⌋︂Wir
können uns diesen Sachverhalt ⌋︂ leicht anhand von Abb. 3.9(a) klar machen. Falls 2r A 3 <
2(r A + r B ), d.h. rr AB < 1⇑( 3 − 1) = 1.366 ist, können sich die negativen und positiven Io-
nen entlang der Raumdiagonalen direkt berühren. Für diesen Fall wird die Cäsiumchlorid-
Struktur (sc-Gitter) bevorzugt. Für rr AB > 1.366 ist dies aber nicht mehr der Fall, weshalb dann
die in Abb. 3.9(b) gezeigte Natriumchlorid-Struktur (fcc-Gitter) bevorzugt wird, bei der sich
die negativen und positiven Ionen jetzt entlang der Flächendiagonalen direkt berühren kön-
nen (siehe hierzu auch die Diskussion in Abschnitt 1.2.7).
Die in Abb. 3.9(c) gezeigte geometrische Betrachtung zeigt sofort, dass bei einem noch grö-
ßeren Verhältnis von r A und r B sich auch in einer Natriumchlorid-Struktur (fcc-Gitter) die
Ionen unterschiedlicher Ladung nicht mehr berühren können. Wird r A zu groß, so verlie-
3.3 Die ionische Bindung 115
(a) H F Cl Br I
Li
Na
Cl – NaCl
K
Cs+ Rb
a Cs CsCl
(b) (c)
A- B+ A-
Cl – 𝒓𝑩
B+
Na+ 𝟐𝒓𝑨 𝒓𝑨
Cl – B+ A-
a
Abb. 3.9: Zur Berechnung des kritischen Verhältnisses der Ionenradien für den Übergang von einer
einfach kubischen (sc) CsCl-Struktur (a) zur einer flächenzentrierten (fcc) NaCl-Struktur (b) bei ei-
nem Ionenkristall mit zweiatomiger Basis. Die in (c) gezeigte geometrische Betrachtung zeigt, dass für
r A ⇑r B > 2.414 sich auch in einer NaCL-Struktur die Ionen unterschiedlicher Ladung nicht mehr direkt
berühren können. Die Tabelle zeigt, welche Verbindungen zwischen Alkalimetallen und Halogenen in
der NaCl- (fcc) und welche in der CsCl-Struktur (sc) kristallisieren.
ren die B-Ionen den direkten Kontakt zu den A-Ionen. Für das kritische Radienverhältnis
erhalten wir aus Abb. 3.9(c) sofort den Wert
rA 1
= ⌋︂ = 2.414 . (3.3.8)
rB 2−1
Für rr AB > 2.414 könnten sich also die Na+ - und Cl− -Ionen nicht mehr berühren. Dies ist aber
für die weniger dicht gepackte Zinkblende-Struktur (ebenfalls fcc-Gitter) möglich, weshalb
wir für sehr große rr AB -Werte eine Zinkblende-Struktur erwarten.
3.3.2 Gleichgewichtsgitterkonstante
Den Gleichgewichtsatomabstand R 0 erhalten wir, indem wir das Minimum von (3.3.7) su-
chen. Aus
̃
dU q2 1
= 0 = +α 2
− Z NN λe−R⇑ρ (3.3.9)
dR 4πє 0 R ρ
erhalten wir
q2
R 02 e−R 0 ⇑ρ = ρα . (3.3.10)
4πє 0 Z NN λ
Wir sehen, dass wir R 0 erhalten können, falls wir die Parameter ρ und λ des abstoßenden
Potenzials wissen. In der Praxis geht man umgekehrt vor: man bestimmt ρ und λ durch
116 3 Bindungskräfte
Messung von R 0 und der Kompressibilität. Setzen wir (3.3.10) in (3.3.7) ein, so erhalten wir
̃ 0 ) = E Mad = −α q2 ρ
U(R (1 − ) . (3.3.11)
4πє 0 R 0 R0
Aus experimentellen Daten erhält man, dass typischerweise ρ ∼ 0.1 R 0 , d. h. das abstoßende
Potenzial ist in der Tat nur sehr kurzreichweitig.
3.3.3 Kompressibilität
In Analogie zu Abschnitt 3.2.4 können wir wiederum die Kompressibilität bzw. den Bulk-
Modul aus dem Ausdruck für die gesamte potenzielle Energie ableiten. Aus
1 ∂2 U d dU dR d 2 U dR 2 dU d 2 R
B= =V = V ( ) = V ⌊︀ ( ) + }︀ . (3.3.12)
κ ∂V 2 dV dR dV dR 2 dV dR dV 2
folgt mit
d2U N Z NN λ −R 0 ⇑ρ αq 2
( ) = ( e − ). (3.3.13)
dR 2 R=R 0 2 ρ2 2πє 0 R 03
und
2
dR 2 1 1
( ) =( ) = . (3.3.14)
dV R=R 0 dV ⇑dR R=R 0 (N⇑2)2 36R 04
Hierbei müssen wir berücksichtigen, dass der Zusammenhang zwischen V und R von der
Kristallstruktur abhängt. Das letzte Gleichheitszeichen gilt deshalb nur für die fcc-Struktur.
Für diese ist das Gesamtvolumen des Kristalls durch V = N8 a 3 gegeben, da jede konventio-
nelle kubische Zelle mit Volumen a 3 je 4 Na+ - und Cl− -Ionen, also genau 8 Ionen enthält.
Der nächste Nachbarabstand ist R = a⇑2 und somit V = 2 N2 R 3 . Berücksichtigen wir noch,
dass dU⇑dR⋃︀R=R 0 = 0, so erhalten wir durch Einsetzen von (3.3.13) und (3.3.14) in (3.3.12)
für die fcc-Struktur den Bulk-Modul
1 1 Z NN λ αq 2
B= = ( 2 e−R 0 ⇑ρ − ). (3.3.15)
κ 18R 0 ρ 2πє 0 R 03
In Tabelle 3.6 sind die charakteristischen Parameter von einigen Ionenkristallen zusammen-
gestellt. Wir sehen, dass die experimentell bestimmten Bindungsenergien relativ gut mit den
theoretisch ermittelten Werten übereinstimmen. Bei den theoretischen Werten wurde zu-
nächst λ und ρ durch Messung von R 0 und κ bestimmt und dann die Bindungsenergie U ̃
̃
mit (3.3.7) bestimmt. Bezüglich der experimentellen Werte von U ist anzumerken, dass sich
diese nicht direkt bestimmen lassen, da wir ja einen Kristall nicht in freie Ionen zerlegen
können. Die Bestimmung erfolgt über den Born-Haberschen Kreisprozess, den wir hier nicht
näher diskutieren wollen.9
9
siehe hierzu z. B. Einführung in die Festkörperphysik, Konrad Kopitzki, Teubner Studienbücher,
3. Auflage, B. G. Teubner, Stuttgart (1993).
3.4 Die kovalente Bindung 117
Erhöhung der potenziellen Energie führen, aber insgesamt kann trotzdem ∆E kin + ∆E pot < 0
sein, so dass eine anziehende Wechselwirkung resultiert.
Wir werden jetzt die kovalente Bindung anhand des einfachsten Falls, eines H+2 -Molekül-
ions diskutieren. Dabei werden wir die wesentlichen Ingredienzen der kovalenten Bindung
kennenlernen.
e2 1 1 1
E pot = − ( + − ). (3.4.1)
4πє 0 r A r B R
Vernachlässigen wir die Schwerpunktsbewegung der Kerne, so enthält der Hamilton-Opera-
tor für dieses System die kinetische Energie des Elektrons und die potenzielle Energie (3.4.1).
Das geeignete Molekülorbital für das Elektron erhalten wir dann durch Lösung der Schrö-
dinger-Gleichung
ħ2 2 e2 1 1 1
⌊︀− ∇e − ( + − )}︀ Ψ(r, R) = E Ψ(r, R) . (3.4.2)
2m 4πє 0 r A r B R
Für den Fall, dass das Elektron instantan auf Abstandsänderungen der Kerne reagieren kann
(adiabatische Näherung, vergleiche hierzu Abschnitt 5.1.1) lässt sich die Schrödinger-Glei-
chung exakt lösen.10 Ansonsten müssen wir zu ihrer Lösung selbst für dieses einfachste Mo-
lekül Näherungen machen. Eine gebräuchliche Näherung ist die LCAO-Methode (LCAO:
linear combination of atomic orbitals), bei der das Molekülorbital als Linearkombination
der Zustände ϕ A und ϕ B (in dem betrachteten Fall des H+2 -Molekülions sind dies Wasser-
stoff 1s-Orbitale) der beiden nichtwechselwirkenden Atome angenähert wird:
Ψ(r, R) = c A ϕ A (r A ) + c B ϕ B (r B ) (3.4.3)
Hierbei sind c A und c B reelle Konstanten. Ferner können r A = r + R⇑2 und rB = r − R⇑2
durch r und den Kernabstand R ausgedrückt werden (vergleiche hierzu Abb. 3.10). Da die
Gesamtwellenfunktion für jeden Kernabstand R normiert sein muss, müssen wir
+ 2c A c B R ∫ ϕ∗A ϕ B d 3 r (3.4.4)
fordern, wobei wir jeweils über die Koordinaten des Elektrons integrieren müssen.
10
In diesem Fall können wir die beiden Kerne als starres Gebilde annehmen und haben wiederum ein
Zweiteilchenproblem, allerdings mit nicht-kugelsymmetrischem Potenzial zu lösen. Wir nehmen
ferner an, dass der Schwerpunkt der beiden Kerne sich in Ruhe befindet.
𝟐 𝑯+ - Molekülion
3.4 Die kovalente Bindung 119
𝑦 𝒆−
𝒓
𝒓𝑨 𝒓𝑩
A 𝑥 B
S
𝑹𝑨 𝑹𝑩 𝑧 Abb. 3.10: Zur Definition der Größen beim H+2 -Molekül-
𝒆+ 𝑹 𝒆+ ion.
Die atomaren Wellenfunktionen ϕ A und ϕ B sind bereits normiert, so dass die beiden ersten
Integrale jeweils eins ergeben. Wir erhalten somit
𝐸𝑝𝑜𝑡
c A2 + c B2 + 2c A c B S AB = 1 ,
31
(3.4.5)
vom räumlichen Überlapp der beiden Atomwellenfunktionen abhängt. Wir nennen es des-
halb Überlappintegral. Sein Wert hängt vom Abstand R der beiden Kerne ab, da über die
Elektronenkoordinaten r = r A − R⇑2 und r = rB + R⇑2 integriert wird.
Aus Symmetriegründen gilt ⋃︀c A ⋃︀2 = ⋃︀c B ⋃︀2 = ⋃︀c⋃︀2 .11 Außerdem muss die entstehende Wellen-
funktion entweder symmetrisch oder antisymmetrisch beim Vertauschen der beiden Atom-
orbitale sein, woraus c A = ±c B folgt. Damit erhalten wir unter Ausnutzung von (3.4.5) die
0.20
0.4 (a) (b)
𝚿𝒔 𝚿𝐚 𝟐
0.2
bindend 0.15
B
𝚿𝒔 𝟐
2
0.0
||
0.10
A
-0.2
anti- 0.05
𝒂
-0.4
bindend 𝚿 A B
0.00
-4 -2 0 2 4 -4 -2 0 2 4
r / aB r / aB
Abb. 3.11: Symmetrische und anti-symmetrische Wellenfunktion des H+2 -Molekülions zusammen-
gesetzt aus Wasserstoff 1s-Orbitalen. Gezeigt ist ein Schnitt durch die zylindersymmetrischen Funk-
tionen Ψ s und Ψ a (a) und deren Absolutquadrate ⋃︀Ψ s ⋃︀2 und ⋃︀Ψ a ⋃︀2 (b).
11
Dieses Ergebnis können wir auch dadurch ableiten, indem wir allgemein den Erwartungswert der
Energie als Funktion von c A und c B berechnen und dann den Minimalwert der Energie bezüg-
lich der Konstanten c A und c B suchen. Die aus ∂E⇑∂c A = 0 und ∂E⇑∂c B = 0 resultierenden Be-
stimmungsgleichungen liefern c A = c B für den antibindenden und c A = −c B für den bindenden
Zustand.
bindend antibindend
32
120 3 Bindungskräfte
⧹︂ Ψ dV
∐︀Ẽ︀ = ∫ Ψ∗ H (3.4.9)
bestimmen. Wir erhalten für den symmetrischen und den antisymmetrischen Zustand die
beiden Energiefunktionen
H AA + H AB
E s (R) =
1 + S AB
(3.4.10)
H AA − H AB
E (R) =
a
.
1 − S AB
⧹︂ A d 3 r = ∫ ϕ∗B Hϕ
H AA = H BB = ∫ ϕ∗A Hϕ ⧹︂ B d 3 r (3.4.11)
⧹︂ B d 3 r = ∫ ϕ∗B Hϕ
H AB = H BA = ∫ ϕ∗A Hϕ ⧹︂ A d 3 r . (3.4.12)
12
Beim Ausrechnen der Integrale über die Elektronenkoordinaten müssen die Variablen r A und r B ,
die jeweils auf den Kern A bzw. B bezogen sind, auf einen gemeinsamen Ursprung transformiert
werden. Die Lösung von Integralen der Form
e−r A ⇑a B e−r B ⇑a B 3
I(R) = ∫ d r
rArB
wird am besten in konfokalen elliptischen Koordinaten vollzogen.
13
Wir können dies auch so formulieren. Der Ausdruck ϕ∗B ϕ A ist kein Quadrat einer Wahrscheinlich-
keitsamplitude und somit nicht als Wahrscheinlichkeitsdichte interpretierbar. Es handelt sich, um
einen Begriff aus der Optik zu benutzen, um die Interferenz von Wahrscheinlichkeitsamplituden.
Die chemische Bindung ist eine Folge dieser Interferenz.
3.4 Die kovalente Bindung
𝑯+ - Molekülion 121
𝟐
𝑬𝒔 𝑹 𝑬𝒂 𝑹
4
𝑹𝟎 = 𝟐. 𝟒𝟗 𝒂𝐁 = 𝟎. 𝟏𝟑𝟐 𝐧𝐦
𝑬 𝑹𝟎 − 𝑬𝟏𝒔 = −𝟏. 𝟕𝟕 𝐞𝐕
E - E1s (eV)
-2
Abb. 3.12: Energiefunktionen E s (R)
und E a (R) für symmetrische und
0 1 2 3 4 5 6
antisymmetrische Elektronendichte-
R / aB verteilungen des H+2 -Molekülions.
33
Auf ein explizites Ausrechnen der Terme H AA , H AB und S AB wollen wir hier verzichten
und nur das Ergebnis anhand von Abb. 3.12 diskutieren. Für R → ∞ wird der Überlapp der
Wellenfunktionen null und wir erhalten E s = E a = H AA = E 1s = −13.6 eV, da der Beitrag
e 2 ⇑4πє 0 R in (3.4.2) aufgrund der Abstoßung der beiden Wasserstoffkerne vernachläs-
sigbar klein wird (E 1s ist die Bindungsenergie des Wasserstoff 1s-Orbitals). Für R → 0
gehen sowohl E s als auch E a gegen unendlich, da jetzt der Term e 2 ⇑4πє 0 R dominiert.
Für mittlere R sehen wir, dass E s (R) ein Minimum besitzt, während E a (R) monoton mit
zunehmendem R abfällt. Für E s (R) − E 1s erhalten wir eine Kurve, die ein Minimum bei
R 0 = 2.49 ⋅ a B ≃ 1.32 Å aufweist. Die zugehörige Energie D e = E s (R 0 ) − E 1s = −1.77 eV ist
negativ. Wir bezeichnen D e als Dissoziationsenergie, da diese Energie notwendig ist, um
das Molekül wieder in ein Proton und ein Wasserstoffatom zu trennen. Befindet sich das
elektronische System im Ψ s -Zustand, so kommt es also zur Energieabsenkung bzgl. des
dissoziierten Systems, dessen elektronische Energie gleich E 1s ist. Die physikalische Folge
ist ein stabiles Molekül. Ψ s wird deshalb als bindendes Molekülorbital (MO) bezeichnet.
E a (R) − E 1s ist eine positive, für R → 0 monoton ansteigende Funktion. Sie führt somit
nicht zu einem Bindungszustand. Ψ a wird als anti-bindendes Molekülorbital bezeichnet.
Wir erhalten also eine Aufspaltung der atomaren Energieniveaus in ein bindendes und ein
antibindendes Molekülorbital (siehe Abb. 3.13).
Abb. 3.11 zeigt, dass das bindende Molekülorbital ein symmetrisches Orbital mit einer er-
höhten Elektronendichte in der Mitte zwischen den beiden Wasserstoffkernen ist. Für das
antibindende Orbital verschwindet dagegen die Elektronendichte in der Mitte zwischen den
Kernen. Dies stimmt mit unserer anfangs gemachten anschaulichen Diskussion überein, auf-
antibindendes
Molekülorbital
𝑯𝑨𝑨 𝝓𝑨 𝑬𝒂 𝚿𝒂 𝑯𝑩𝑩 𝝓𝑩
Atom- Atom- Abb. 3.13: Aufspaltung der atomaren Energie-
orbital A 𝑬𝒔 𝚿𝒔 orbital B
niveaus in ein bindendes und antibindendes
bindendes
Molekülorbital Molekülorbital.
122 3 Bindungskräfte
grund derer wir ganz allgemein einen bindenden Zustand erwartet haben, falls sich die Elek-
tronen der Hülle auf mehrere Atome verteilen können.
𝑦 𝒆−
Wasserstoff-Molekül 𝟐
𝒆−
𝟏 𝒓𝟏𝟐
𝑥
A B
S
𝑹𝑨 𝑹𝑩
Abb. 3.14: Zur Definition der Größen beim H2 -Molekül. 𝒆+ 𝑹 𝒆+ 𝑧
3.4.2.1
𝑟1𝐴 , 𝑟Die
2𝐵 : Molekülorbitalnäherung
Abstand von Elektron 1 zu Kern A und Elektron 2 zu Kern B
𝑟1𝐵 , 𝑟2𝐴 : Abstand
Der Grundzustand desvon
H2Elektron 1 zugeht
-Moleküls Kernfür R →Elektron
B und ∞ in zwei
2 zu H-Atome
Kern A im 1s-Zustand über.
Deshalb wählen wir als Molekülorbital genauso wie beim H+2 -Molekülion die symmetrische
𝑟12 , 𝑅: Abstand der beiden Elektronen und Kerne
normierte Linearkombination
1
Ψ s = ⌋︂ (ϕ A + ϕ B ) (3.4.16)
2 + 2S AB
bestehend aus den Wasserstoff 1s-Wellenfunktionen ϕ A und ϕ B .
Berechnung von Bindungsenergie erfordert Ansatz für Zweielektronen-Wellenfunktion
36
3.4 Die kovalente Bindung 123
Für den Fall, dass beide Elektronen im Grundzustand des H2 -Moleküls sind, setzen wir für
unsere Zweielektronen-Wellenfunktion das Produkt
Ψ(r1 , r2 ) = Ψ s (r1 ) ⋅ Ψ s (r2 ) (Produkt von Molekülorbitalen) (3.4.17)
der beiden Molekülorbitale (3.4.16) an. Wir sprechen deshalb von der Molekülorbitalnä-
herung. Dieser Ansatz bedeutet, dass wir den Einfluss der Wechselwirkung zwischen den
beiden Elektronen (Korrelationseffekte) auf die räumliche Verteilung der Molekülorbitale
vernachlässigen.
Wir sehen ferner, dass unser Ansatz (3.4.17) symmetrisch bezüglich einer Vertauschung der
beiden Elektronen ist. Da wir es aber mit Fermionen zu tun haben, für die das Pauli-Prinzip
gilt, muss die Gesamtwellenfunktion antisymmetrisch sein. Dies können wir dadurch errei-
chen, dass wir den Ortsanteil mit einem antisymmetrischen Spin-Anteil multiplizieren und
somit die antisymmetrische Gesamtwellenfunktion
Ψ(r1 , r2 , s1 , s2 ) = Ψ s (r1 ) ⋅ Ψ s (r2 ) ⋅ χ asym (3.4.18)
mit
1
χ asym = ⌋︂ )︀σ + (r1 )σ − (r2 ) − σ + (r2 )σ − (r1 )⌈︀ (3.4.19)
2
erhalten. Hierbei bedeutet σ + (r1 ), dass der Spin des Elektrons am Kern 1 nach oben zeigt.
Wir sehen, dass die beiden Elektronen antiparallelen Spin haben und somit einen anti-
symmetrischen Spin-Singulett-Zustand bilden. Aus (3.4.17) erhalten wir unter Benutzung
von (3.4.16):
1
Ψ s (r1 , r2 ) = )︀ϕ A (r1 ) + ϕ B (r1 )⌈︀ ⋅ )︀ϕ A (r2 ) + ϕ B (r2 )⌈︀ (3.4.20)
2 + 2S AB
In analoger Weise können wir eine antisymmetrische Wellenfunktion aus einer antisymme-
trischen Ortsfunktion und einer symmetrischen Spin-Funktion aufbauen. Die symmetri-
sche Ortsfunktion erhalten wir durch Multiplikation einer symmetrischen Funktion (3.4.16)
mit einer antisymmetrsichen Linearkombination
1
Ψ a = ⌋︂ (ϕ A − ϕ B ) . (3.4.21)
2 − 2S AB
Wir erhalten dann wiederum eine antisymmetrische Gesamtwellenfunktion
Ψ(r1 , r2 , s1 , s2 ) = Ψ s (r1 ) ⋅ Ψ a (r2 ) ⋅ χ sym (3.4.22)
mit dem symmetrischen Spin-Triplett-Zustand
)︀
⌉︀ σ + (r1 )σ + (r2 )
⌉︀
⌉︀
⌉︀
⌉︀ 1
χ sym = ⌋︀ ⌋︂ (︀σ + (r1 )σ − (r2 ) + σ + (r2 )σ − (r1 )⌋︀ . (3.4.23)
⌉︀
⌉︀
⌉︀
2
⌉︀
⌉︀ − −
]︀ (r1 )σ (r2 )
σ
Für den antisymmetrischen Ortsanteil ergibt sich
1
Ψ a (r1 , r2 ) = ⌈︂ )︀ϕ A (r1 ) + ϕ B (r1 )⌈︀ ⋅ )︀ϕ A (r2 ) − ϕ B (r2 )⌈︀ . (3.4.24)
2 1 − S AB
2
124 3 Bindungskräfte
3.4.2.2 Valenzbindungsnäherung
Das Produkt in der Molekularorbitalnäherung (3.4.20) enthält auch Terme, die den Zustand
beschreiben, in dem sich beide Elektronen in der Nähe eines der beiden Kerne aufhalten. Es
stellt deshalb nur dann eine gute Näherung dar, wenn Elektron-Elektron-Wechselwirkun-
gen vernachlässigt werden können. Die Coulombabstoßung der beiden Elektronen macht
diesen Zustand aber in den meisten Fällen unwahrscheinlich. Wir können die mathema-
tische Behandlung erheblich vereinfachen, wenn wir diese Terme bei der Berechnung der
Grundzustandsenergie erst gar nicht berücksichtigen. Tun wir dies, so kommen wir zur so
genannten Valenzbindungsnäherung, die auf Walter Heitler14 und Fritz London15 zurück-
geht. In dieser Näherung setzen wir die Gesamtwellenfunktion für die beiden Elektronen
nicht als Produkt von zwei Molekülorbitalen, sondern als Produkt von zwei Atomorbitalen
an. Im tiefsten Molekülorbital können zwei Elektronen mit entgegengesetztem Spin unter-
gebracht werden. Die dazugehörige Wellenfunktion
gibt die Wahrscheinlichkeit dafür an, dass das Elektron 1 am Kern A ist, also durch die
atomare Wellenfunktion ϕ A beschrieben werden kann, und das Elektron 2 gleichzeitig am
Kern B zu finden ist und deshalb durch ϕ B beschrieben wird. Es treten also keine Terme auf,
die dem Antreffen beider Elektronen an einem der beiden Kerne entsprechen.
Da die beiden Elektronen ununterscheidbar sind, muss auch die Wellenfunktion
eine mögliche Wellenfunktion mit gleicher Ladungsverteilung sein. Nach dem Pauli-Prinzip
muss der räumliche Anteil der Wellenfunktion symmetrisch oder antisymmetrisch bezüg-
lich der Vertauschung der beiden Elektronen sein, um so mit der entsprechenden Spin-
Funktion eine insgesamt antisymmetrische Gesamtwellenfunktion zu ergeben. Mit c = c 1 =
±c 2 können wir schreiben:
1
Ψ s,a = ⌋︂ )︀ϕ A (r1 ) ⋅ ϕ B (r2 ) ± ϕ A (r2 ) ⋅ ϕ B (r1 )⌈︀ (3.4.28)
2 ± 2S
14
Walter Heinrich Heitler, geboren am 2. Januar 1904 in Karlsruhe, gestorben am 15. November
1981 in Zollikon, Schweiz.
15
Fritz Wolfgang London, geboren am 7. März 1900 in Breslau, gestorben am 30. März 1954 in
Durham, North Carolina, USA.)
3.4 Die kovalente Bindung 125
das Überlappintegral.
Der Unterschied zur Molekülorbitalnäherung besteht darin, dass dort ein Molekülorbital-
ansatz für ein Elektron gemacht wurde, das sich sowohl in ϕ A als auch in ϕ B aufhalten kann
und deshalb durch die Linearkombination (3.4.7) beschrieben wird. Für die Besetzung mit
zwei Elektronen wird dann der Produktansatz (3.4.17) verwendet. Bei der Heitler-London
Näherung werden dagegen gleich beide Elektronen betrachtet, so dass für Ψ1 der Produkt-
ansatz der atomaren Orbitale notwendig ist, deren Linearkombination dann durch das Pauli-
Prinzip erzwungen wird.
Wir können jetzt mit dem Ansatz (3.4.28) und dem Hamilton-Operator (3.4.13) den Erwar-
tungswert der Energie berechnen. Der Beitrag von H 0 ergibt gerade 2E 1s und den Beitrag
aufgrund von H 1 können wir durch die Coulomb-Integrale V und die Austauschintegrale A
R = 0.15 nm 4
R = 0.25 nm
E - 2E1s (eV)
-2
-4
0.00 0.05 0.10 0.15 0.20 0.25
R (nm)
Abb. 3.15: Energiekurve E(R) und Elektronendichten des Wasserstoffmoleküls für verschiedene Ab-
stände R der Kerne berechnet mit dem LCAO-Programmpaket „Gauss“ (rot = hohe Elektronendichte,
blau = niedrige Elektronendichte).
126 3 Bindungskräfte
V +A
E s (R) = 2E 1s +
1+S
(3.4.32)
V −A
E (R) = 2E 1s +
a
.
1−S
Wir sehen, dass auch in der Heitler-London Näherung die symmetrische Orbitalfunktion
den energetisch günstigeren Zustand liefert. Für R → ∞ gehen sowohl V als auch A ge-
gen null und wir erhalten E s = E a = 2E 1s , also die Energie von zwei nicht wechselwirkenden
Wasserstoffatomen. Für R → 0 dominiert wie beim H+2 -Molekülion die repulsive Coulomb-
Wechselwirkung der beiden Wasserstoffkerne. Dazwischen gibt es, wie Abb. 3.15 zeigt, für
die symmetrische Wellenfunktion ein Minimum, also einen bindenden Zustand.
Singulett- und Triplett-Zustand: Wir haben gesehen, dass unabhängig von den gemach-
ten Näherungen nur immer das symmetrische Molekülorbital einen bindenden Zustand
liefert. Da die Gesamtwellenfunktion für Fermionen antisymmetrisch sein muss, muss die
Spin-Funktion antisymmetrisch sein. Das heißt, die beiden Elektronen haben im H2 -Mole-
kül eine antiparallele Stellung. Sie bilden einen Singulett-Zustand. Für das nichtbindende,
antisymmetrische Molekülorbital muss dagegen die Spin-Funktion symmetrisch sein.
Die Elektronenspins sind parallel ausgerichtet und bilden einen Triplett-Zustand (siehe
Abb. 3.16). Wir sehen also, dass die Bindungsenergie offenbar von der Stellung der beiden
Elektronenspins abhängt. Diese spinabhängige Coulomb-Energie ist von zentraler Bedeu-
tung für den Magnetismus von Festkörpern. Ursache ist letztendlich das Pauli-Prinzip, das
erfordert, dass sich Elektronen mit parallelem Spin aus dem Weg gehen, und auf diese Weise
die Ortswellenfunktion beeinflusst.
Singulett, S =0 Triplett, S = 1
𝝓𝑨 𝚿𝒂 𝝓𝑩 𝝓𝑨 𝚿𝒂 𝝓𝑩
𝚿𝒔 𝚿𝒔
Abb. 3.16: Singulett- und Triplett-Zustand für ein H2 -Molekül. Offensichtlich ist der energetisch güns-
tigste Fall derjenige, bei dem die zwei Elektronen mit antiparallelem Spin in das bindende Molekülor-
bital eingebaut werden.
37
3.4 Die kovalente Bindung 127
= Ψionisch
s
+ Ψkovalent
s
(3.4.33)
mit
s
Ψionisch (r1 , r2 ) ∝ )︀ϕ A (r1 )ϕ A (r2 ) + ϕ B (r1 )ϕ B (r2 )⌈︀ (3.4.34)
s
Ψkovalent (r1 , r2 ) ∝ )︀ϕ A (r1 )ϕ B (r2 ) + ϕ A (r2 )ϕ B (r1 )⌈︀ (3.4.35)
Vergleichen wir dies mit dem Heitler-London Ansatz, so erkennen wir, dass im Heitler-
s
London Ansatz der Anteil Ψionisch fehlt. Er beschreibt gerade die Situation, bei der beide
Elektronen entweder am Kern A oder am Kern B sind und somit ein H+ -H− -Ionenmolekül
s
vorliegt. Die Wellenfunktion Ψionisch beschreibt also ein System, bei dem beide Elektronen
nur einem Proton zugeordnet sind. Für R → ∞ ergibt sich eine Separation in ein nacktes
Proton und ein H− -Ion. Wir bezeichnen Bindungen, die aufgrund derartiger Orbitale zu-
stande kommen, als ionisch.
Für das H2 -Molekül ist der ionische Zustand wesentlich unwahrscheinlicher als der kova-
s s
lente Zustand Ψkovalent . Die Wellenfunktion Ψkovalent beschreibt ein System, bei dem jedem
Proton ein Elektron zugeordnet ist, wobei allerdings auch eine Mischung der beiden Elektro-
nenwellenfunktionen auftritt. Für R → ∞ separiert dieses System in zwei neutrale H-Atome,
die sich in ihrem jeweiligen 1s-Grundzustand befinden. Wir bezeichnen Bindungen, die
auf Grund derartiger Orbitale zustande kommen, als kovalent. Wir sehen also, dass in der
Heitler-London Näherung nur der kovalente Anteil Berücksichtigung findet, während in der
MO-Näherung der ionische und der kovalente Anteil mit gleichem Gewicht eingehen.
Vergleichen wir die beiden Näherungen so sehen wir, dass die MO-Näherung den ioni-
schen Anteil überbewertet, während die Heitler-London-Näherung diesen unterbewertet.
Eine Verbesserung der Näherungsmethoden können wir deshalb dadurch erreichen, indem
wir den Ansatz
Ψ s,MO = (1 − λ) Ψionisch
s
+ (1 + λ) Ψkovalent
s
, 0≤λ≤1 (3.4.36)
machen, der es gestattet, das Verhältnis von ionischem und kovalentem Bindungsanteil
durch einen Parameter λ zu regeln. Für λ = 0 sind der ionische und kovalente Bindungsan-
teil gleich gewichtet. Vergrößern wir λ, so reduzieren wir das Gewicht des ionischen Anteils
und gelangen dadurch zu einer realistischeren Situation. In der Tat lässt sich dadurch eine
bessere Übereinstimmung mit dem Experiment erzielen. Optimieren wir den Parame-
ter λ(R) durch eine Variationsrechnung, so erhalten wir E B = −4.0 eV bei R 0 = 0.75 Å bei
= 0.2 (experimenteller Wert: E B = −4.747 eV). Der ionische Anteil variiert stark mit R.
1−λ exp
1+λ
Für R → ∞ geht er gegen null. Die Potenzialkurve sowie elektronische Ladungsverteilungen
im Grundzustand des Wasserstoffmoleküls bei verschiedenen Protonenabständen sind
in Abb. 3.15 gezeigt. Wir wollen ferner festhalten, dass eine kovalente Bindung zwischen
ungleichen Atomen immer einen gewissen ionischen Charakter hat. In Tabelle 3.7 ist der
Charakter von Bindungen zwischen Atomen mit zunehmender Valenz zusammengestellt.
Wir erhalten einen fließenden Übergang von einer rein ionischen zu einer rein kovalenten
Bindung.
Eine weitere Verbesserung können wir dadurch erreichen, dass wir eine mögliche Verzer-
rung der Atomorbitale bei der Annäherung der beiden Wasserstoffatome berücksichtigen.
Dies können wir dadurch erreichen, indem wir für das Molekülorbital die Linearkombina-
tion
N
Ψ = ∑ ci ϕi (3.4.37)
i=1
aus N atomaren Orbitalen ansetzen. In der Summe werden alle Orbitale berücksichtigt, die
das verformte 1s-Orbital bei der Annäherung möglichst gut wiedergeben. Als Molekülorbi-
tal für beide Elektronen kann dann entweder in der Molekülorbitalnäherung das Produkt
benutzt werden. In beiden Fällen werden die Koeffizienten so optimiert, dass die Gesamt-
energie E(R) minimal wird. Sehr gute Rechnungen mit bis zu 50 Funktionen ϕ i ergeben
E B = −4.7467 eV, was mit dem experimentellen Wert E B = −4.747 eV sehr gut überein-
exp
stimmt.
Wir können nun folgendes zur kovalenten Bindung zusammenfassen: Die kovalente Bin-
dung erfolgt durch den Austausch gemeinsamer Elektronen zwischen zwei Atomen und die
dadurch erfolgte Umordnung der Dichteverteilung der Elektronen, die zu einer Erhöhung
der Dichte der Elektronen zwischen den beiden Kernen und damit einer gerichteten elek-
trostatischen Anziehung führt. Sie spielt nur dann eine Rolle, wenn R < r A + r B , d. h. wenn
der Abstand R der Kerne klein gegenüber der Summe der Atomradien der beiden Atome
ist. Dieser Effekt schlägt sich im Valenzbindungsmodell der Chemie nieder. Ferner teilen
sich, wie oben bereits diskutiert wurde, bei der kovalenten Bindung beide Atome ein oder
mehrere Elektronen. Die im Vergleich zum Atomorbital größere räumliche Ausdehnung des
Molekülorbitals verringert die mittlere kinetische Energie der an der Bindung beteiligten
3.4 Die kovalente Bindung 129
Valenzelektronen. Dieser Effekt trägt zum Minimum in der Potenzialkurve bei, in der ja
die mittlere kinetische Energie enthalten ist. Dieser Beitrag zu Molekülbindung wird Aus-
tauschwechselwirkung genannt, weil er auf dem Austausch ununterscheidbarer Elektronen
resultiert, und ist rein quantenmechanischer Natur. Beide zur Bindung führenden Effekte
spielen für R < r A + r B , also für Abstände, bei denen sich die beiden Elektronenhüllen der
Atome überlagern, eine Rolle. Es gibt also hier gemeinsame Elektronen.
𝒚
H
H 1s
1s
funktion Φ mit den 1s-Orbitalen des H-Atoms und dadurch eine bessere Bindung resul-
46
tiert. Wir müssen jetzt noch die Wellenfunktion Φ für die größtmögliche Bindungsenergie
optimieren. Hierzu variieren wir die Koeffizienten b i in (3.4.42) so, dass die Bindungsener-
gie zwischen den H-Atomen und dem O-Atom maximal wird, also die Gesamtenergie des
Moleküls minimiert wird. Mit den so gefundenen Koeffizienten erhalten wir Hybridorbita-
le (siehe Abb. 3.17b), die nicht mehr wie die 2p x und 2p y Orbitale senkrecht aufeinander
stehen, sondern einen Winkel von 104.5○ miteinander einschließen.
0.2 𝝓 𝒔 + 𝝓𝒑
𝚽=
0.1
𝝓𝒔 𝟐
0.0
𝝓𝒑
-0.1
-0.2 z z z z
y y y y
47
3.4 Die kovalente Bindung 131
dabei größer sein als die Energie, die notwendig ist, um ein 2s-Elektron in einen 2p-Zustand
anzuheben.
sp-Hybridisierung: Wir sprechen von sp-Hybridisierung, wenn sich ein s-Orbital nur mit
einem p-Orbital mischt. Zur Analyse der sp-Hybridisierung betrachten wir die beiden Li-
nearkombinationen eines s-Orbitals mit dem noch unbesetzten p z -Orbital:
∫ ⋃︀Φ i ⋃︀ dV = 1
2
(3.4.45)
∗
∫ Φ i Φ k dV = δ i k (3.4.46)
}︂
1 ⌋︂
Φ 1,2 (ϑ) = (1 ± 3 cos ϑ) ,
sp
(3.4.50)
8π
wobei der Winkel ϑ gegen die z-Achse gemessen wird (siehe Abb. 3.19). Wir sehen, dass
⋃︀Φ 1,2 ⋃︀2 für die Winkel ϑ = 0○ und 180○ maximal werden.
sp
Durch die sp-Hybridisierung erhalten wir also zwei entgegengesetzt orientierte Bindungen,
die zu einem linearen Molekül führen. Bei einem Kohlenstoffatom sind zusätzlich zu den
beiden sp-Hybridorbitalen noch die 2p x - und 2p y -Orbitale vorhanden, so dass das Koh-
lenstoffatom insgesamt vier freie Bindungen hat. Geht das Kohlenstoffatom eine Bindung
mit zwei anderen Atomen ein (z. B. in CO2 ), so wird bei einer sp-Hybridisierung der Über-
lapp mit den Atomorbitalen für die beiden entgegengesetzten Richtungen am größten. Wir
erhalten somit ein lineares O=C=O Molekül.
sp Hybridisierung:
Normierung
132 Orthogonalität 3 Bindungskräfte
𝒛0 𝝑 𝒛0 𝝑30
0.6 330 30 0.6 330
𝐬𝐩
0.4 300 60 0.4 300
𝚽𝟐 60
0.2 0.2
0.2 0.2
Abb. 3.19: Polardarstellung der Orbitale der sp-Hybridisierung. Der Winkel ϑ wird gegen die z-Achse
gemessen. 48
sp2 -Hybridisierung: Für manche Verbindungen des Kohlenstoffatoms mit anderen Ato-
men ist es günstiger, wenn das s- und die beiden p-Elektronen eine räumliche Verteilung
haben, die durch eine Linearkombination eines s-Orbitals und zweier p-Orbitale entsteht.
Wir sprechen dann von einer sp2 -Hybridisierung, bei der wir drei Hybridorbitale aus Line-
arkombinationen der Atomorbitale ϕ(s), ϕ(p x ) und ϕ(p y ) bilden. Analog zur sp-Hybridi-
sierung erhalten wir unter Berücksichtigung der Normierungs- und Orthogonalitätsbedin-
𝑦 𝑦
90 90
0.6 120 60 0.6 120 60
𝝋 𝝋
0.4
150 𝐬𝐩𝟐 30 0.4
150 30
𝚽𝟏
0.2 0.2
Abb. 3.20: Polardarstellung der Orbitale der sp2 -Hybridisierung. Der Winkel φ wird gegen die x-Achse
gemessen.
3.4 Die kovalente Bindung 133
s p2 1 ⌋︂
Φ 1 = ⌋︂ (ϕ(s) + 2ϕ(p x )) , (3.4.51)
3
}︂
s p2 1 ⎛ 1 3 ⎞
Φ2 = ⌋︂ ϕ(s) − ⌋︂ ϕ(p x ) + ϕ(p y ) , (3.4.52)
3⎝ 2 2 ⎠
}︂
s p2 1 ⎛ 1 3 ⎞
Φ3 = ⌋︂ ϕ(s) − ⌋︂ ϕ(p x ) − ϕ(p y ) . (3.4.53)
3⎝ 2 2 ⎠
s p2 1 1 ⌋︂
Φ 1 = ⌋︂ ( ⌋︂ + 2 cos φ) ,
4π 3
}︂
s p2 1 ⎛ 1 1 3 ⎞
Φ2 = ⌋︂ ⌋︂ − ⌋︂ cos φ + sin φ , (3.4.54)
4π ⎝ 3 2 2 ⎠
}︂
s p2 1 ⎛ 1 1 3 ⎞
Φ3 = ⌋︂ ⌋︂ − ⌋︂ cos φ − sin φ
4π ⎝ 3 2 2 ⎠
gegeben, wobei der Winkel φ gegen die x-Achse gemessen wird. In Abb. 3.20 sind die Win-
kelverteilungen der drei Hybridorbitale dargestellt. Sie haben ihr Maximum für 0○ , 120○
und 240○ . Wir sehen daraus, dass die sp2 -Hybridisierung zu drei gerichteten Bindungen
führt, die in einer Ebene liegen. Das vierte Orbital (2p z ) steht senkrecht auf diesem Stern
und kann eine so genannte π-Bindung bilden. Diese Elektronen sind vollständig delokali-
siert und führen zu einer guten elektrischen Leitfähigkeit entlang der Kohlenstoffebenen.
Ein prominenter Vertreter dieses Bindungstyps ist Graphit. Die flächenhaften sp2 -Hybrid-
orbitale führen zusammen mit der π-Bindung zu einer starken Bindung der Kohlenstoff-
atome innerhalb der Ebenen (4.3 eV). Die Ebenen untereinander sind nur locker über Van-
der-Waals-Kräfte gebunden, die Bindungsenergie beträgt hier lediglich 0.07 eV. Der Abstand
der Kohlenstoffatome innerhalb der Ebenen beträgt 1.42 Å, der Abstand der Ebenen auf-
grund der wesentlich schwächeren Bindung dagegen 3.35 Å. Durch die drei keulenförmigen
Hybridorbitale, die einen 120○ -Stern bilden, entsteht eine sechseckförmige Anordnung der
Kohlenstoffatome innerhalb der Ebenen (siehe hierzu Abb. 1.27).
sp3 -Hybridisierung: Ganz analog zur sp- und sp2 -Hybridisierung lässt sich die sp3 -Hy-
bridisierung behandeln, die z. B. beim Methanmolekül CH4 vorliegt. Im Falle einer sp3 -Hy-
bridisierung mischen wir das s-Orbital mit allen 3 p-Orbitalen. Die daraus entstehenden
134 3 Bindungskräfte
(a) (b) H
H
𝟏𝒔
𝐬𝐩𝟑 109.47° 𝟏
109.47° 𝚽𝟒 𝟏𝒔
C
C 𝚽𝟑
𝐬𝐩𝟑 H H
𝐬𝐩𝟑
𝚽𝟐
𝐬𝐩𝟑 109.47°
H 𝚽𝟏
𝟏
109.47°
𝟏𝒔
H
𝟏𝒔 𝟏
Abb. 3.21: (a) Orientierung der vier sp3 -Hybridorbitale bei der Bindung im CH4 -Molekül. (b) Die aus
der sp3 -Hybridisierung resultierende Tetraederstruktur.
53
s p3 1 ⌋︂
Φ1 = (ϕ(s) + 3ϕ(p z )) ,
2
}︂ }︂
s p3 1⎛ 8 1 ⎞
Φ2 = ϕ(s) + ϕ(p x ) − ϕ(p z ) ,
2⎝ 3 3 ⎠
}︂ }︂ (3.4.55)
s p3 1⎛ 2 ⌋︂ 1 ⎞
Φ3 = ϕ(s) − ϕ(p x ) + 2ϕ(p y ) − ϕ(p z ) ,
2⎝ 3 3 ⎠
}︂ }︂
s p3 1⎛ 2 ⌋︂ 1 ⎞
Φ4 = ϕ(s) − ϕ(p x ) − 2ϕ(p y ) − ϕ(p z ) .
2⎝ 3 3 ⎠
Setzen wir in diese Ausdrücke die Winkelanteile ein, so erhalten wir für die vier sp3 -Hybrid-
orbitale Maxima, die in den Ecken eines Tetraeders liegen. Der Tetraederwinkel θ be-
trägt 109, 47○ (siehe Abb. 3.21b). Die tetraedrische kovalente Bindung ist ein besonders
wichtiger Bindungstyp, der bei vielen Elementen der 4. Hauptgruppe wie z. B. C, Si oder Ge
auftritt. Die Bindungsenergie ist trotz der geringen Zahl von nur 4 Bindungspartnern hoch.
Sie beträgt bei Diamant 7.36 eV⇑Atom, bei Si 4.64 eV⇑Atom und bei Ge 3.87 eV⇑Atom.
3.4.3.4 Kohlenstoffchemie
Die starke Neigung des Kohlenstoffs zur Hybridisierung ist ein wesentlicher Punkt der spe-
ziellen Chemie des Kohlenstoffs (organische Chemie), die ganz entscheidend für die Grund-
lagen unseres Lebens ist. Kohlenstoff kommt schon in elementarer Form in verschiedenen
Modifikationen vor.
Graphit ist eine planare, hexagonale Schichtstruktur. Die Bindung in Graphit basiert auf ei-
ner sp2 -Hybridisierung (planare Koordination), was nach unserer obigen Diskussion eine
planare Bindungsgeometrie nahelegt. Im Graphit liegen ebene Sechsecke aus trigonal pla-
nar koordinierten C-Atomen vor. Es gibt unterschiedliche Stapelfolgen, ABAB (hexagonaler
Graphit) oder ABC (rhomboedrischer Graphit) und daneben viele Polytype.16
16
Polytypie bezeichnet das Phänomen, dass eine Substanz in zwei oder mehreren verschiedenen
Kombinationen schichtartiger Struktureinheiten vorliegt. Die Strukturen von Polytypen unter-
scheiden sich nur in der Abfolge und Orientierung der einzelnen Schichten, nicht aber in deren
Aufbau und Zusammensetzung. Abweichungen in den Zusammensetzungen verschiedener Poly-
type einer Verbindung dürfen 0,25 Atome pro Formeleinheit nicht überschreiten. Bei größeren
Unterschieden spricht man von Polytypoiden. Polytype besitzen in Richtung der Stapelung der
schichtförmigen Baugruppen Gitterkonstanten, die ganzzahligen Vielfachen der Dicke der einzel-
nen Einheiten entsprechen. Die übrigen Elementarzellkanten verschiedener Polytype sind nahezu
gleich. In Gegensatz hierzu brauchen verschiedene Polymorphe einer Verbindung keine struktu-
136 3 Bindungskräfte
Diamant wird durch die sp3 -Hybridisierung gebildet. In der kubischen Diamant-Struktur
(Schichtenfolge . . . ABCABC. . . ) sind alle Kohlenstoffatome tetraedrisch von vier weiteren
C-Atomen koordiniert. Es entsteht ein Raumnetz mit Sechsringen aus C-Atomen. Neben der
kubischen Diamantstruktur gibt es noch die hexagonale Diamantstruktur (sog. Lonsdaleit),
die wir hier nicht diskutieren wollen.
Eine im Jahr 1985 entdeckte, ungewöhnliche Form des Kohlenstoff sind die so genann-
ten Fullerene.17 , 18 Der wohl bekannteste Vertreter ist C60 , bei dem 60 Kohlenstoffatome in
32 Ringen, nämlich 12 Fünfecken und 20 Sechsecken, angeordnet sind. Das C60 -Molekül
hat die Form eines Fußballs mit einem Durchmesser von nur wenigen Å. Die Bindung in
diesem Molekül basiert wie in Graphit auf einer sp2 -Hybridisierung. Wir können uns die
fußballartigen Kohlenstoffmoleküle dadurch entstanden denken, dass eine planare Kohlen-
stoffschicht zu einem Ball gebogen wird. Außer zu kugelförmigen Gebilden lassen sich auch
röhrenförmige Strukturen bilden, die man als Kohlenstoff-Nanoröhrchen (engl.: carbon na-
notubes) bezeichnet. Diese Nanoröhrchen zeigen eine sehr hohe elektrische Leitfähigkeit
und eignen sich deshalb zur Verdrahtung von Nanoschaltkreisen. Vor kurzem wurden so-
gar Transistoren auf der Basis von Kohlenstoff-Nanoröhrchen hergestellt.
0.04 Nachbarn
1. 2. 3.
𝟐𝒑𝒛
3/2
0.02
𝟑𝒅𝒛𝟐
Rn,l / (Z/aB)
0.00
𝟒𝒔
-0.02
Ni 4s²3d8
0 10 20 30 40 50 Abb. 3.22: Die Amplitude der 2p z -, 3d z 2 -
r / (aB/Z) und der 4s-Wellenfunktion von Ni.
62
ist beispielhaft in Abb. 3.22 für das 3d-Übergangsmetall Nickel gezeigt. Das Beispiel zeigt,
dass die 4s-Wellenfunktion von Ni einen sehr starken Überlapp mit den benachbarten Ato-
men hat. Die 3d-Elektronen sind dagegen viel lokalisierter. Wir können von einem Übergang
von itineranten zu lokalisierten Elektronen sprechen. Diese Tatsache ist besonders wichtig
hinsichtlich der magnetischen Eigenschaften von Festkörpern.
Die Bindungsenergie von Alkali-Metallen ist wesentlich kleiner als diejenige von Alkali-
halogenid-Kristallen. Das bedeutet, dass die Bindung durch die freien Leitungselektronen
nicht sehr stark ist. Ferner ist festzuhalten, dass der interatomare Abstand der Atome bei
den Alkali-Metallen relativ groß ist. Dies ist einsichtig, da die kinetische Energie der frei-
en Elektronen für größere Abstände kleiner wird. Da die metallische Bindung ungerichtet
ist, kristallisieren Metalle hauptsächlich in dicht gepackten Strukturen (fcc, hcp und bcc)
und nicht in wenig dichten Strukturen wie der Diamantstruktur (siehe hierzu Abb. 1.18).
Andererseits ist die Bindungsenergie von Übergangsmetallen sehr groß (hohe Schmelztem-
peraturen). Dies liegt an dem erheblichen Beitrag der d-Elektronen zur metallischen Bin-
dung. Damit sich die d-Elektronen, deren Orbitale weniger ausgedehnt sind als diejenigen
der s-Elektronen, überlappen, ist eine dicht gepackte Struktur am günstigsten. In der Tat
haben Übergangsmetalle häufig eine fcc- oder hcp-Struktur (siehe Abb. 1.18).
3.5.1 Bindungsenergie
Um eine Abschätzung der Bindungsenergie und des Atomabstandes für die metallische Bin-
dung zu machen, werden wir einem Ergebnis aus Kapitel 7 vorgreifen. Wir werden dort ler-
nen, dass im Rahmen des so genannten freien Elektronengasmodells die mittlere kinetische
ħ2
Energie eines Elektrons 35 E F beträgt, wobei E F = 2m (3π 2 n)2⇑3 eine für jedes Metall charak-
teristische Energie ist, die nur von der Elektronendichte n = N⇑V abhängt.
Um eine Abschätzung der Bindungsenergie der metallischen Bindung zu machen, nehmen
wir an, dass wir ein Gitter von positiven Punktladungen in einem See aus negativen La-
dungen vorliegen haben, wobei die Ladung eines einzelnen Elektrons gleichmäßig über eine
Kugel mit Radius r A (halber Abstand der Atomrümpfe) verschmiert sein soll. Der charakte-
ristische Radius r A wird auch als Wigner-Seitz Radius bezeichnet. Wir können dann für ein
einwertiges Metall n = ( 43 πr 3A )−1 schreiben und erhalten für die mittlere kinetische Energie
138 3 Bindungskräfte
eines Elektrons
3 3 9π 2⇑3 ħ 2 1 ħ2 aB 2
E kin = E F = ( ) 2
≃ 2.21 2
( ) . (3.5.1)
5 5 4 2m r A 2ma B r A
Hierbei haben wir den Bohrschen Radius a B = 4πє 0 ħ 2 ⇑me 2 = 0.529 Å verwendet. Wir benö-
tigen jetzt noch einen Ausdruck für die potenzielle Energie aus der elektrostatischen Wech-
selwirkung. Hierzu betrachten wir das elektrostatische Potenzial im Abstand r von einer
Punktladung +e, wobei wir berücksichtigen müssen, dass diese Punktladung durch die ho-
mogene Elektronenladung teilweise abgeschirmt wird. Wir erhalten für das Potenzial
3
e − e ( rrA )
, (3.5.2)
4πє 0 r
wobei r ≤ r A . Eine elektrische Raumladung der Dichte ρ = −e( 43 πr 3A )−1 in einer Kugelschale
der Dicke dr im Abstand r von der Punktladung +e liefert zur elektrostatischen Wechsel-
wirkungsenergie den Beitrag
3
e ]︀1 − ( rrA ) {︀
3e 2 r r4
dE pot = ρ 4πr 2 dr = − ( 3 − 6 ) dr . (3.5.3)
4πє 0 r 4πє 0 r A r A
Für die gesamte Wechselwirkungsenergie erhalten wir damit
rA
9e 2 1 9 ħ2 aB
E pot = ∫ dE pot = − =− ( ). (3.5.4)
40πє 0 r A 5 2ma B2 r A
0
Mit Hilfe von (3.5.1) und (3.5.4) erhalten wir die Gesamtenergie pro Elektron zu
ħ2 3 9π 2⇑3 a B 2 9 a B
E= ⌊︀ ( ) ( ) − ( )}︀ . (3.5.5)
2ma B2 5 4 rA 5 rA
Die in Abb. 3.23 gezeigte Gesamtenergie nimmt einen minimalen Wert für
r A,0 2 9π 2⇑3
= ( ) ≃ 2.45 bzw. r A,0 ≃ 1.3 Å (3.5.6)
aB 3 4
an. Das heißt, der Gleichgewichtsabstand zwischen zwei benachbarten Atomrümpfen ist
R 0 = 2r A,0 ≃ 2.6 Å. Dies stellt trotz des stark vereinfachenden Modells bereits eine recht gute
Näherung dar.
Bei unserer stark vereinfachten Betrachtung haben wir allerdings auch wichtige Beiträge
einfach weggelassen, die aus der Elektron-Elektron-Wechselwirkung resultieren (vergleiche
hierzu Abschnitt 8.7). Dies ist einmal die Austauschwechselwirkung, die in Analogie zur ko-
valenten Bindung durch den Überlapp der Wellenfunktionen der delokalisierten Elektronen
zustandekommt. Man erhält für sie [vergleiche (8.7.5)]
3k F e 2 ħ2 aB
EA = − = −0.916 ( ) (3.5.7)
(4π)2 є 0 2ma B2 r A
3.5 Die metallische Bindung 139
kinetische Energie
1
Gesamt-
E / (ħ /2maB)
energie
2
𝒓𝑨,𝟎
0
𝑬𝑩
2
-1
Coulomb Energie
Abb. 3.23: Beiträge der kinetischen und poten-
-2 ziellen Energie zur metallischen Bindung auf-
0 1 2 3 4 getragen gegen den auf den Bohrschen Radius
rA / aB normierten Abstand.
63
pro Elektron, wobei wir k F = (3π 2 n)1⇑3 und n = ( 43 πr 3A )−1 benutzt haben. Ferner kommt
es aufgrund des Spins der Elektronen zu Korrelationen im Elektronensystem. Der daraus
resultierende Beitrag pro Elektron kann durch den Ausdruck
12
EK = − (︀eV⌋︀ (3.5.8)
(r A ⇑a B ) + 7.8
approximiert werden. Berücksichtigen wir diese Zusatzbeiträge, so erhalten wir für einwerti-
ge Metalle einen Gleichgewichtsabstand R 0 = 2r A,0 ≃ 3.2 a B . Dieser Wert liegt um mehr als
den Faktor 2 unter den experimentell gemessenen Werten. Diese Diskrepanz liegt haupt-
sächlich daran, dass wir bei unserer einfachen Betrachtung angenommen haben, dass sich
die Elektronen gleichmäßig über den gesamten Festkörper verteilen. Tatsächlich ist es aber
so, dass sich die delokalisierten Elektronen aufgrund des Pauli-Verbots kaum im Bereich
der ionisierten Atomrümpfe aufhalten, die entgegen unserer zweiten vereinfachenden An-
nahme nicht punktförmig sind. Um dieser Tatsache Rechnung zu tragen, werden häufig so
genannte Pseudopotenziale verwendet (vergleiche hierzu 8.3.2). Dem attraktiven Coulomb-
Potenzial wird dabei empirisch ein bei kleinen Abständen wirkender abstoßender Potenzi-
alanteil hinzugefügt. Man ersetzt also jedes atomare Potenzial durch ein viel schwächeres
Potenzial, das aber für die Leitungselektronen in etwa die gleiche Streuamplitude besitzt. In
diesem Fall stimmt die mit diesem schwächeren Potenzial berechnete Bandstruktur (siehe
Kapitel 8) mit derjenigen überein, die mit dem ursprünglichen Potenzial berechnet wird.
Der Effekt des bei kleinen Abständen wirkenden abstoßenden Potenzialanteils ist eine Re-
duktion der Coulomb-Energie, was zu einem größeren Gleichgewichtsabstand führt. Die
so erhaltenen Werte stimmen mit den tatsächlich gemessenen r A,0 -Werten gut überein. Ty-
pische Bindungsenergien pro Atom liegen im Bereich weniger eV (Li: 1.63 eV, Na: 1.11 eV,
K: 0.93 eV, Fe: 4.28 eV, Co: 4.39 eV, Ni: 4.44 eV).
140 3 Bindungskräfte
∎ Wasser
Die Wasserstoffbrückenbindungen führen zur Dichteanomalie des Wassers zwischen 0
und 4 ○ C. In flüssigem Wasser existieren H2 O-Komplexe, die durch Wasserstoff-
brückenbindungen zusammengehalten werden. Im Vergleich zu Wassermolekülen ohne
Brückenbindungen nehmen diese ein größeres Volumen ein. Erhöht man die Tempera-
tur, so schmelzen die durch Brückenbindungen zusammengehaltenen Aggregate, was zu
einer Erhöhung der Dichte führt. Oberhalb von 4 ○ C findet dann die übliche thermische
Ausdehnung statt.
∎ Eis
∎ organische Verbindungen (z. B. Eiweiße, Verknüpfung der Doppelhelix in der DNS).
Wasserstoffbrücken sind verantwortlich für die speziellen Eigenschaften vieler für Le-
bewesen wichtiger Moleküle wie z. B. von (i) Proteinen (Stabilisierung von Sekundär-
strukturelementen wie Alpha-Helix und Beta-Faltblatt), (ii) der RNA (komplementäre
19
M. D. Joesten, L. Schaad, Hydrogen Bonding, Dekker (1974).
3.7 Atom- und Ionenradien 141
4Å 4Å
4Å 4Å
Abb. 3.25: Grafische Darstellung der Atomradien der chemischen Elemente auf der Basis des Peri-
odensystems.
142 3 Bindungskräfte
3.7.1 Atomradien
Wir können phänomenologisch einem Atom einen Radius zuordnen, indem wir die Git-
terkonstante einer Verbindung als Summe der Atomradien der beteiligten Atome auffassen.
Dabei müssen wir natürlich die Bindungsart (kovalent, metallisch, Van der Waals) und die
Koordinationszahl berücksichtigen. In der Praxis analysiert man die Gitterabstände einer
großen Zahl von Verbindungen und kann dann einen Satz selbstkonsistenter Atomradien
angeben. Dies ist in Abb. 3.25 dargestellt, wo die Atomradien zusammen mit den selbstkon-
sistenten Radien bei einer metallischen, einer kovalenten und einer Van der Waals Bindung
grafisch dargestellt sind.20 , 21 , 22 , 23
Beispiel: Der Abstand der Kohlenstoffatome in Diamant ist z. B. 1.54 Å, was einen Atom-
radius von 0.77 Å ergibt. In Silizium, das die gleiche Kristallstruktur hat, ist der halbe
Atomabstand 1.17 Å. Wir erwarten deshalb für SiC einen Atomabstand von 1.94 Å. Dies
stimmt mit dem experimentell bestimmten Wert von 1.89 Å gut überein. Im Allgemeinen
erlaubt uns die Benutzung von Atomradien, die Gitterkonstante von Verbindungen im
Prozentbereich vorherzusagen.
3.7.2 Ionenradien
In Abb. 3.26 sind die Radien von Ionen in ionisch gebundenen Festkörpern dargestellt. Die
meisten der dargestellten Ionen besitzen Edelgaskonfiguration. Bei einer genauen Abschät-
zung der Gitterkonstante von Ionenkristallen muss zusätzlich zu den Ionenradien immer
noch die Koordinationszahl berücksichtigt werden. Der Atomabstand ergibt sich damit zu
D N = R A + R K + ∆ N , wobei R A und R K der Ionenradius des Anions und des Kations ist
und ∆ N eine von der Koordinationszahl N abhängige Korrektur darstellt.
Beispiel: Wir betrachten BaTiO3 , das bei Raumtemperatur eine Gitterkonstante von
4.004 Å hat. Jedes Ba2+ -Ion hat zwölf O2− -Ionen als nächste Nachbarn und wir müs-
sen den Korrekturfaktor ∆ 12 = +0.19 Å berücksichtigen. Mit R A (Ba2+ ) = 1.35 Å und
R K (O2− ) = 1.405 Å⌋︂erhalten wir D N = R A + R K + ∆ N = 1.25 + 1.40 + 0.19 = 2.94 Å. Mul-
tiplizieren wir mit 2, so erhalten wir die Gitterkonstante a = 4.16 Å. Die Tatsache, dass
die gemessene Gitterkonstante etwas kleiner ist, könnte ein Hinweis darauf sein, dass die
Bindung nicht rein ionisch ist, sondern auch einen gewissen kovalenten Anteil hat.
20
L. Pauling, The Nature of the Chemical Bond, 3. Auflage, Cornell (1960).
21
R. D. Shannon, Revised effective ionic radii and systematic studies of interatomic distances in haldies
and chalcogenides, Acta Cryst. A 32, 751 (1976).
22
R. D. Shannon, C. T. Prewitt, Effective ionic radii in oxides and fluorides, Acta Cryst. B 25, 925–946
(1969).
23
W. B. Pearson, Crystal Chemistry and Physics of Metals and Alloys, Wiley Interscience (1972).
Literatur 143
Au+ Hg2+ Tl Pb Bi
0 5Å Abb. 3.26: Grafische Dar-
Ra2+ Th4+ stellung der Ionenradien der
chemischen Elemente.
Literatur
M. D. Joesten, L. Schaad, Hydrogen Bonding, Dekker (1974).
C. Kittel, Einführung in die Festkörperphysik, Oldenbourg Verlag, München (2006), An-
hang B.
K. Kopitzki, Einführung in die Festkörperphysik, Teubner Studienbücher, 3. Auflage,
B. G. Teubner, Stuttgart (1993).
H. W. Kroto, J. R. Heath, S. C. O’Brien, R. F. Curl, R. E. Smalley, C60: Buckminsterfullerene,
Nature 318, 162–163 (1985).
L. Pauling, The Nature of the Chemical Bond, 3. Auflage, Cornell (1960).
W. B. Pearson, Crystal Chemistry and Physics of Metals and Alloys, Wiley Interscience (1972).
R. D. Shannon, Revised effective ionic radii and systematic studies of interatomic distances in
haldies and chalcogenides, Acta Cryst. A 32, 751 (1976).
R. D. Shannon, C. T. Prewitt, Effective ionic radii in oxides and fluorides, Acta Cryst. B 25,
925–946 (1969).
4 Elastische Eigenschaften
von Festkörpern
Wir betrachten in diesem Kapitel
die elastischen Eigenschaften von
Festkörpern. Im vorangegange-
nen Kapitel haben wir gesehen,
dass aufgrund der verschiedenen
Bindungskräfte in Festkörpern
die Atome einen Gleichgewichts-
abstand R 0 einnehmen, für den FEM Simulation: Biegebalken mit Torsionslast
Bild: Lothar Golla
die gesamte potenzielle Energie
U(R 0 ) ein Minimum besitzt. Un-
sere Betrachtungen haben wir allerdings ohne das Einwirken einer äußeren Kraft gemacht.
Wir wollen jetzt diskutieren, wie sich der mittlere Atomabstand in Festkörpern unter Ein-
wirkung einer äußeren Kraft verhält. Es ist einsichtig, dass auf ein Atom die Rückstellkraft
∂U
F=−
∂r
wirkt, falls es aus seiner Gleichgewichtslage ausweichen will. Wollen wir also einen Festkör-
per verformen, so müssen wir diese Rückstellkraft überwinden.
Bei der in diesem Kapitel vorgenommenen Betrachtung werden wir den Festkörper als ein
Kontinuum annehmen. Das heißt, wir werden die atomare Struktur des Festkörpers völ-
lig außer Acht lassen. Diese Kontinuumsnäherung ist angebracht, wenn wir nur Vorgän-
ge auf einer Längenskala λ beschreiben, die groß gegen den mittleren Atomabstand R 0 ist.
Da R 0 ∼ 1 Å, können wir mit der Kontinuumsnäherung nur Vorgänge auf der Längenskala
λ ≳ 100 Å betrachten. Als Beispiel diskutieren wir elastische Wellen in einem Festkörper. Da
die typische Schallgeschwindigkeit von Festkörpern im Bereich v = 103 –104 m/s liegt, erhal-
ten wir für λ > 100 Å die maximale Frequenz f = v⇑λ < 1011 –1012 Hz. Falls wir also Phäno-
mene im Frequenzbereich von Schall- oder Ultraschallfrequenzen (Hz- bis MHz-Bereich)
betrachten, ist die Kontinuumsnäherung sehr gut. Die Betrachtung eines Systems mit dis-
kreter Gitterstruktur erfolgt später in Kapitel 5, wo wir elastische Schwingungen mit sehr
kleinen Wellenlängen diskutieren werden, für die die atomare Struktur des Festkörpers na-
türlich eine entscheidende Rolle spielt.
146 4 Elastische Eigenschaften
4.1 Grundlagen
Bei der Diskussion der elastischen Eigenschaften von Festkörpern unterscheidet man gene-
rell zwischen elastischen und plastischen Verformungen. Bei elastischen Verformungen han-
delt es sich um einen reversiblen Verformungsprozess, während eine plastische Verformung
einen irreversiblen Verformungsprozess darstellt. Wir werden uns hier nur mit elastischen
Verformungen befassen.
Dabei benutzen wir nur die Newtonschen Gesetze und das Hookesche Gesetz, das besagt,
dass bei einer elastischen Verformung eines Festkörpers die Dehnung e direkt proportional
zur Spannung σ ist:
σ = Ce . (4.1.1)
Hierbei ist
F Kraft
σ≡ = (4.1.2)
A Fläche
die Spannung (engl. stress) und
∆V
e≡ (4.1.3)
V
die Dehnung (engl. strain), die sich z. B. in einer relativen Längenänderung manifestiert. Die
Proportionalitätskonstante C bezeichnen wir als Dehnungsmodul oder Elastizitätsmodul.
Gleichung (4.1.1) gilt natürlich nur für den Bereich kleiner Spannungen, in dem ein linearer
Zusammenhang (Hookesches Gesetz) zwischen Spannung und Dehnung besteht. Für große
Spannungen erhalten wir ein kompliziertes nichtlineares Verhalten.
Wir werden im Folgenden sehen, dass die Spannung und Dehnung im Allgemeinen durch
symmetrische Tensoren 2. Stufe und der Elastizitätsmodul durch einen Tensor 4. Stufe be-
schrieben werden müssen. Einige der nachfolgenden Zusammenhänge sehen deshalb kom-
pliziert aus, da die Beziehungen zwischen verschiedenen Größen nicht durch Skalare, son-
dern durch Tensoren gegeben sind, was unvermeidlich zu einer Vielzahl von Indizes führt.
𝝈𝒙𝒛 𝝈𝒚𝒛
𝝈𝒛𝒙 Abb. 4.1: (a) Zerlegung
𝜟𝑭𝒏 𝝈𝒛𝒚
𝜟𝑭 𝝈𝒙𝒙 der an einem Flächenele-
𝝈𝒙𝒚 ment ∆A angreifenden Kraft
𝜟𝑭𝒕𝟐 𝝈𝒚𝒙 𝝈𝒚𝒚 in eine Normal- und zwei
𝒙
Tangentialkomponenten.
DA 𝒚 (b) Zur Definition der Span-
𝜟𝑭𝒕𝟏 nungskomponenten.
zerlegen (siehe Abb. 4.1a). Die mit der Normalkomponente verbundene Spannung ∆Fn ⇑∆A
nennen wir Normalspannung, die beiden mit den Tangentialkomponenten verbundenen
Spannungen ∆F t1 ⇑∆A und ∆F t2 ⇑∆A nennen wir Schubspannungen.
Den Spannungszustand eines kleinen, würfelförmigen Volumenelements können wir allge-
Spannungstensor
mein durch Angabe von 9 Größen beschreiben (siehe Abb. 4.1b), wobei wir für jede Seite des
Würfels drei Kraftkomponenten angeben müssen. Ist der Würfel hinreichend
6
klein, so wirkt
auf die gegenüberliegenden Seiten die gleiche Kraft. Wir können also den Spannungszustand
vollkommen durch die Elemente des Spannungstensors
⎛σ x x σ x y σ x z ⎞
⧹︂
σ = ⎜σ yx σ y y σ yz ⎟ (4.2.1)
⎝ σzx σz y σzz ⎠
charakterisieren. Hierbei sind die Komponenten definiert als (siehe hierzu Abb. 4.1b)
Kraftkomponente in i-Richtung
σi j ≡ (4.2.2)
Fläche mit Normalkomponente in j-Richtung
Die Komponenten σx x , σ y y und σzz stellen also Normalspannungen und die Komponenten
σx y , σ yx , σ yz , σz y , σx z und σzx Schubspannungen dar. Aus der Definition (4.2.2) und Abb. 4.1b
erkennen wir, dass bei den Normalspannungen die Kraft senkrecht auf der betreffenden Flä-
che steht, während bei den Schubspannungen die Kraft parallel zur Fläche gerichtet ist.
Wir wollen uns nun überlegen, ob alle 9 Komponenten des Spannungstensors unabhängig
voneinander sind. Hierzu fordern wir, dass durch die wirkenden Spannungen keine Dreh-
oder Translationsbewegung erzeugt werden soll. Daraus erhalten wir sofort folgende Bedin-
gungen (siehe hierzu Abb. 4.2):
∎ Die auf entgegengesetzte Flächen (eines Würfels) wirkenden Spannungen müssen gleich
mit umgekehrtem Vorzeichen sein (dies ist immer erfüllt, wenn wir das betrachtete Wür-
felelement klein machen). Abb. 4.2 zeigt, dass die Kräfte in x- und y-Richtung verschwin-
den.
∎ Damit kein Drehmoment auftritt, muss
σ i j = σ ji (4.2.3)
gelten.
148 4 Elastische Eigenschaften
𝒚 𝝈𝒙𝒚
𝝈𝒚𝒙
Abb. 4.2: Zur Veranschaulichung der Tatsache, dass für einen
Festkörper im statischen Gleichgewicht σ i j = σ ji gelten muss. 𝝈𝒚𝒙 𝒙
Die Summe der Kräfte in x-Richtung verschwindet für σx y =
σ yx . Ebenso ist die Summe der Kräfte in y-Richtung null. Das
Gesamtdrehmoment verschwindet ebenfalls für σx y = σ yx . 𝝈𝒙𝒚
∎ Zug bzw. Druck tritt auf, wenn die Schubspannungen verschwinden und die Kraft gleich-
mäßig am Körper angreift. Der Körper reagiert mit Dehnung und Querdehnung (siehe
Abb. 4.3a und b). Liegt isotroper Druck (hydrostatischer Druck) vor, so wirkt der gleiche
Druck auf alle Seiten des Körpers und der Körper reagiert mit einer Volumenänderung
(siehe Abb. 4.3c).
ℓ 𝑭 𝑭
ℓ
𝑭
𝒅 𝑭
𝚫𝒅/𝟐 𝜟𝒅/𝟐
𝑭
𝜶
𝑭
Abb. 4.3: Zur Veranschaulichung einer Dehnung (a), einer Querdehnung (b), einer allseitigen Kom-
8
pression (c), einer Biegung (d), einer Scherung (e) und einer Torsion (f).
4.2 Spannung und Dehnung 149
∎ Bei einer Biegung verschwinden die Schubspannungen, der Zug oder Druck greift
allerdings nicht gleichmäßig an und bewirkt eine ungleichmäßige Verformung (sie-
he Abb. 4.3d). An einigen Stellen des Körpers resultiert eine Zug-, an anderen eine
Druckbelastung.
∎ Eine Scherung tritt auf, wenn nur Schubspannungen wirken, die Kräfte also parallel zur
Oberfläche des Körpers angreifen. Der Körper reagiert mit einer Verformung, die als
Scherung bezeichnet wird. Hierbei ändern sich die Winkel zwischen den Kanten des
Körpers (siehe Abb. 4.3e).
∎ Bei einer Torsion treten wie bei einer Scherung nur Schubspannungen auf, die aber an
verschiedenen Stellen in verschiedene Richtungen zeigen und dadurch ein Drehmoment
erzeugen. Dies führt zu einer Verdrehung der Körperachsen (siehe Abb. 4.3f).
Alle in der Praxis vorkommenden Belastungsfälle lassen sich aus diesen elementaren Fällen
zusammensetzen.
y′ = є yx ⧹︂ y + є yz⧹︂
x + (1 + є y y )⧹︂ z (4.2.5)
z′ = є zx ⧹︂
x + є z y⧹︂
y + (1 + є zz )⧹︂
z. (4.2.6)
Die Koeffizienten є i j beschreiben dabei die Deformation, sie sind dimensionslos und haben
Werte ≪ 1, da wir nur kleine Deformationen im Hookeschen Bereich betrachten wollen. Die
Länge der neuen Achsen x′ , y′ , z′ ist nicht eins, wie wir sofort aus
x′ ⋅ x′ = 1 +eines
Deformation + є 2 + є 2Koordinatensystems
2є orthogonalen
xx + є2
xx xy xz (4.2.7)
𝑧Ƹ 𝑧′
Deformation
𝟗𝟎° 𝟗𝟎°
Abb. 4.4: Koordinatenachsen zur Be-
schreibung des Dehnungszustandes:
𝑥ො
𝟗𝟎°
𝑦ො 𝑥′ 𝑦′ die orthogonalen Achsen in (a) wer-
den im gedehnten Zustand (b) ver-
(a) (b) formt.
1
Bei einer gleichmäßigen Deformation wird jede Einheitszelle des Festkörpers in gleicher Weise
deformiert.
𝜖𝑖𝑗 ≪ 1 beschreiben Deformation
9
150 4 Elastische Eigenschaften
R(r) = u(r)⧹︂
x + v(r)⧹︂
y + w(r)⧹︂
z. (4.2.11)
Falls die Deformation ungleichmäßig sein sollte, müssen wir u, v und w in Bezug zu den
lokalen Dehnungen setzen. Entwickeln wir den Ausdruck für R in eine Taylor-Reihe um
r = 0 unter Benutzung von R(0) = 0, so erhalten wir in erster Näherung
∂u ∂u ∂u ∂v ∂v ∂v
R ≃ (x +y + z )⧹︂
x + (x +y + z )⧹︂
y
∂x ∂y ∂z ∂x ∂y ∂z
∂w ∂w ∂w
+ (x +y +z )⧹︂
z. (4.2.12)
∂x ∂y ∂z
Durch Vergleich von (4.2.10) mit (4.2.12) erhalten wir die Beziehungen
∂u ∂u ∂u
xє x x ≃ x yє yx ≃ y zє zx ≃ z usw . (4.2.13)
∂x ∂y ∂z
Es ist allgemein üblich, mit den Dehnungskoeffizienten e α β anstatt mit den Koeffizienten є α β
zu arbeiten. Die Dehnungskoeffizienten e x x , e y y und e zz sind durch folgende Beziehungen
mit den Koeffizienten є x x , є y y und є zz verknüpft:
1 1 ∂u
e x x ≡ x′ ⋅ x′ − = є x x =
2 2 ∂x
1 1 ∂v
e y y ≡ y′ ⋅ y′ − = є y y =
2 2 ∂y
1 1 ∂w
e zz ≡ z′ ⋅ z′ − = є zz = . (4.2.14)
2 2 ∂z
2
⌋︂
Wir benutzen 1 + x ≃ 1 + 12 x.
4.3 Der Elastizitätstensor 151
Die weiteren Dehnungskoeffizienten werden durch die Änderungen der Winkel zwischen
den Achsen definiert. Mit (4.2.4) bis (4.2.6) erhalten wir
1 1 1 ∂u ∂v
e x y ≡ x′ ⋅ y′ = (є yx + є x y ) = ( + )
2 2 2 ∂y ∂x
1 1 1 ∂v ∂w
e yz ≡ y′ ⋅ z′ = (є z y + є yz ) = ( + )
2 2 2 ∂z ∂y
1 1 1 ∂u ∂w
e zx ≡ z′ ⋅ x′ = (є zx + є x z ) = ( + ). (4.2.15)
2 2 2 ∂z ∂x
Die Ausdrücke (4.2.14) und (4.2.15) zeigen, dass die dimensionslosen Dehnungskoeffizien-
ten durch die partiellen Ableitungen der Komponenten des Verschiebungsvektors R nach
den Koordinaten x, y, z gegeben sind. Sie bestimmen die Dehnung vollständig. Aus Sym-
metriegründen gilt e k l = e l k , d. h. der durch die Dehnungskoeffizienten gebildete Tensor 2.
Stufe ist ein symmetrischer Tensor:
⎛e x x e x y e x z ⎞
⧹︂
e = ⎜ e yx e y y e yz ⎟ (4.2.16)
⎝ e zx e z y e zz ⎠
σ i j = ∑ C i jk l e k l . (4.3.1)
kl
e i j = ∑ S i jk l σ k l (4.3.2)
kl
definiert.
Aufgrund der oben diskutierten Symmetriebeziehungen können wir eine verkürzte Notati-
on, die so genannte Voigt-Notation
xx → 1 , yy → 2 , zz → 3 ,
(4.3.3)
yz = z y → 4 , xz = zx → 5 , x y = yx → 6
verwenden. Berechnen wir mit Hilfe von (4.3.1) und den genannten Symmetrieüberlegun-
gen die Komponente σx x in Tensor-Notation
σx x = C x x x x e x x + C x x x y e x y + C x x x z e x z
+ C x x yx e yx + C x x y y e y y + C x x yz e yz
+ C x x zx e zx + C x x z y e z y + C x x zz e zz (4.3.4)
= C x x x x e x x + C x x y y e y y + C x x zz e zz
+ 2C x x yz e yz + 2C x x x z e x z + 2C x x x y e x y
und in Matrix-Notation
σ1 = C 11 e 1 + C 12 e 2 + C 13 e 3 + 2 C 14 e 4 + 2C 15 e 5 + 2C 16 e 6 , (4.3.5)
so erkennen wir, dass durch zusätzliches Einführen von Faktoren beim Übergang der Tensor-
in die Matrix-Notation des Dehungstensors
⎛e x x e x y e x z ⎞ ⎛ e1 2 e6 2 e5 ⎞
1 1
⎜ e yx e y y e yz ⎟ → ⎜ 2 e 6 e 2 12 e 4 ⎟
1
(4.3.6)
⎝ e zx e z y e zz ⎠ ⎝ 1 e5 1 e4 e3 ⎠
2 2
3
Der zusätzliche Faktor bei den Komponenten e 4 , e 5 und e 6 sorgt dafür, dass beim Übergang der
Tensor- in die Matrix-Notation die elastische Energiedichte erhalten bleibt. Wir sehen leicht, dass
das Skalarprodukt aus Spannung und Dehnung, σ ⋅ e, in der Voigtschen Matrix-Notation gleich
dem inneren Tensorprodukt, ⧹︂ e, in der Tensorschreibweise ist. Dieses Produkt entspricht gerade
σ ∶ ⧹︂
dem Doppelten der elastischen Energiedichte (siehe unten). Die Voigt-Notation hat den Vorteil,
dass sie (i) deutlich kompakter als die vollständige Tensornotation ist, (ii) die elastische Energie-
dichte und die elastischen Moduln erhält und (iii) dass sich die Voigtsche Steifigkeitsmatrix leicht
invertieren lässt. Nachteile sind, dass Spannung und Dehnung unterschiedlich behandelt werden
und die Normen der drei Tensoren nicht erhalten bleiben.
4.3 Der Elastizitätstensor 153
Für die 6 unabhängigen Komponenten des Spannungstensors erhalten wir dann folgende
6 Gleichungen mit 36 Koeffizienten
σ1 = C 11 e 1 + C 12 e 2 + C 13 e 3 + C 14 e 4 + C 15 e 5 + C 16 e 6
σ2 = C 21 e 1 + C 22 e 2 + C 23 e 3 + C 24 e 4 + C 25 e 5 + C 26 e 6
σ3 = C 31 e 1 + C 32 e 2 + C 33 e 3 + C 34 e 4 + C 35 e 5 + C 36 e 6
(4.3.8)
σ4 = C 41 e 1 + C 42 e 2 + C 43 e 3 + C 44 e 4 + C 45 e 5 + C 46 e 6
σ5 = C 51 e 1 + C 52 e 2 + C 53 e 3 + C 54 e 4 + C 55 e 5 + C 56 e 6
σ6 = C 61 e 1 + C 62 e 2 + C 63 e 3 + C 64 e 4 + C 65 e 5 + C 66 e 6 .
1 6 6 ̃mn e n .
U= ∑ ∑ em C (4.3.9)
2 m=1 n=1
Hierbei sind die Indizes 1 bis 6 durch die Voigt-Notation (4.3.3) definiert.
Wir müssen nun den Zusammenhang zwischen den Koeffizienten C ̃mn und C mn klären. Die
Spannungskoeffizienten sind durch die Ableitung von U nach dem zugehörigen Dehnungs-
koeffizienten gegeben:
∂U ̃ 1 6 ̃ ̃
σ1 = = C 11 e 1 + ∑ (C 1n + C n1 )e n
∂e 1 2 n=2
∂U ̃ 1 6 ̃2n + C
̃n2 )e n (4.3.10)
σ2 = = C 22 e 2 + ∑ (C
∂e 2 2 n=1,n≠2
usw .
Wir sehen, dass in den Zusammenhang zwischen Spannung und Dehnung jeweils nur die
Kombinationen 12 (C̃mn + C
̃nm ) eingehen. Daraus können wir ablesen, dass die Elastizitäts-
moduln symmetrisch sind:
̃mn + C
C mn = 12 (C ̃nm ) = C nm . (4.3.11)
Von den 36 Koeffizienten des Elastizitätstensors bleiben also nur noch 21 übrig.
Für kubische Kristalle haben wir nur drei unabhängige Komponenten des Elastizitätsmo-
duls. Es sind dies
C 11 = C x x x x = C 22 = C y y y y = C 33 = C zzzz
C 12 = C x x y y = C 23 = C y yzz = C 31 = C zzx x (4.3.15)
C 44 = C yz yz = C 55 = C zx zx = C 66 = C x yx y .
Alle anderen Koeffizienten sind null und wir erhalten
⎛C 11 C 12 C 12 0 0 0 ⎞
⎜C 12 C 11 C 12 0 0 0 ⎟
⎜ ⎟
⎜ 0 ⎟
⧹︂ = ⎜C 12 C 12 C 11 0 0 ⎟.
C ⎜ 0 0 ⎟
(4.3.16)
⎜ 0 0 C 44 0 ⎟
⎜ 0 0 ⎟
⎜ 0 0 0 C 44 ⎟
⎝ 0 0 0 0 0 C 44 ⎠
4.3 Der Elastizitätstensor 155
ex x ex y + . . . e yz e x z + . . . e x x e yz + . . . (4.3.18)
auf. Wir wissen, dass wir für einen kubischen Kristall insgesamt 4 dreizählige Rotationsach-
sen haben, deren Richtungen in [111] und die dazu äquivalenten Richtungen zeigen. Drehen
wir einen Würfel, dessen Kanten entlang der x-, y- und z-Achse ausgerichtet sind, um 2π⇑3
um diese vier Rotationsachsen, so tauschen wir die x-, y- und z-Achsen gemäß folgenden
vier Schemata gegeneinander aus:
x→y→z→x − x → z → −y → −x
(4.3.19)
x → z → −y → x − x → y → z → −x .
Gemäß dem ersten Schema erhalten wir zum Beispiel für die Terme in (4.3.17)
e x2 x + e 2y y + e zz
2
→ e 2y y + e zz
2
+ e x2 x
e 2yz + e x2 z + e x2 y → e zx
2
+ e 2yx + e 2yz (4.3.20)
e y y e zz + e zz e x x + e x x e y y → e zz e x x + e x x e y y + e y y e zz .
Wir sehen sofort, dass (4.3.17) invariant unter der betrachteten Operation ist. Wir sehen
ferner, dass für die Terme aus (4.3.18) dagegen wir immer eine Transformation aus dem
Satz (4.3.19) finden können, die das Vorzeichen eines Terms ändert, da z. B. e x y = −e x(−y) .
Das heißt, die Terme in (4.3.18) sind nicht invariant unter der für die kubische Symmetrie
notwendigen Operation. Diese Terme dürfen also in der Tat im Ausdruck für die elastische
Energiedichte nicht auftauchen.
Wir müssen jetzt noch zeigen, dass die Zahlenfaktoren in (4.3.17) richtig sind. Ge-
mäß (4.3.10) und (4.3.17) erhalten wir
∂U
= σ1 = C 11 e 1 + C 12 (e 2 + e 3 )
∂e 1
∂U (4.3.21)
= σ2 = C 11 e 2 + C 12 (e 1 + e 3 )
∂e 2
... .
156 4 Elastische Eigenschaften
1 1 ZN N λ αq 2
B= = ( 2 e−R 0 ⇑ρ − ) (4.3.28)
κ 18R 0 ρ 2πє 0 R 03
gegeben. Mit α = 1.7476, R 0 = 2.82 Å, λ = 1.74 × 10−16 J und ρ = 0.322 Å (vergleiche Tabel-
le 3.6) erhalten wir für NaCl den Kompressionsmodul B ≃ 2.7 × 1010 N/m2 . In der Praxis
geht man natürlich umgekehrt vor. Man bestimmt aus den gemessenen Werten für R 0 und
B die Parameter λ und ρ der Potenzialkurve der ionischen Bindung.
4
ZnS
3 Zn0.5Mn0.5Se
Energielücke (eV)
AlP ZnSe CdS Cd0.5Mn0.5Se
AlAs ZnTe
2 GaP
CdSe
GaAs AlSb CdTe
InP
Si
1
Ge GaSb
InAs InSb
Abb. 4.5: Energielücken und Gitter-
0 HgTe
konstanten von einigen Halbleiter- HgS HgSe
materialien. Familien mit ähnlichem
5.4 5.6 5.8 6.0 6.2 6.4 6.6
Gitterparametern sind mit gleich-
farbigen Symbolen eingezeichnet. Gitterkonstante (Å)
wachsen. Wählt man gezielt zwei Kupratsupraleiter mit relativ großem Unterschied der Git-
terkonstanten, so kann man kontrolliert den Effekt von biaxialen Verspannungseffekten z. B.
auf die kritische Temperatur studieren.5 , 6 , 7
Wir wollen im Folgenden den einfachen Fall betrachten, dass wir einen epitaktischen Film
eines kubischen Materials auf einem sehr dicken Substrat aufwachsen. Das Filmmaterial soll
die Gitterkonstante a f und das Substrat den Gitterparameter a s besitzen. Man führt nun
üblicherweise die so genannte Gitterfehlanpassung
a f − as
f ≡ (4.4.1)
as
an der Grenzfläche ein. Durch diese Definition ist gewährleistet, dass für einen Film, der an
der Grenzfläche die Gitterkonstante a s des Substrates vollständig übernimmt, die Dehnung e
gerade durch die Gitterfehlanpassung f gegeben ist. Wird ein Teil der Gitterfehlanpassung
durch Versetzungen kompensiert, so ist
f ≡ e+γ, (4.4.2)
biaxialen Dehnung (bzw. Kompression) des Films und E γ die Energie der Versetzungen.8 Um
die Diskussion sehr einfach zu halten, nehmen wir an, dass der Film aus einem kubischen
Material besteht, sich die Dehnung im Hookeschen Bereich bewegt und eine der kubischen
Achsen senkrecht zur Substratoberfläche steht. Zusätzlich nehmen wir an, dass sich nur Stu-
fenversetzungen (vergleiche hierzu Abschnitt 1.4.1) ausbilden, die in einem quadratischen
Gitter angeordnet sind und deren Burgers-Vektoren parallel zur Grenzfläche liegen. Durch
die biaxiale Dehnung/Kompression des Films ändert sich die Gitterkonstante des Films par-
allel zur Grenzfläche um e = ∆a f ⇑a f . Ist die Dicke des Films durch d gegeben und der Film
in seiner gesamten Dicke homogen gedehnt/komprimiert, so ist die mit der elastischen Ver-
formung des Films verbundene Energie pro Flächeneinheit durch9
U e = Be 2 d (4.4.3)
Natürlich ist der größtmögliche Wert von e ∗ gerade die Gitterfehlanpassung f . Falls
der durch (4.4.7) vorhergesagte Wert größer oder gleich f ist, so wird der Film biaxi-
al gedehnt/komprimiert aufwachsen, um sich optimal der Gitterkonstante des Substrats
anzupassen. Ist dagegen e ∗ < f , so wird die Fehlanpassung teilweise durch Versetzungen
kompensiert werden, wobei dann e ∗ = f − γ. Die Dicke d c , bei der es gerade günstiger
wird, Versetzungen zu bilden, wird als kritische Schichtdicke bezeichnet. Setzen wir e ∗ = f
in (4.4.7) ein, so erhalten wir
D
dc = (︀ln(d c ⇑b) + 1⌋︀ . (4.4.8)
2B f
Wir sehen, dass die kritische Schichtdicke groß wird, falls die Gitterfehlanpassung klein
ist und außerdem der Kompressionsmodul des Filmmaterials klein ist, also der Film sich
leicht komprimieren oder dehnen lässt. Ferner ist d c groß, falls der Schermodul groß ist,
da es dann viel Energie kostet, Versetzungen zu bilden. Die durch (4.4.8) vorhergesagte kri-
tische Schichtdicke stimmt größenordnungsmäßig gut mit experimentellen Werten über-
ein.11 , 12 , 13 , 14
∆ℓ
σ=E . (4.5.1)
ℓ
Der Elastizitätsmodul ist für das isotrope Medium jetzt kein Tensor mehr, sondern ein
Skalar.
11
J. H. Van der Merve, in Single Crystal Films, M. H. Francombe, H. Sato eds., Pergamon Press, Oxford
(1964).
12
J. H. Van der Merve, Structure of epitaxial crystal interfaces, Surface Sci. 31, 198–228 (1972).
13
J. H. Van der Merve, Misfit dislocation energy in epitaxial overgrowths of finite thickness, Surface
Sci. 32, 1–15 (1972).
14
C. A. B. Ball, J. H. Van der Merve, On Bonding and Structure of Epitaxial Bicrystals I. Semi-Infinite
Crystals, Phys. Sta. Sol. 38, 335–344 (1970).
4.5 Technische Größen 161
1 −∆d⇑d
ν= = . (4.5.2)
µ ∆ℓ⇑ℓ
Eine Spannung σ resultiert nicht nur in einer Längenänderung ∆ℓ in Richtung der Span-
nung, sondern auch in einer Kontraktion −∆d quer zur wirkenden Spannung.
3. Kompressionsmodul B:
Der Kompressionsmodul B gibt den Zusammenhang zwischen Volumenänderung und
einer gleichmäßig auf den Körper wirkenden Spannung, die z. B. durch hydrostatischen
Druck realisiert werden kann, an:
∆V
p = −σ = −B . (4.5.3)
V
4. Schub-, Scher- oder Gleitmodul G:
Der Schub-, Scher- oder Gleitmodul G gibt den Zusammenhang zwischen einer auf einen
Körper wirkenden Schubspannung und dem daraus resultierenden Scherwinkel α an:
σ = Gα . (4.5.4)
Tatsächlich sind nur zwei dieser vier Größen unabhängig voneinander. Dies lässt sich für die
Volumenänderung aufgrund von gleichmäßigem Druck leicht zeigen: Betrachten wir einen
Quader mit Länge ℓ und Stirnfläche d 2 , so bewirkt die senkrecht zu den Stirnflächen wirken-
de Spannung −σ = p die relative Längenänderung ∆ℓ = − E . Infolge der endlichen Querdeh-
p
ℓ
nung erhalten wir allerdings auch eine Änderung der beiden Querdimensionen und zwar
= −ν ∆ℓ = ν E . Wir können das so auffassen, dass der Anteil νp der auf die Stirnfläche
p
um ∆dd ℓ
wirkenden Spannung nicht mehr vollkommen für die Längenänderung zur Verfügung steht,
da er für die Änderung der beiden Querrichtungen verbraucht wird. Insgesamt steht dann
für die Längenänderung nur noch die Spannung p − 2νp zur Verfügung und wir erhalten
∆ℓ p(1 − 2ν)
=− . (4.5.5)
ℓ E
Das gleiche gilt für die Querdimension. Die auf die beiden Seitenflächen des Quaders wir-
kende Spannung −σ = p bewirkt die relative Breitenänderung ∆d = − E . Aus der Querdeh-
p
d
= −2µ ∆d = 2µ E .
p
nung resultiert auch eine Änderung der Längsdimension und zwar um ∆ℓ ℓ d
Insgesamt steht dann für die Längenänderung nur noch die Spannung p − 2µp zur Verfü-
gung und wir erhalten
∆d p(1 − 2µ)
=− . (4.5.6)
d E
Wir betrachten nun den Fall, dass eine Spannung nur auf die Stirnfläche des Quaders wirkt
und überlegen uns, ob sich dadurch das Gesamtvolumen ändert. Da sich der Quader in
Längsrichtung verkürzt und gleichzeitig in Querrichtung ausdehnt, ist nicht direkt einsich-
tig, ob das Volumen zu- oder abnimmt. Für die Volumenänderung gilt ∆V = V − V ′ = (︀(ℓ +
162 4 Elastische Eigenschaften
∆ℓ)(d + ∆d)2 ⌋︀ − ℓd 2 ≃ 2ℓd∆d + d 2 ∆ℓ. Da ∆ℓ⇑ℓ ≪ 1 und ∆d⇑d ≪ 1, haben wir hier Terme
in 2. Ordnung vernachlässigt. Teilen wir durch V = ℓd 2 , so erhalten wir die relative Volu-
menänderung
∆V ∆ℓ 2∆d
= + (4.5.7)
V ℓ d
und mit ∆d
d
= −ν ∆ℓ
ℓ
damit
∆V ∆ℓ p
= (1 − 2ν) = − (1 − 2ν) . (4.5.8)
V ℓ E
Wir sehen, dass für eine Poisson-Zahl ν = 0.5 das Volumen gerade konstant bleibt.
Für den Fall, dass von allen Seiten die gleiche Druckkraft wirkt (allseitige Kompression),
müssen wir im Vergleich zu (4.5.8) einen Faktor 3 berücksichtigen, da jetzt ja drei Normal-
spannungen wirken. Wir erhalten dann
∆V 3p
= − (1 − 2ν) . (4.5.9)
V E
Durch Vergleich mit (4.5.3) sehen wir ferner sofort, dass
1 3
= (1 − 2ν) . (4.5.10)
B E
In gleicher Weise kann gezeigt werden, dass15
E
G= . (4.5.11)
2(1 + ν)
In Tabelle 4.2 sind einige Zahlenwerte zu den elastischen Konstanten von polykristallinen
Materialien zusammengestellt.
Tabelle 4.2: Elas- Material E (1010 N/m2 ) G (1010 N/m2 ) B (1010 N/m2 ) ν
tische Konstanten
Al (rein, weich) 7.2 2.7 7.5 0.34
von polykristalli-
nen Materialien. Al (hart) 7.7 2.7 7.5 0.34
α-Eisen 21.8 8.4 17.2 0.28
Edelstahl 19.5 8.0 17.0 0.28
Federstahl (CrV) 21.2 8.0 17.0 0.28
Gold 8.1 2.8 18.0 0.42
Kupfer, weich 12.0 4.0 14.0 0.35
Blei 1.7 0.6 4.4 0.44
Silizium 10.0 3.4 32.0 0.45
Quarzglas 7.6 3.3 3.8 0.17
Marmor 7.3 2.8 6.2 0.30
15
W. Weizel, Lehrbuch der Theoretischen Physik, Bd. 1, Springer Verlag, Berlin (1969).
4.6 Elastische Wellen 163
(C 11 − C 12 )(C 11 + 2C 12 )
E= (4.5.12)
C 11 + C 12
C 12
µ= (4.5.13)
C 11 + C 12
G = C 44 (4.5.14)
B = 13 (C 11 + 2C 12 ) . (4.5.15)
Im Gegensatz zu isotropen Festkörpern gilt Gleichung (4.5.11) für einen kubischen Kristall
nicht, d. h. G ist eine von E und ν unabhängige Materialkonstante. Kubische Kristalle sind
also keineswegs elastisch isotrop.
C eff
ü = − u. (4.6.1)
ρ̃
Wir erwarten deshalb für ein elastisches Medium in ähnlicher Weise, dass es bei entspre-
chender Anregung Schwingungen mit einer charakteristischen Frequenz
}︂
C eff
ω= (4.6.2)
ρ̃
ausführt. Die Einheit der Kraftkonstante pro Längeneinkeit, C eff , ist Kraft/Fläche und ent-
spricht daher der Einheit des Elastizitätsmoduls. Wir haben hier einen effektiven Elastizi-
tätsmodul verwendet, der von der Richtung der Schwingung relativ zu den Kristallachsen
abhängt.
164 4 Elastische Eigenschaften
∂ 2 s x ∂σx x
ρ = . (4.6.4)
∂t 2 ∂x
Verwenden wir ferner die Beziehung σx x = C 11 e x x = C 11 (∂s x ⇑∂x), so ergibt sich die einfache
Wellengleichung
∂2 s x ∂2 s x
ρ = C 11 . (4.6.5)
∂t 2 ∂x 2
Betrachten wir dagegen ein anisotropes Medium, so müssen wir neben der Spannungskom-
ponente σx x auch alle anderen auf das Volumenelement wirkenden Spannungskomponenten
berücksichtigen. Wir erhalten dann (i, j, k, l = x, y, z)
∂2 s i ∂σ i j ∂2 s l
ρ = ∑ = ∑ C i jk l . (4.6.6)
∂t 2 j ∂j jk l ∂ j∂k
Dieses gekoppelte Differentialgleichungssystem ist relativ komplex, kann aber für Kristalle
mit hoher Symmetrie wesentlich vereinfacht werden. Wir werden im Folgenden den Fall
kubischer Kristalle näher betrachten.
𝝈𝒙𝒙 𝒙 𝝈𝒙𝒙 𝒙 + 𝜟𝒙
𝜟𝒛
𝒚
25
4.6 Elastische Wellen 165
Wir können nun (4.3.8) und den Elastizitätsmodul für ein kubisches Material benutzen und
erhalten damit
∂2 u ∂e x x ∂e y y ∂e zz ∂e x y ∂e x z
ρ = C 11 + C 12 ( + ) + 2C 44 ( + ). (4.6.8)
∂t 2 ∂x ∂x ∂x ∂y ∂z
Hierbei haben wir angenommen, dass die Richtungen x, y, z parallel zu den Würfelkanten
sind. Benutzen wir weiter die durch (4.2.14) und (4.2.15) gegebenen Zusammenhänge zwi-
schen den Dehnungskoeffizienten e k l und den Ableitungen der Auslenkungen, so erhalten
wir
∂2 u ∂2 u ∂2 u ∂2 u ∂2 v ∂2 w
ρ = C 11 + C 44 ( + ) + (C 12 + C 44 ) ( + ). (4.6.9)
∂t 2 ∂x 2 ∂y 2 ∂z 2 ∂x∂y ∂x∂z
Hierbei sind u, v, w die Komponenten des Verschiebungsvektors R, der durch (4.2.11) defi-
niert ist.
Die entsprechenden Ausdrücke für ∂ 2 v⇑∂t 2 und ∂ 2 w⇑∂t 2 erhalten wir durch zyklisches Ver-
tauschen der Indizes. Sie lauten:
∂2 v ∂2 v ∂2 v ∂2 v ∂2 u ∂2 w
ρ 2
= C 11 2 + C 44 ( 2 + 2 ) + (C 12 + C 44 ) ( + ), (4.6.10)
∂t ∂y ∂x ∂z ∂x∂y ∂y∂z
∂2 w ∂2 w ∂2 w ∂2 w ∂2 u ∂2 v
ρ = C 11 + C 44 ( + ) + (C 12 + C 44 ) ( + ). (4.6.11)
∂t 2 ∂z 2 ∂x 2 ∂y 2 ∂x∂z ∂y∂z
entlang der [100]-Richtung eines kubischen Kristalls, die mit der x-Achse zusammenfallen
soll. Sowohl der Wellenvektor k als auch die Auslenkung u sind parallel zur x-Achse. Setzen
wir den Lösungsansatz (4.6.12) in (4.6.9) ein, so erhalten wir
}︂
C 11
ω 2 ρ = C 11 k 2 oder ω= k. (4.6.13)
ρ
166 4 Elastische Eigenschaften
Der Zusammenhang zwischen Frequenz und Wellenvektor wird allgemein als Dispersions-
relation bezeichnet. Für den Fall der longitudinalen Welle erhalten wir also eine lineare Di-
spersionsrelation. Die Geschwindigkeit ω⇑k der longitudinalen Schallwelle in x-Richtung
ist16
}︂
ω ω C 11
vlong = = λ= . (4.6.14)
k 2π ρ
Das heißt, der effektive Elastizitätsmodul für diese Kristallrichtung ist C eff = C 11 .
Transversale Wellen: Als nächstes betrachten wir eine in x-Richtung (diese soll wieder
parallel zur [100]-Richtung sein) laufende transversale oder Scherwelle. Die Auslenkung soll
in y-Richtung erfolgen:
v(x, t) = v 0 exp(︀ı(kx − ωt)⌋︀ . (4.6.15)
Setzen wir diesen Ansatz in (4.6.10) ein, so erhalten wir
}︂
C 44
ω ρ = C 44 k oder ω =
2 2
k (4.6.16)
ρ
und für die Wellengeschwindigkeit
}︂
ω ω C 44
vtrans = = λ= . (4.6.17)
k 2π ρ
Das heißt, der effektive Elastizitätsmodul für die transversale Welle in [100]-Richtung ist
jetzt C eff = C 44 . Einen äquivalenten Ausdruck erhalten wir, wenn die Auslenkung in die z-
Richtung erfolgt. Das heißt, für die Ausbreitung entlang der [100] Richtung sind die Ge-
schwindigkeiten der beiden transversalen Wellen für ein kubisches System identisch (ver-
gleiche Tabelle 4.3).
Tabelle 4.3: Effektive Elastizitätsmoduln für die Wellenausbreitung in [100], [110] und [111] Richtung
in kubischen Medien.
16
⌈︂
Im Gegensatz zu Gleichung (4.6.2) ist C⇑ρ jetzt eine Geschwindigkeit statt einer Frequenz. Dies
liegt daran, dass bei der obigen eindimensionalen Betrachtung ̃
ρ die Einheit Masse/Länge hatte,
im jetzigen Fall aber Masse/Volumen.
4.6 Elastische Wellen 167
Für kubische Kristalle gibt es gerade drei Moden für eine vorgegebene Amplitude und Rich-
tung des Wellenvektors k. Durch Messung der Schallgeschwindigkeiten der drei Moden las-
sen sich die drei Elastizitätsmoduln C 11 , C 12 und C 44 bestimmen. Im Allgemeinen sind die
Polarisationen dieser drei Moden nicht exakt parallel oder senkrecht zu k. Nur für die spe-
ziellen Ausbreitungsrichtungen in [100], [110] und [111] Richtung trifft dies zu. Deshalb ist
die Analyse der Wellenausbreitung für diese Richtungen wesentlich einfacher als für eine
beliebige Ausbreitungsrichtung.
Piezoquarz Piezoquarz
Ultraschallgeber Ultraschalldetektor
Hoch-
Oszillo-
frequenz- Probe graph
generator
Ultraschallpuls
L T1 T2
Signal
Zeit
Abb. 4.7: Ultraschallmessverfahren zur Bestimmung der Schallgeschwindigkeit. Für die longitudi-
nale (L) und die beiden transversalen Moden (T1 und T2 ) werden unterschiedliche Laufzeiten ge-
messen.
168 4 Elastische Eigenschaften
Tabelle 4.4: Komponenten C 11 , C 12 und C 44 des Elastizitätsmoduls sowie Dichte ρ von kubischen Kris-
tallen bei Raumtemperatur.
Zusätzlich zur Laufzeit der Ultraschallimpulse kann auch deren Abschwächung gemessen
werden. Aus der Ultraschallabsorption können Informationen über Streuprozesse und De-
fekte in der Probe gewonnen werden. Dies wird heute häufig für die zerstörungsfreie Werk-
stoffprüfung ausgenutzt (z. B. Prüfung der Laufräder des ICE).
Literatur
C. A. B. Ball, J. H. Van der Merve, On Bonding and Structure of Epitaxial Bicrystals I. Semi-
Infinite Crystals, Phys. Sta. Sol. 38, 335–344 (1970).
J. W. Cahn, On Spinodal Decomposition in Cubic Crystals, Acta Met. 10, 179–183 (1962).
R. Gross, A. Gupta, E. Olsson, A. Segmüller, G. Koren, Critical current density of strained
multilayer thin films of Nd1.83 Ce0.17 CuOx /YBa2 Cu3 O7−δ , Appl. Phys. Lett. 57, 203
(1990).
R. Gross, A. Gupta, E. Olsson, A. Segmüller, G. Koren, Heteroepitaxial Growth of Strained
Multilayer Thin Films of High-Temperature Superconductors, in High Temperature Super-
conductors, Material Aspects, H. C. Freyhardt, R. Flükiger, M. Peukert eds., DGM Ver-
lag, p. 65, 1990.
A. Gupta, R. Gross, E. Olsson, A. Segmüller, G. Koren, C. C. Tsuei, Heteroepitaxial growth of
strained multilayer superconducting thin films of Nd1.83 Ce0.17 CuOx /YBa2 Cu3 O7−δ Phys.
Rev. Lett. 64, 3191 (1990).
J. W. Matthews, in Epitaxial Growth, Part B, J. W. Matthews ed., Academic Press, New York
(1975).
L. D. Landau, E. M. Lifschitz, Elastizitätstheorie, Lehrbuch der theoretischen Physik, Vol. 7,
Akademie-Verlag, Berlin (1989).
J. F. Nye, Physical Properties of Crystals, Oxford University Press (1985).
Literatur 169
J. H. Van der Merve, in Single Crystal Films, M. H. Francombe, H. Sato eds., Pergamon Press,
Oxford (1964).
J. H. Van der Merve, Structure of epitaxial crystal interfaces, Surface Sci. 31, 198–228 (1972).
J. H. Van der Merve, Misfit dislocation energy in epitaxial overgrowths of finite thickness, Sur-
face Sci. 32, 1–15 (1972).
W. Weizel, Lehrbuch der Theoretischen Physik, Bd. 1, Springer Verlag, Berlin (1969).
5 Dynamik des Kristallgitters
Im vorangegangenen Kapitel haben wir die Reaktion
des Kristallgitters auf eine von außen wirkende Kraft
diskutiert. Dabei haben wir das Gitter als ein Kon-
tinuum behandelt, dessen elastische Eigenschaften
wir mit dem Elastizitätsmodul beschrieben haben.
In diesem Kapitel wollen wir unsere Betrachtung er-
weitern und die diskrete Struktur des Kristallgitters
in unsere Betrachtungen mit einbeziehen. Wir wer-
den uns mit der Bewegung der Gitteratome um ihre Ruhelage beschäftigen, wobei wir für die
3
auf die Atome bei einer Auslenkung wirkenden Kräfte einen sehr allgemeinen Ansatz wäh-
len werden. Um die Betrachtung einfach zu halten, werden wir die so genannte adiabatische
und harmonische Näherung benutzen, die wir in Abschnitt 5.1 näher erläutern werden.
Die dynamischen Eigenschaften des Kristallgitters sind von zentraler Bedeutung für eine
Vielzahl von Festkörpereigenschaften wie zum Beispiel
∎ die spezifische Wärme, die thermische Ausdehnung und die Wärmeleitfähigkeit von Iso-
latoren,
∎ die Temperaturabhängigkeit des elektrischen Widerstands von Metallen,
∎ die Supraleitfähigkeit von Metallen,
∎ die dielektrischen Eigenschaften von ionischen Kristallen und
∎ die inelastische Licht- und Neutronenstreuung.
Die in diesem Kapitel gemachten Betrachtungen sind deshalb von grundlegender Bedeu-
tung.
Nach der Diskussion der verwendeten Näherungen in Abschnitt 5.1 werden wir in Ab-
schnitt 5.2 zunächst Gitterschwingungen im Rahmen einer klassischen Betrachtung
diskutieren. Wir werden dort den Zusammenhang zwischen Frequenz und Wellenvek-
tor (Dispersionsrelation) anhand einfacher Modellsysteme ableiten. Wir werden dann in
Abschnitt 5.4 das Konzept der quantisierten Gitterschwingungen einführen und schließlich
in Abschnitt 5.5 experimentelle Methoden zur Untersuchung der Gitterdynamik vorstellen.
172 5 Gitterdynamik
5.1 Grundlegendes
Die allgemeine Beschreibung der Schwingungen eines komplizierten Systems aus vielen Ato-
men ist sehr anspruchsvoll, so dass wir zu seiner einfachen Beschreibung Näherungen ein-
führen müssen. Wir werden im Folgenden im Wesentlichen zwei wichtige Näherungen be-
nutzen, nämlich
∎ die adiabatische Näherung,1 die von Max Born2 und Julius Robert Oppenheimer3 ein-
geführt wurde, und
∎ die harmonische Näherung.
Wir wollen diese Näherungen und ihre physikalische Motivation in den folgenden Abschnit-
ten besprechen.
P2k p2 e2 Z2 e2 Ze 2
ℋ=∑ +∑ i +∑ +∑ −∑ .
k 2M i 2m i< j 4πє 0 ⋃︀r i − r j ⋃︀ k<l 4πє 0 ⋃︀R k − R l ⋃︀ i,k 4πє 0 ⋃︀r i − R k ⋃︀
(5.1.1)
1
M. Born, R. Oppenheimer, Zur Quantentheorie der Molekeln, Ann. Phys. (Leipzig) 84, 457 (1927).
2
Max Born, siehe Kasten auf Seite 173.
3
Julius Robert Oppenheimer, geboren am 22. April 1904 in New York, gestorben am 18. Februar
1967 in Princeton, New Jersey.
5.1 Grundlegendes 173
Dabei bezeichnen wir die Orte und Impulse der Elektronen durch kleine Buchstaben r und p,
die der Kerne durch große Buchstaben R und P. Um den Einfluss der verschiedenen auftre-
tenden Naturkonstanten ħ, e, m, und M überblicken zu können, gehen wir zu atomaren
Einheiten über. Wir messen alle Längen in Bohrschen Radien a B = 4πє 0 ħ 2 ⇑me 2 = 0.529 Å
und alle Energien in Einheiten der zweifachen Rydberg-Energie 2E H = me 4 ⇑(4πє 0 )2 ħ 2 =
27.2 eV (vergleiche (3.1.5) und (3.1.6)). Wir ersetzen damit r durch r⇑a B , R durch R⇑a B und
ℋ durch ℋ⇑2E H und erhalten den Hamilton-Operator in normierten Größen
1 m 1 1 Z2 Z
ℋ = − ∑ ∇2k − ∑ ∇2i + ∑ +∑ −∑ . (5.1.2)
2 k M 2 i i< j ⋃︀r i − r j ⋃︀ k<l ⋃︀R k − R l ⋃︀ i,k ⋃︀r i − R k ⋃︀
Die einzigen Parameter, die sich durch die Skalentransformation nicht eliminieren lassen
und von denen die Eigenschaften der Materie nicht-trivial abhängen, sind also die Kernla-
dungszahlen Z und die Massenverhältnisse m⇑M.
Für unsere weitere Diskussion ist entscheidend, dass die Massenverhältnisse m⇑M sehr klein
sind (zwischen 1⇑1836 und etwa 1⇑500 000). Deshalb bieten sich diese als Entwicklungs-
parameter an. Wir können den Hamilton-Operator in einen ungestörten, adiabatischen Ha-
milton-Operator
1 1 Z2 Z
ℋa = − ∑ ∇2i + ∑ +∑ −∑ (5.1.3)
2 i ⋃︀r
i< j i − r j ⋃︀ k<l ⋃︀R k − R l ⋃︀ i,k ⋃︀r i − R k ⋃︀
aufspalten, so dass
ℋ = ℋa + 𝒯 . (5.1.5)
In der kinetischen Energie der Kerne 𝒯 sind die Kernpositionen nicht mehr enthalten.4 Um
zu klären, wie sich der Einfluss der kleinen Störung 𝒯 für Systeme bemerkbar macht, die
sich in der Nähe der Gleichgewichtskonfiguration befinden, stellen wir eine einfache klas-
sische Überlegung an.5 Hierzu vergleichen wir die Beschleunigungen, die auf Elektronen
und Kerne wirken. Wegen des Reaktionsprinzips sind die Kräfte, die Elektronen und Ker-
ne aufeinander ausüben, entgegengesetzt gleich und wir können die qualitative Beziehung
M R̈ ≃ mr̈ aufstellen. Wir erkennen sofort, dass die schweren Kerne sich viel langsamer als
die leichten Elektronen bewegen. Aus dieser Einsicht ergibt sich die Idee der adiabatischen
4
Die Tatsache, dass die Kernorte in 0-ter Ordnung bezüglich der Störung 𝒯 Erhaltungsgrößen sind,
erklärt, weshalb Materie bei tiefen Temperaturen eine räumliche Struktur hat, d. h. wieso Kerne in
Festkörpern feste Relativpositionen einnehmen.
5
Um über diese klassische Betrachtung hinaus eine Aussage über die Größe der quantenmecha-
nisch bedingten Auslenkungen machen zu können, müssen wir die Quantenmechanik des har-
monischen Oszillators benutzen. Wir wissen, dass die Nullpunktsenergie ħω⇑2 sich zu gleichen
Teilen aus einem kinetischen Anteil ∝ P2 und einem potenziellen Anteil ∝ (R − R0 )2 zusam-
mensetzt und dass beide Anteile proportional zur Frequenz sind. Daraus lesen wir das folgende
5.1 Grundlegendes 175
Näherung: Wir nehmen an, dass sich die schnellen Elektronen der langsamen Bewegung
der Kerne zu jedem Zeitpunkt adiabatisch anpassen können, so dass sie (in guter Näherung)
immer in dem mit ℋa bestimmten Grundzustand bleiben. Daraus folgt eine beträchtliche
Vereinfachung der Beschreibung, weil die Bewegungen der Elektronen und der Kerne ent-
koppelt werden.6
Bei Auslenkung aus seiner Ruhelage R0 erfährt ein Kern eine rücktreibende Kraft, die in
atomaren Einheiten in harmonischer Näherung durch die klassische Bewegungsgleichung
M
m
R̈ ∝ (R − R0 ) beschrieben wird. Daher skalieren die Frequenzen ω der Kernbewegung
mit dem Massenverhältnis wie
{︂
m
ω∝ . (5.1.6)
M
Die Kernbewegung ist also um mehrere Größenordnungen langsamer als die Elektronen-
bewegung. Wir können deshalb die Energie des elektronischen Systems separat als Funkti-
on der Kernposition berechnen. Die Gesamtenergie des Systems als Funktion der Auslen-
kung ∆R aus der Ruhelage der Ionen erhalten wir dann entsprechend (5.1.5) als Summe der
potenziellen Energie des Elektronensystems U el und der kinetischen Energie der Kerne Tion
zu
P2
E tot = U el + Tion = U el + . (5.1.7)
2M
Der Nutzen der adiabatischen Näherung ist evident: Wir können die potenzielle Energie der
Elektronen für jede Konfiguration der Ionen im Verlauf ihrer Bewegung um die Ruhelage
berechnen. Sie entspricht gerade derjenigen Energie, die wir für die entsprechende statische
Anordnung der Ionen erhalten würden. Als Beispiel ist in Abb. 5.1 die Variation von U el als
Funktion des Atomabstands für die Van der Waals Wechselwirkung von zwei Atomen ge-
zeigt. Falls sich die Atome gegeneinander bewegen, können wir mit Hilfe der adiabatischen
Näherung aus der U el (R)-Kurve für jeden momentanen Abstand der Atome die potenzi-
elle Energie angeben. Wir sehen sofort, dass bei einer Abweichungen der Atome von ih-
rem Gleichgewichtsabstand R 0 auf die Atome eine Rückstellkraft proportional zu −dU el ⇑dR
wirkt.
Skalierungsverhalten für die quantenmechanischen Nullpunktsschwankungen ab:
m 1⇑4
∆R ∝ ( )
M
m −1⇑4
P∝( )
M
m 3⇑4
Ṙ ∝ ( ) .
M
Wir haben damit das Skalierungsverhalten der quantenmechanischen Nullpunktsbewegung der
Kerne in dem Entwicklungsparameter m⇑M gewonnen. Interessant ist, dass die Ortsunschärfe der
Kerne nur proportional zur vierten Wurzel aus m⇑M klein ist. Dies macht verständlich, warum die
Nullpunktsschwingungen in besonderen Fällen die Ausbildung einer räumlichen Struktur verhin-
dern können (z. B. beim Helium).
6
Die adiabatische Näherung wurde mit dem gleichen Argument auch bei der Berechnung der Ener-
gie-Abstandskurve bei der kovalenten Bindung zwischen zwei Atomen verwendet, vergleiche Ab-
schnitt 3.4.
176 5 Gitterdynamik
0.01
Uel (eV)
𝜟𝑹 = 𝑹 − 𝑹𝟎
harmonische
0.00
Näherung
Abb. 5.1: Zur adiabatischen und harmo-
nischen Näherung. Gezeigt ist die Po- 𝑹𝟎
tenzialkurve für eine Van-der-Waals- -0.01
Wechselwirkung von zwei Atomen
(durchgezogene Linie) und die harmo- 1.0 1.2 1.4 1.6 1.8
nische Näherung (gestrichelte Linie). R /
6
U el = 2 ∑
1
ϕ(rnα − rmβ ) = 2 ∑
1
ϕ(Rn − Rm + rα − r β + unα − umβ ) . (5.1.9)
n,m,α,β; n,m,α,β;
nα≠mβ nα≠mβ
Im Rahmen der harmonischen Näherung werden wir dieses Potenzial um die Ruhelage der
Atome als harmonisches Potenzial annähern. Diese Näherung ist immer dann gut, wenn wir
nur kleine Auslenkungen aus der Ruhelage betrachten. Wir wollen hier sofort anmerken,
n-te Einheitszelle
dass bei Raumtemperatur die Auslenkung u durchaus 10% der Gitterkonstanten a betragen
kann (siehe Abschnitt 2.2.7). Wir erwarten deshalb bei Raumtemperatur Abweichungen von
den mit der harmonischen Näherung erhaltenen Ergebnissen, die wir später noch diskutie-
ren werden. Effekte, die nur durch Einbeziehung von Abweichungen vom harmonischen
Potenzial erklärt werden können, bezeichnen wir als anharmonische Effekte.
Die zu (5.1.9) gehörende harmonische Näherung erhalten wir durch eine Taylor-Entwick-
lung des Potenzials um seine Ruhelage:7
U el = 2 ∑
1
ϕ(r0nα − r0mβ ) + 2 ∑
1
(unα − umβ ) ∇ϕ(r0nα − r0mβ )
n,m,α,β; n,m,α,β
nα≠mβ
2
+ 4 ∑
1
)︀(unα − umβ ) ⋅ ∇⌈︀ ϕ(r0nα − r0mβ ) + . . . . (5.1.10)
n,m,α,β
n,m,α,β
Dies muss so sein, da in diesem Ausdruck über alle Kräfte aufsummiert wird, die alle
Atome auf ein bestimmtes Atom ausüben. Diese Kraft muss für den Gleichgewichtszu-
stand rnα = r0nα gerade verschwinden. Brechen wir die Taylor-Entwicklung nach dem in
(unα − umβ ) quadratischen Term ab, erhalten wir unser harmonisches Potenzial zu
2
U elharm = U 0 + 4 ∑
1
)︀(unα − umβ ) ⋅ ∇⌈︀ ϕ (r0nα − r0mβ ) . (5.1.13)
n,m,α,β
Die Konstante U 0 ist für die weitere Diskussion ohne Bedeutung und wird weggelassen.
Die 2. Ableitungen des Potenzials an der Gleichgewichtsposition
∂ 2 U elharm
C nα i =
mβ j
(5.1.14)
∂r nα i ∂r mβ j
bezeichnen wir als Kopplungskonstanten. Sie haben die Dimensionen von Federkonstanten
und stellen eine Verallgemeinerung der Federkonstante eines harmonischen Oszillators auf
7
Es gilt f (r + a) = f (r) + a∇ f (r) + 12 (∇ ⋅ a)2 f (r) + . . .
178 5 Gitterdynamik
Gitterzelle n
𝒓𝜶
Gitterzelle m
𝒓𝜷 𝒖𝒎𝜷
(0,0)
Abb. 5.3: Zweidimensionales Gitter mit zweiatomiger Basis. Die Auslenkung des Atoms β in der Git-
terzelle m um umβ resultiert über das Federnetzwerk in einer Kraft Fnα auf das Atom α in der Git-
mβ
terzelle n. Die Größe der Kraft wird durch die Kopplungskonstanten C nα bestimmt. Zur Berechnung
der effektiven Gesamtkraft auf das Atom α in der Zelle n muss über alle Kraftkomponenten durch die
Kraft auf Atom a in Zelle n in Richtung i durch
Auslenkungen der Atome in allen anderen Gitterzellen
Auslenkung aufsummiert
von Atom b inwerden.
Zelle m in Richtung j
ein System mit vielen Freiheitsgraden dar. Die Indizes i, j = x, y, z geben hierbei die Kom-
ponenten der Vektoren in x, y und z-Richtung an. Die Größe
Fnα i = −C nα i u mβ j
mβ j
(5.1.15) 9
gibt uns die Kraft auf das Atom α in der Einheitszelle n in Richtung i an, die durch die
Auslenkung des Atoms β in der Gitterzelle m in Richtung j verursacht wird. Die Situation
ist in Abb. 5.3 veranschaulicht.
Die Kopplungskonstanten müssen eine Reihe von Bedingungen erfüllen, die aus der Isotro-
pie des Raumes sowie der Translationsinvarianz und der Punktsymmetriegruppe des Gitters
folgen. Ohne die Diskussion vertiefen zu wollen, weisen wir darauf hin, dass die Translati-
mβ j
onsinvarianz des Gitters erfordert, dass die Größe C nα i nur von der Differenz zwischen m
und n abhängt:
(m−n)β j
C nα i = C 0α i
mβ j
. (5.1.16)
null ergeben:
∂ 2 u nα i
+ ∑ C nα i u mβ j = 0 .
mβ j
Mα (5.2.1)
∂t 2 m,β, j
Haben wir in unserem Festkörper N Einheitszellen mit r ′ Atomen vorliegen, so erhalten wir
r = 3N ′ = 3r ′ N Differentialgleichungen, welche die Bewegung der Atome beschreiben. Die
Lösung dieses Differentialgleichungssystems scheint wegen der Größe von N eine unlösbare
Aufgabe darzustellen. Glücklicherweise können wir für periodische Strukturen einen Ansatz
wählen, der zu einer weitgehenden Entkopplung führt. Der Ansatz beinhaltet, dass wir die
Auslenkungen u nα i als ebene Wellen hinsichtlich der Zellkoordinaten schreiben:
1
u nα i = ⌋︂ A α i (q)e ı(q⋅R n −ωt) . (5.2.2)
Mα
Im Gegensatz zu normalen ebenen Wellen ist diese Welle nur an den Gitterpunkten Rn de-
finiert. Setzen wir den Ansatz in (5.2.1) ein, so erhalten wir
1 mβ j ıq⋅(R m −R n )
−ω 2 A α i (q) + ∑ ∑ ⌈︂ C e A β j (q) = 0 . (5.2.3)
β, j m M α M β nα i
Aufgrund der Translationsinvarianz hängen die Terme in der Summe nur von m − n ab.
Führen wir die Summation über m aus, so erhalten wir die Größe
1
D α i (q) = ∑ ⌈︂ C nα i e ıq⋅(R m −R n ) ,
βj mβ j
(5.2.4)
m Mα Mβ
die unabhängig von n ist. Dies rechtfertigt die Tatsache, dass wir in obigem Ansatz die Am-
plituden ohne den Index n geschrieben haben. Die Größen D α i (q) bilden die so genannte
βj
stellt ein lineares homogenes Gleichungssystem der Ordnung r = 3r ′ dar. Falls wir nur eine
einatomige Basis haben, ist r ′ = 1 und wir haben für jeden Wellenvektor q nur ein System
von 3 Gleichungen zu lösen. Die Vereinfachung, die wir durch die Translationsinvarianz
erhalten haben, ist also riesig.
Aus der Mathematik ist uns bekannt, dass ein homogenes, lineares Gleichungssystem nur
dann nicht-triviale Lösungen besitzt, wenn die Koeffizientendeterminante
det {D α i (q) − ω 2 1} = 0
βj
(5.2.6)
verschwindet. Diese Gleichung hat genau r = 3r ′ Lösungen ω(q) für jeden Wellenvektor q.
Die Abhängigkeit ω(q) nennen wir Dispersionsrelation. Die r unterschiedlichen Lösungen
bezeichnen wir als Zweige der Dispersionsrelation.
Wir schließen unsere allgemeine Diskussion hier ab und die bisherigen Ergebnisse dazu, die
Dispersionsrelation für einige einfache Beispiele abzuleiten.
180 5 Gitterdynamik
(a) (b)
𝒏−𝟐 𝒏−𝟏 𝒏 𝒏+𝟏 𝒏+𝟐 𝒏+𝟑 𝒏−𝟐 𝒏−𝟏 𝒏 𝒏+𝟏 𝒏+𝟐 𝒏+𝟑
Abb. 5.4: Schematische Darstellung der Auslenkung der Netzebenen bei einer longitudinalen (a) und
transversalen Gitterschwingung (b). Die gestrichelten Linien geben die Gleichgewichtslage, die Pfeile
die Auslenkung an.
8
Die Problemstellung ist zu der einer einatomigen Kette äquivalent.
10
5.2 Klassische Theorie 181
Wir betrachten zunächst die Kraft, die auf ein Atom in der Netzebene n durch die Netz-
ebene mit Index n + p ausgeübt wird. Sie ist in harmonischer Näherung proportional
zu (u n+p − u n ). Die Kraft, die insgesamt auf ein Atom der Netzebene n einwirkt beträgt
dann
Fn = ∑ C p (u n+p − u n ) . (5.2.7)
p
Hierbei haben wir die Kopplungskonstante C nm zwischen den Netzebenen n und m durch C p
mit p = m − n ersetzt (p durchläuft alle positiven und negativen ganzen Zahlen). Dies kön-
nen wir tun, da die Kopplung nur vom Abstand der Netzebenen abhängt. Setzen wir diese
Kraft der Trägheitskraft gleich, erhalten wir die Bewegungsgleichung
∂2 u n
M − ∑ C p (u n+p − u n ) = 0 . (5.2.8)
∂t 2 p
wobei q die Wellenzahl und ω die Frequenz der fortschreitenden Welle ist und a der Netz-
ebenenabstand. Setzen wir diesen Ansatz in (5.2.8) ein, so erhalten wir
−ω 2 M − ∑ C p (e ı q pa − 1) = 0 . (5.2.10)
p
2 ∞
ω2 = ∑ C p (1 − cos qpa) . (5.2.12)
M p=1
Berücksichtigen wir nur die Wechselwirkung der Gitteratome mit ihren unmittelbaren
Nachbarn, so ist nur C 1 ≠ 0 und wir erhalten
2C 1 4C 1 qa
ω2 = (1 − cos qa) = sin2 . (5.2.13)
M M 2
Die Dispersionsrelation (5.2.13) ist in Abb. 5.5 gezeigt. Die Dispersionsrelation ist erstens
periodisch, ω(q) = ω(q + n 2π⇑a) und ist zweitens invariant gegenüber dem Vorzeichen des
Wellenvektors, ω(q) = ω(−q). Hierbei entspricht die Periode n 2π⇑a gerade der Länge eines
reziproken Gittervektors G. Eine Deutung dieser Eigenschaften erfolgt weiter unten bei der
Diskussion der Bedeutung der 1. Brillouin-Zone.
182 5 Gitterdynamik
1.0 1. Brillouin-Zone
/ (4C1/M)1/2
0.8
0.6
0.4
0.2
5.2.2.2 Gruppengeschwindigkeit
Wir wollen als erstes die Ausbreitungsgeschwindigkeit der Gitterschwingungen diskutieren.
Ganz allgemein ist die Ausbreitungsgeschwindigkeit eines Wellenpakets durch die Gruppen-
geschwindigkeit
vg = ∇q ω(q) (5.2.14)
Grenzfälle: Wir wollen nun einige Grenzfälle der Dispersionsrelation (5.2.13) diskutieren:
keit v long einer longitudinalen Schallwelle in dem betreffenden Festkörper. Die Wel-
lengleichung für Schallwellen können wir ableiten, indem wir die Auslenkungen u n (t)
im langwelligen Limes durch kontinuierliche Funktionen einer reellen Variablen x
auffassen:
∂u(x, t) p2 a 2 ∂ 2 u(x, t)
u n±p (t) = u(x ± pa, t) = u(x, t) ± pa + ±...
∂x 2! ∂x 2
(5.2.18)
und durch Einsetzen in die Kraftgleichung (5.2.8) erhalten wir, wenn wir nur Wechsel-
wirkungen zwischen nächsten Nachbarn berücksichtigen, im langwelligen Grenzfall die
eindimensionale Wellengleichung
∂ 2 u(x, t) C 1 a 2 ∂ 2 u(x, t) 2
2 ∂ u(x, t)
= = v s . (5.2.19)
∂t 2 M ∂x 2 ∂x 2
Diese Gleichung entspricht der Wellengleichung (4.6.9), die wir in Abschnitt 4.6 aus ei-
ner kontinuumsmechanischen Betrachtung hergeleitet haben, wobei wir für das hier be-
trachtete eindimensionale System in (4.6.9) alle Terme weglassen können, in denen die
elastischen Konstanten C 12 und C 44 auftreten. Die Größen C 1 ⇑a und M⇑a 3 in (5.2.19)
entsprechen dem Elastizitätsmodul C 11 und der Massendichte ρ in (4.6.9).
Die Tatsache, dass ω ∝ q für qa ≪ 1, folgt unmittelbar auch aus (5.2.12), gilt also nicht
nur für die Näherung, in der wir nur nächste Nachbarwechselwirkungen berücksichti-
gen. Zwar hat dann die Proportionalitätskonstante einen anderen Wert, aber der lineare
Zusammenhang zwischen ω und q ist unabhängig davon, ob wir nur die Wechselwir-
kung zwischen unmittelbar benachbarten Netzebenen berücksichtigen oder auch den
Effekt von weiter entfernten Netzebenen mit einschließen.
Mit
⟨
ω max ⧸︂ ⟩ 4C 1 ⇑M = 2
= ⧸︂ (5.2.20)
v long C 1 a 2 ⇑M a
erhalten wir mit a ∼ 2 Å und v long ∼ 4000 m⇑s die maximale Schwingungsfrequenz zu ∼ 4 ×
1013 s−1 .
D α i (q) = D α i (q + G) ,
βj βj
(5.2.21)
da für jeden reziproken Gittervektor G die Beziehung G ⋅ Rm = 2πn gilt. Die Lösungen
von (5.2.6) müssen deshalb die Bedingung
gelten, da u(−q) eine Welle repräsentiert, die identisch zu u(q) ist, allerdings in die entge-
gengesetzte Richtung läuft. Da die vor- und zurücklaufenden Wellen durch die Zeitumkehr
miteinander verbunden sind, müssen die Eigenfrequenzen für q und −q gleich sein.
Gleichung (5.2.22) verdeutlicht, dass es völlig ausreichend ist, die Dispersionsrelation im
Bereich eines reziproken Gittervektors zu betrachten. Es ist üblich, hierfür die 1. Brillouin-
Zone zu verwenden. Für unser eindimensionales System können wir uns also auf
π π
− ≤q≤+ (5.2.24)
a a
beschränken. Aufgrund von Gleichung (5.2.23) reicht es sogar aus, die Dispersionsrelation
nur in einem Oktanten der 1. Brillouin-Zone anzugeben.
Eine anschauliche Erklärung dafür, dass es völlig ausreicht, die Dispersionsrelation in der
1. Brillouin-Zone anzugeben, ist in Abb. 5.6 gezeigt. Es ist sofort einsichtig, dass die gestri-
chelte Kurve, die zu einem Wellenvektor aus einer höheren Brillouin-Zone gehört, keine
andere Information liefert als die durchgezogene Kurve. Physikalisch ist es nämlich völlig
irrelevant, wie der Wellenverlauf zwischen den Atomen aussieht, es interessieren lediglich
die Auslenkungen der Gitteratome.
Für transversale Gitterschwingungen (siehe Abb. 5.4b) erhält man analoge Ergebnisse. In
der Dispersionsrelation (5.2.12) haben dann natürlich die Kopplungskonstanten C p andere
5.2 Klassische Theorie 185
Werte. Die Ausbildung rein longitudinal und transversal polarisierter Wellen ist nur bei einer
Ausbreitung der Welle in Richtung einer Symmetrieachse möglich. Bei einem kubischen
Kristall ist dies z. B. die [100]-, [110]- oder die [111]-Richtung. Diese Tatsache haben wir
bereits in Abschnitt 4.6 im Rahmen der Kontinuumsbeschreibung diskutiert.
𝑴𝟏 𝑴 𝟐 𝑴𝟏 𝑴𝟐 𝑴 𝟏 𝑴𝟐 𝑴𝟏 𝑴 𝟐 𝑴𝟏 𝑴𝟐
𝒖𝒏−𝟏
𝒖𝒏−𝟐
𝒗𝒏−𝟐
𝒗𝒏−𝟏
𝒖𝒏+𝟐
𝒖𝒏+𝟏
𝒗𝒏+𝟏
𝒗𝒏+𝟏
𝒖𝒏
𝒗𝒏
Abb. 5.7: Schematische Darstellung der Auslenkung der Netzebenen bei einer longitudinalen Gitter-
schwingung in einem Kristallgitter mit zweiatomiger Basis. Die gestrichelten Linien geben die Position
der unausgelenkten Netzebenen an.
9
Ein sehr ähnliches Problem erhalten wir, wenn wir annehmen, dass die Masse der beiden Atome
gleich ist, die Kopplungskonstanten zwischen den Atomen dafür aber abwechselnd zwei unter-
19
186 5 Gitterdynamik
dex m in der Summe (5.2.1) kann nur die Werte n + 1, n, n − 1 annehmen. Bezeichnen wir
die Kopplungskonstante zwischen den benachbarten Ebenen mit f , so erhalten wir folgende
Bewegungsgleichungen:
∂2 u n
M1 = f (v n − u n ) + f (v n−1 − u n ) (5.2.25)
∂t 2
∂2 v n
M2 = f (u n − v n ) + f (u n+1 − v n ) . (5.2.26)
∂t 2
Hierbei stellen die Differenzen (v n − u n ), (v n−1 − u n ), usw. die relativen Auslenkungen
von benachbarten Ebenen der beiden Atomsorten dar. Sind z. B. u n und v n gleich, so wird
(v n − u n ) = 0, da die Feder, die die beiden Ebenen verbindet, dann nicht gedehnt oder
gestaucht wird.
Damit lauten die Bewegungsgleichungen
∂2 u n
M1 + f (2u n − v n − v n−1 ) = 0 (5.2.27)
∂t 2
∂2 v n
M2 + f (2v n − u n − u n+1 ) = 0 . (5.2.28)
∂t 2
Als Lösungsansatz verwenden wir entsprechend (5.2.2)
1
u n (q) = ⌋︂ A 1 (q)e ı(qan−ωt)
M1
(5.2.29)
1
v n (q) = ⌋︂ A 2 (q)e ı(qan−ωt) .
M2
Setzen wir diesen Lösungsansatz in (5.2.27) und (5.2.28) ein, so ergibt sich
2f 1
( − ω 2 ) A 1 − f ⌋︂ (1 + e−ı qa ) A 2 = 0 (5.2.30)
M1 M1 M2
1 2f
− f ⌋︂ (1 + e+ı qa ) A 1 + ( − ω2 ) A2 = 0 . (5.2.31)
M1 M2 M2
⎛ − ⌋︂ M M (1 + e−ı qa )⎞
2f f
M1
⎜ 1 2
⎟
⎜ ⎟ (5.2.32)
+ı
⎝− ⌋︂ M 1 M 2 (1 + e ) ⎠
f qa 2f
M2
𝝎+
0.8 𝟐𝒇/𝑴𝟐
1. Brillouin-Zone
0.6 𝟐𝒇/𝑴𝟏
𝝎− 𝑴𝟏 > 𝑴 𝟐
0.4
gegeben. Setzen wir die Determinante dieser Matrix gleich null, erhalten wir die Dispersions-
relation10
1⇑2
1 1 1 1 2 4 qa
ω =f(
2
+ ) ± f ⌊︀( + ) − sin2 }︀ . (5.2.33)
M1 M2 M1 M2 M1 M2 2
Diese Dispersionsrelation ist in Abb. 5.8 gezeigt. Wir erhalten also für unser System mit
einer zweiatomigen Basis zwei Dispersionszweige ω+ (q) und ω− (q), wie wir es nach unserer
allgemeinen Diskussion in Abschnitt 5.2.1 erwarten.11
Grenzfälle:
10
Wir erhalten:
2f 2f f2
0=( − ω2 ) ( − ω2 ) − (1 + e+ı qa ) (1 + e−ı qa )
M1 M2 M1 M2
4f 2 ω2 2 f ω2 2 f f2
= − − + ω4 − (2 + e+ı qa + e−ı qa )
M1 M2 M1 M2 M1 M2
= M 1 M 2 ω 4 − 2 f (M 1 + M 2 )ω 2 + 2 f 2 (1 − cos qa) .
Daraus erhalten wir
⌈︂
2 f (M 1 + M 2 ) ± f 2 (M 1 + M 2 )2 − 2M 1 M 2 f 2 (1 − cos qa)
ω = .
M1 M2
11
Im dreidimensionalen Fall erwarten wir für eine Basis mit zwei Atomen wir r = 3r ′ = 6 Dispersi-
onszweige, im eindimensionalen Fall dagegen nur r = r ′ = 2.
188 5 Gitterdynamik
1 1 a2 f
ω+2 (q) ≃ 2 f ( + )− q2 (5.2.34)
M1 M2 2(M 1 + M 2 )
a2 f
ω−2 (q) ≃ q2 . (5.2.35)
2(M 1 + M 2 )
Für das Verhältnis der Schwingungsamplituden erhalten wir für den Grenzfall q → 0
aus (5.2.30) und (5.2.31) unter Benutzung von ω+2 (0) = 2 f (1⇑M 1 + 1⇑M 2 ) und
ω−2 (0) = 0 das einfache Ergebnis
⌋︂
A 1 (0)⇑ M 1 M2
⌋︂ =− für ω+ , (5.2.37)
A 2 (0)⇑ M 2 M1
⌋︂
A 1 (0)⇑ M 1
⌋︂ =1 für ω− . (5.2.38)
A 2 (0)⇑ M 2
Wir sehen, dass die Atome für den ω− -Zweig mit gleicher Amplitude in Phase schwingen,
während sie für den ω+ -Zweig gegenphasig mit einem zum Massenverhältnis inversen
Amplitudenverhältnis schwingen. Dadurch bleibt der Schwerpunkt in Ruhe.
2. Rand der 1. Brillouin-Zone: q → π⇑a bzw. λ → 2a:
Für M 1 > M 2 erhalten wir
}︂
2f
ω+ (π⇑a) = (5.2.39)
M2
}︂
2f
ω− (π⇑a) = . (5.2.40)
M1
Zwischen den beiden Frequenzen ω+ (π⇑a) und ω− (π⇑a) existiert eine Frequenzlücke,
die umso größer ist, je größer das Massenverhältnis M 1 ⇑M 2 ist. In dieser Frequenzlücke
wird der Wellenvektor q imaginär, woraus eine gedämpfte Welle resultiert. Wir sehen
ferner, dass das Frequenzband ω+ umso schmäler wird, je größer M 1 ⇑M 2 ist.
5.2 Klassische Theorie 189
1. M 1 ≫ M 2 :
Für M 1 ≫ M 2 erhalten wir aus (5.2.33)12
f f M2 qa 1⇑2
ω2 ≃ ± (1 − 4 sin2 )
M2 M2 M1 2
f f M2 qa
≃ ± (1 − 2 sin2 ). (5.2.41)
M2 M2 M1 2
Hierbei haben wir den Wurzelausdruck entwickelt, da M 2 ⇑M 1 ≪ 1 ist.13 Wir erhalten
somit
2f 2f qa
ω+2 ≃ − sin2 (5.2.42)
M2 M1 2
2f qa
ω−2 ≃ sin2 . (5.2.43)
M1 2
Wir sehen, dass wir für den ω− -Zweig in etwa die Dispersionsrelation eines Gitters mit
nur einer Masse M 1 bekommen, was anschaulich wegen M 1 ≫ M 2 zu erwarten ist. Beim
ω− -Zweig schwingen die beiden Massen in Phase. Die kleine Masse bewegt sich dabei
quasi mit der großen mit und wir erhalten dadurch die Dispersionsrelation für ein Gitter
mit nur einer, und zwar der großen Masse. Beim ω+ -Zweig schwingen die beiden Massen
gegenphasig. Die große Masse bleibt bei der gegenphasigen Bewegung quasi in Ruhe und
wir erhalten eine Schwingungsfrequenz, die vom Wellenvektor fast unabhängig ist und
durch die leichte Masse bestimmt wird.
2. M 1 = M 2 :
Für M 1 = M 2 = M erhalten wir aus (5.2.33)
2f 2f qa 1⇑2 2f qa
ω2 = ± (1 − sin2 ) ≃ (1 ± cos ) (5.2.44)
M M 2 M 2
und somit
2f qa
ω+2 ≃ (1 + cos ) (5.2.45)
M 2
2f qa 4f qa
ω−2 ≃ (1 − cos ) = sin2 . (5.2.46)
M 2 M 4
Wir erhalten also für den ω− -Zweig die gleiche Dispersionsrelation wie für eine einato-
mige Basis, allerdings mit halbem Gitterabstand. Dies ist einsichtig, da für M 1 = M 2 = M
das resultierende Gitter tatsächlich ein einatomiges Gitter mit Gitterkonstante a⇑2 dar-
stellt. Der Verlauf des ω+ -Zweiges ist genau spiegelbildlich zu dem des ω− -Zweiges. Hier-
bei müssen wir allerdings beachten, dass der ω+ -Zweig eigentlich für M 1 = M 2 gar nicht
existieren kann und die Schwingungsmode mit Wellenvektor q einer Schwingungsmode
mit Wellenvektor π⇑a − q des ω− -Zweiges entspricht.
12
Wir benutzen M11 + M12 ≃ 1
M2
.
13
⌋︂
Es gilt: 1 − x ≃ 1 − 12 x.
190 5 Gitterdynamik
longitudinal akustisch
longitudinal optisch
transversal akustisch
transversal optisch
Abb. 5.9: Longitudinal und trans-
versal akustische und optische
Gitterschwingungen. Die ge-
punkteten Kreise geben die
Ruheposition der Atome an.
21
5.2 Klassische Theorie 191
L L
(10 1/s)
L
4
13
T2
[111]
L
2 G K X [110]
X T1 T
[100]
0
0.0 0.5 1.0 q 01.5 0.0 0.5
𝚪 𝐗 𝐊 𝚪 𝐋
Abb. 5.10: Phononen-Dispersionsrelationen von Al. Die durchgezogenen und gestrichelten Linien 25 stel-
det {D α i (q) − ω 2 1}
βj
verschwindet. Diese Gleichung hat genau D ⋅ r ′ Lösungen ω(q) für jeden Wellenvektor q, die
wir als Dispersionszweige bezeichnen. Hierbei ist D die Dimensionalität unseres betrachte-
ten Kristallsystems. Für die Zahl der akustischen und optischen Zweige erhalten wir für ein
dreidimensionales System mit r ′ Atomen pro Gitterzelle:
3 akustische Zweige
′ (5.2.49)
3r − 3 optische Zweige .
Als Beispiel betrachten wir Silizium. Si besitzt eine Diamantstruktur mit einer zweiatomi-
gen Basis. Wir erwarten also insgesamt r = 3r ′ = 6 (drei akustische und drei optische) Di-
spersionszweige. Ein experimentelles Ergebnis ist in Abb. 5.11 zusammen mit Berechnun-
gen der Dispersionsrelationen gezeigt. Entlang der [100]- und der [111]-Richtung sehen wir
aufgrund der Entartung der transversalen Zweige nicht 6 sondern nur 4 verschiedene Di-
spersionszweige. Entlang der [110]-Richtung haben wir 6 Dispersionszweige vorliegen. Die
Übereinstimmung von Theorie und Experiment ist in dem gezeigten Beispiel dürftig. Durch
das von Werner Weber vorgeschlagene „adiabatische bond-charge Modell“ wurde eine er-
hebliche Verbesserung der theoretischen Modellierung erreicht.14
14
W. Weber, Adiabatic bond charge model for the phonons in diamond, Si, Ge, and α-Sn, Phys. Rev.
B 15, 4789 (1977).
5.3 Zustandsdichte im Phononenspektrum 193
Silizium (zweiatomige Basis)
(10 1/s) LO LO
Si
10
12
LA
LA
5
TA TA
0
0.0 0.5 1.0 q 1.5 0.0 0.5
𝚪 𝐗 𝐊 𝚪 𝐋
27
Abb. 5.11: Phononen-Dispersionsrelationen von Si. Die Linien stellen berechnete Dispersionsrelatio-
⌋︂ 2π
2π
nen,
⌋︂ 2πdie Symbole experimentelle Daten dar. Der Wellenvektor q ist in Einheiten von a , 2 a und
3 a in [100]-, [110]- und [111]-Richtung aufgetragen (Daten aus P. E. Van Camp et al., Phys. Rev.
B 31, 4089 (1985)).
5.3.1 Randbedingungen
5.3.1.1 Eindimensionaler Fall: Periodische Randbedingungen
Wir gehen von der periodischen Randbedingung
u n = u n+N (5.3.1)
aus. Diese Randbedingung können wir uns am einfachsten anhand einer eindimensionalen
Kette plausibel machen. Für genügend große N ändert sich physikalisch nichts, wenn wir die
Kette zu einem Kreis biegen und an den Enden zusammenfügen. Da sich in diesem Fall alle
N Atome bewegen können, erwarten wir N Schwingungsmoden. Mit dem Lösungsansatz
2π p 2π N N
q= = p mit − <p≤+ . (5.3.4)
a N L 2 2
Dies sind, wie erwartet, N mögliche Wellenvektoren.15 Falls wir statt einer einatomigen Ba-
sis eine Basis mit r Atomen vorliegen haben, so ergibt sich das obige Ergebnis für jeden
einzelnen Dispersionszweig. Wir erhalten somit insgesamt r ⋅ N Schwingungsmoden, wobei
N nun die Zahl der Bravais-Gitterpunkte ist.
Wir wollen nun noch die Frage beantworten, wie viele Wellenvektoren pro Volumen des
Impulsraums erlaubt sind. Im Impulsraum erhalten wir nach (5.3.4) eine Folge von äqui-
distanten erlaubten Wellenvektoren (siehe Abb. 5.12). Im Intervall ∆q = πa − −π
a
= 2π
a
liegen
offenbar N Zustände. Da diese äquidistant sind, erhalten wir die so genannte Zustands-
dichte Z(q) im q-Raum zu
Wir sehen also, dass im eindimensionalen q-Raum jeder Zustand das Volumen 2π⇑L ein-
nimmt.
15
Hinweis: Das <-Zeichen taucht auf, da wir am Zonenrand für q = π⇑a stehende Wellen erhalten,
so dass die Lösungen für q = ± πa identisch sind. Für alle anderen Werte von q sind ±q anhand der
Ausbreitungsrichtung unterscheidbar.
32
5.3 Zustandsdichte im Phononenspektrum 195
Da N i a i ein Bravais-Gittervektor ist, folgt aus dieser Beziehung sofort, dass q ein reziproker
Gittervektor sein muss (vergleiche hierzu (2.1.16)). Wir können dann q durch die primitiven
reziproken Gittervektoren b1 , b2 und b3 ausdrücken:
Da
a i ⋅ b j = 2πδ i j (5.3.11)
⋃︀b i ⋃︀ p i ⋃︀b i ⋃︀ Ni Ni
− < ⋃︀b i ⋃︀ ≤ + oder − < pi ≤ + . (5.3.14)
2 Ni 2 2 2
Dies ergibt N 1 ⋅ N 2 ⋅ N 3 = N Schwingungsmoden.
Dehnen wir die obige Betrachtung auf ein dreidimensionales Gitter mit einer aus r ′ Atomen
bestehenden Basis aus, so erhalten wir das allgemeine Ergebnis:
196 5 Gitterdynamik
In einem dreidimensionalen Gitter mit einer aus r ′ Atomen bestehenden Basis sind
3r ′ ⋅ N = r ⋅ N Schwingungsmoden möglich. Dies entspricht genau N Schwingungsmoden
pro Dispersionszweig.
berechnen müssen. Dabei läuft der Index r über alle Dispersionszweige und wir haben die
Summation über q bereits durch eine Integration über die 1. Brillouin-Zone ersetzt. Dies ist
immer dann möglich, wenn wir es mit großen Festkörpern (also großen N) zu tun haben, so
dass die Zustände im q-Raum sehr dicht liegen (∝ 2π⇑L i ). Häufig möchte man die Summa-
tion über alle q-Zustände in eine Summation bzw. Integration über Frequenzen überführen.
Dazu schreiben wir, was wir immer tun können, formal
ω max
𝝎
𝝎𝐦𝐚𝐱
𝑫 𝝎
groß 𝒅𝝎
𝒅𝝎
𝑫 𝝎 Abb. 5.13: Zur Veranschauli-
klein chung der Ableitung der Zu-
𝒅𝒒 𝒅𝒒 standsdichte im Frequenzinter-
𝝎𝐦𝐢𝐧 vall mit Hilfe der Dispersions-
𝟎 𝟐𝝅/𝑳 𝝅/𝒂 𝒒 relation ω(q).
Wir wollen uns zunächst die Bedeutung der Zustandsdichte im Frequenzraum anhand
einer eindimensionalen Dispersionskurve ω(q) klarmachen (siehe hierzu Abb. 5.13). Die
konstante Zustandsdichte im q-Raum übersetzt sich über eine nichtlineare Dispersionskur-
ve ω(q) in eine Zustandsdichte D(ω), wobei
34
gilt. Offenbar ist D(ω) nicht konstant. Wir sehen, dass D(ω) groß ist, wo ω(q) flach verläuft
und umgekehrt. Wir wollen ferner darauf hinweisen, dass immer
ω max
N = ∫ d q Z(q) = ∫ dω D(ω)
3
(5.3.22)
1. BZ ω min
gelten muss.
Wir wollen nun einen allgemeinen Ausdruck für die Zustandsdichte D(ω) ableiten. Hier-
zu betrachten wir nur einen Dispersionszweig ω(q). Wir bestimmen zuerst die Anzahl der
Schwingungszustände im Frequenzintervall zwischen ω und ω + ∆ω für diesen einzelnen
Dispersionszweig. Für genügend große N sind die Zustände im q-Raum dicht gepackt, so
dass wir von einer quasi-kontinuierlichen Verteilung ausgehen können. Wir können dann
die Zahl der Zustände in einem Frequenzintervall dω dadurch bestimmen, indem wir über
das Volumen des q-Raumes, das von den beiden Flächen ω(q) und ω(q) + ∆ω(q) begrenzt
wird (in Abb. 5.14 würde dies der schattierten Fläche entsprechen), integrieren und mit der
Zustandsdichte Z(q) des q-Raumes multiplizieren. Wir erhalten
ω(q)+∆ω(q) q(ω+∆ω)
V
∫ D(ω)dω ≃ D(ω)∆ω = ∫ d3q . (5.3.23)
(2π)3
ω(q) q(ω)
Die genaue Form der Fläche ω(q) = const wird dabei durch die Dispersion ω(q) bestimmt.
Im einfachsten Fall einer linearen Dispersion ω(q) = v s ⋃︀q⋃︀ erhalten wir eine Kugeloberfläche.
Zur Ausführung der Integration in (5.3.23) setzen wir d 3 q = dS q dq⊥ , wobei dS q ein
Flächenelement der Fläche ω(q) = const und dq⊥ der jeweilige Abstand der Fläche
ω(q) + ∆ω(q) = const von der Fläche ω(q) = const ist (siehe hierzu Abb. 5.14). Mit
198 5 Gitterdynamik
𝒒𝒚
𝝎𝒒 = const
𝝎 + 𝚫𝝎 = const
𝒅𝒒⊥
𝒒𝒙 𝝎 = const
𝒅𝑺𝒒
erlaubte
Zustände
Abb. 5.14: Links: Erlaubte Zustände im zweidimensionalen q-Raum sowie q-Raumvolumen (schat-
tiert) zwischen zwei Flächen konstanter Frequenz. Rechts: Zur Herleitung der Zustandsdichte der
Schwingungsmoden im Frequenzintervall zwischen ω(q) und ω(q) + ∆ω(q).
V dS q
D(ω) = ∫ . (5.3.25)
(2π)3 ⋃︀∇q ω(q)⋃︀
ω=const
Dies ist der gewünschte allgemeine Ausdruck für die Zustandsdichte. Das Integral erstreckt
sich hierbei im q-Raum über die Fläche ω(q) = const. Wir können die Zustandsdichte D(ω)
berechnen, falls wir die Dispersionsrelation ω(q) kennen. Wir sehen, dass die Zustandsdich-
te für diejenigen Frequenzwerte besonders hoch ist, für die die Gruppengeschwindigkeit
∇q ω(q) klein ist. Für ∇q ω(q) = 0 tritt im Integrand von (5.3.25) eine Singularität auf. Diese
wird als van Hove Singularität bezeichnet.
Zustandsdichte eines isotropen Mediums: Als Beispiel berechnen wir die Zustandsdichte
eines isotropen Mediums mit einer einatomigen Basis (nur akustische Zweige) mit Schallge-
schwindigkeit v L für die londitudinalen und v T für die beiden transversalen Moden. Da wir
ω L = v L q bzw. ω T = v T q vorliegen haben, ist für jeden Dispersionszweig die Fläche ω(q) =
const eine Kugel mit Radius q und es gilt ⋃︀∇q ω i (q)⋃︀ = v i für die drei Dispersionszweige. Das
Oberflächenintegral in (5.3.25) ist deshalb gerade 4πq 2 und wir erhalten für jeden Disper-
sionszweig
V q2 V ω2
D i (ω) = = . (5.3.26)
2π 2 v i 2π 2 v i3
Für die gesamte Zustandsdichte der 3 Zweige ergibt sich
V 1 2
D(ω) = 2
( 3 + 3 ) ω2 . (5.3.27)
2π v L v T
16
Man beachte, dass ⋃︀∇q ω(q)⋃︀ die Änderung von ω senkrecht zur Fläche ω = const darstellt.
5.3 Zustandsdichte im Phononenspektrum 199
Wir sehen, dass die Zustandsdichte proportional zu ω 2 zunimmt. Dieses Ergebnis gilt auch
für nicht-isotrope Festkörper im Bereich kleiner q, wo die Dispersionsrelation gut durch
eine lineare Beziehung angenähert werden kann.
Zustandsdichte niederdimensionaler Systeme: Bei der Herleitung von (5.3.25) sind wir
von einem dreidimensionalen Festkörper ausgegangen. Wir können dieses Ergebnis aber
leicht auf den zweidimensionalen Fall erweitern. Wir gehen wieder von
ω(q)+∆ω(q) q(ω+∆ω)
(2) (2) A
∫ D (ω)dω ≃ D (ω)∆ω = ∫ d2q (5.3.28)
(2π)2
ω(q) q(ω)
aus, wobei D(2) (ω) die Zustandsdichte im Frequenzraum eines 2D-Systems ist und wir
Z (2) (q) = A⇑(2π)2 benutzt haben. Wir schreiben d 2 q = dL q dq⊥ , wobei dL q jetzt ein in-
finitesimales Element der Linie ω(q) = const und dq⊥ der senkrechte Abstand der Linie
ω(q) + ∆ω(q) = const von der Linie ω(q) = const ist. Wir benutzen ferner d 2 q = dL q dq⊥ =
d Lq
⋃︀∇q ω(q)⋃︀
∆ω und erhalten damit
A dL q
D(2) (ω) = ∫ . (5.3.29)
(2π)2 ⋃︀∇q ω(q)⋃︀
ω=const
Für ein isotropes Medium sind die Linien ω(q) = const Kreise mit Radius q und es gilt fer-
ner ⋃︀∇q ω i (q)⋃︀ = v i für die beiden Dispersionszweige. Das Integral in (5.3.29) ergibt deshalb
gerade 2πq und wir erhalten für jeden Dispersionszweig
(2) A q A ω
D i (ω) = = . (5.3.30)
2π v i 2π v i2
Für die gesamte Zustandsdichte der beiden Zweige ergibt sich
A 1 1
D(2) (ω) = ( 2 + 2 )ω . (5.3.31)
2π v L v T
Wir erhalten also für zweidimensionale Systeme ein lineares Ansteigen der Zustandsdichte
mit der Wellenzahl bzw. mit der Frequenz.
Für den eindimensionalen Fall ergibt sich analog
L dPq
D(1) (ω) = ∫ , (5.3.32)
(2π) ⋃︀∇q ω(q)⋃︀
ω=const
wobei jetzt dPq nur noch ein Punktelement ist. Für ein isotropes Medium stellt ω(q) = const
gerade zwei Punkte dar und das Integral in (5.3.32) ergibt deshalb gerade 2. Da wir es nur
noch mit einem longitudinalen Dispersionszweig zu tun haben, erhalten wir
L 2
D(1) (ω) = . (5.3.33)
2π v L
Die Zustandsdichte ist also unabhängig von der Wellenzahl bzw. Frequenz.
200 5 Gitterdynamik
5.4.2 Phononen
5.4.2.1 Quantentheorie für harmonische Kristalle
Wir wollen nun kurz aufzeigen, wie in harmonischer Näherung Gitterschwingungen mit
Hilfe der Quantentheorie beschrieben werden können. Bei der mathematischen Behand-
17
Es war am 14. Dezember 1900, als Max Planck in einem Vortrag vor der Deutschen Physikalischen
Gesellschaft in Berlin seine Formel zur Beschreibung des Spektrums eines schwarzen Strahlers prä-
sentierte. Bei der Ableitung dieser Formel musste Planck, wie er damals selbst sagte, „in einem Akt
der Verzweiflung“ die Quantisierung der Strahlungsmoden annehmen. Diese Quantenhypothese
Plancks bedeutete gleichzeitig die Geburtsstunde der modernen Quantentheorie und damit einen
der größten Fortschritte der Physik.
M. Planck: Zur Theorie des Gesetzes der Energieverteilung im Normalspektrum, Verhandlungen der
Deutschen physikalischen Gesellschaft 2 (1900) Nr. 17, S. 245, Berlin.
5.4 Quantisierung der Gitterschwingungen 201
lung der Schwingungen eines Systems miteinander gekoppelter Oszillatoren führt man ge-
wöhnlich durch eine lineare Transformation so genannte Normalkoordinaten ein (siehe An-
hang A). Diese erlauben dann innerhalb der harmonischen Näherung die Aufstellung von
Bewegungsgleichungen völlig entkoppelter Oszillatoren. Das Frequenzspektrum der Nor-
malschwingungen der ungekoppelten harmonischen Oszillatoren entspricht dabei demje-
nigen der Eigenschwingungen des Systems der miteinander gekoppelten Oszillatoren. Die
Normalkoordinaten können natürlich nicht mehr wie die Auslenkungen u den einzelnen
Gitteratomen zugeordnet werden.
Die Eigenenergien bzw. Eigenfrequenzen der Normalschwingungen sind durch die Eigen-
werte des harmonischen Hamilton-Operators
1 2
ℋharm = 𝒯 + U elharm = ∑ P (rnα ) + U elharm (5.4.2)
n,α 2M α
gegeben. Hierbei ist 𝒯 die kinetische Energie der Gitteratome und U elharm die harmonische
Näherung (5.1.13) des in adiabatischer Näherung erhaltenen Potenzials der elektronischen
Wechselwirkungen. Die Methode, wie diese Eigenwerte bestimmt werden können, ist in An-
hang A beschrieben. Das dort erhaltene Ergebnis ist sehr plausibel. Um die Energieniveaus
eines aus N Atomen bestehenden Kristalls zu spezifizieren, betrachten wir ihn als System von
3N unabhängigen Oszillatoren, deren Frequenzen denjenigen der 3N klassischen Schwin-
gungsmoden entsprechen, die wir in Abschnitt 5.3 diskutiert haben. Ein bestimmter Schwin-
gungszustand der Frequenz ω r (q) kann nun nur die diskreten Energiewerte
(n qr + 12 ) ħω r (q) , n qr = 0, 1, 2, 3, . . . (5.4.3)
E = ∑ (n qr + 12 ) ħω r (q) . (5.4.4)
qr
Es ist wichtig, sich klar zu machen, dass die oben diskutierten Normalschwingungen nicht
den lokalisierten Schwingungen einzelner Gitteratome zugeschrieben werden können. Viel-
mehr tragen alle Atome des Gitters zu einer Schwingung bei. Das heißt, die Schwingung
beschreibt einen bestimmten Anregungszustand des gesamten Gitters.
Phononen sind die Quanten des Auslenkungsfeldes in einem Kristall. Sie können als Teil-
chen mit Impuls p = ħq und Energie E = ħω aufgefasst werden.
Der Term „Phonon“ betont die Analogie zu Photonen. Letztere sind die Quanten des elek-
tromagnetischen Strahlungsfeldes, welche im geeigneten Frequenzbereich Lichtwellen be-
schreiben. Erstere sind die Quanten des Auslenkungsfeldes in einem Kristall, die im geeig-
neten Frequenzbereich Schallwellen beschreiben. Gitterschwingungen im Teilchenbild zu
betrachten ist in der Festkörperphysik üblich. Auch anderen Wellen, wie z. B. Spinwellen,
werden Teilchen, z. B. Magnonen, zugeordnet.
Eine offensichtliche Frage, die sich aufwirft, betrifft die Übersetzung der Tatsache, dass eine
Schwingung in verschieden angeregten Zuständen (entspricht unterschiedlichen Amplitu-
den) n qr vorliegen kann, in das Teilchenbild. Die einfache Antwort ist, dass wir sagen, dass
wir n qr Phononen des Typs r mit Wellenvektor q im Kristall vorliegen haben. Man sagt auch,
dass der Oszillator mit Frequenz ω qr von n qr Phononen besetzt ist. Je höher also eine Schwin-
gung angeregt ist, desto mehr dieser Schwingung entsprechende Phononen sind vorhanden.
Es sei hier auch darauf hingewiesen, dass in völliger Analogie mit Photonen die Anzahl der
Phononen nicht erhalten ist. Wir erwarten zum Beispiel, dass bei hohen Temperaturen die
Zahl der Phononen größer ist als bei tiefen.
d N−1
P=M ∑ u n (t) . (5.4.5)
dt n=0
Wir haben in Abschnitt 5.3.1 gezeigt, dass q nur ganz bestimmte Werte annehmen kann, und
zwar q = ±(2π⇑Na)p, wobei p eine ganze Zahl ist. Wir erhalten deshalb e ı qN a = e±ı2π p = 1.
Damit folgt aus (5.4.6) sofort
N−1
P = −ıωMAe−ı ωt ∑ e ı qna = 0 . (5.4.7)
n=0
Die einzige Ausnahme bildet die uniforme Mode q = 0, für die alle Auslenkungen u n = u
gleich sind, so dass P = N M du⇑dt. Diese Mode entspricht einer gleichförmigen Translation
des gesamten Kristalls, die natürlich einen endlichen Impuls besitzt.
Wir können auch anders argumentieren, wenn wir die Symmetrieeigenschaften des Hamil-
ton-Operators in Betracht ziehen. Es gilt ganz allgemein, dass aus jeder Symmetrieeigen-
schaft des Hamilton-Operators eine Erhaltungsgröße folgt. So folgt aus der Translationsin-
varianz die Impulserhaltung, aus der Drehinvarianz die Drehimpulserhaltung etc. Das von
uns betrachtete Kristallgitter besitzt nun keine Translationsinvarianz, sondern nur eine dis-
krete Translationsinvarianz bei Verschiebung um einen Bravais-Gittervektor. Wir erwarten
also, dass eine Impulserhaltung gelten sollte, allerdings in einer gegenüber Systemen mit kon-
tinuierlicher Translationsinvarianz abgeschwächten Form. Dies ist in der Tat der Fall. Wir
erinnern uns, dass q und q′ = q + G identische Zustände beschreiben, wenn G ein reziproker
Gittervektor ist. Daher ist zu vermuten, dass in einem Kristall mit diskreter Translationsinva-
rianz statt ħq nur ħq + ħG erhalten bleibt. Betrachten wir also Streuprozesse im Festkörper,
an denen Phononen beteiligt sind, so gilt die Impulserhaltung nur bis auf einen reziproken
Gittervektor. Wir können also schreiben
∑ ħk i
vor
= ∑ ħknach
i + ∑ ±ħq i + ħG . (5.4.8)
i i i
In Abb. 5.15 ist ein durch (5.4.8) beschriebener Streuprozess für den Fall einer Phononenver-
nichtung dargestellt. Das einfallende Teilchen mit Wellenvektor k (Photon, Elektron, Neu-
tron) streut mit einem Phonon und vernichtet es. Dadurch wird die Energie des gestreuten
Teilchens erhöht, was sich in einer größeren Länge des Wellenvektors k′ manifestiert. Der
Endpunkt von k′ liegt dann nicht mehr wie bei der elastischen Streuung auf der Ewald-Kugel,
sondern außerhalb. Der Impulsübertrag k′ − k setzt sich aus dem Anteil ħG zusammen, den
der gesamte Kristall aufnimmt, und dem Quasiimpuls ħq des vernichteten Phonons.
Impulserhaltung bei Streuexperiment mit Phononen
Ewald-Kugel
𝒒
𝒌 𝑮
𝒌′ − 𝒌
≠ |𝐤 ′ | Abb. 5.15: Inelastische Streuung eines Teilchens mit Im-
1. BZ 𝒌′ puls k mit einem Phonon, bei dem das Phonon vernichtet
wird. Der Wellenvektor k′ des gestreuten Teilchens liegt
außerhalb der Ewald-Kugel. Der Streuvektor k′ − k ist
durch die Summe aus Wellenvektor q des Phonons und
reziprokem Gittervektor G gegeben.
elastische Streuung eines Teilchens mit Impuls 𝑘 unter Vernichtung eines Phonons ( 𝑘 ′ > 𝑘 )
ℏ𝒌𝐯𝐨𝐫
𝒊 = 𝒌 + 𝒒 + 𝑮 = ℏ𝒌𝐧𝐚𝐜𝐡
𝒊 = 𝒌′ ⇒ 𝒌′ − 𝒌 = 𝒒 + 𝑮
𝒊 𝒊
39
204 5 Gitterdynamik
Wir können festhalten, dass Phononen im Gegensatz zu Photonen keinen echten Impuls tra-
gen. Trotzdem verhalten sich Phononen in Streuprozessen so, als ob sie den Impuls ħq haben
würden. Wir bezeichnen die impulsähnliche Größe ħq als Quasiimpuls oder Kristallimpuls.
Tatsächlich ändert sich in einem Streuprozess der Impuls des gestreuten Teilchen, wenn ein
Phonon erzeugt oder vernichtet wird. Allerdings wird der Impulsübertrag vom gesamten
Kristallgitter aufgenommen. Die angeregten oder vernichteten Phononen selbst tragen nicht
zu dessen Gesamtimpuls bei.
E k ′ − E k = ±ħω q
(5.5.1)
k′ − k = ±q + G .
Hierbei sind E k ′ und ħk′ Energie und Impuls der Sonde nach dem Streuprozess und das
+ Zeichen (− Zeichen) gilt für die Vernichtung (Erzeugung) eines Phonons beim Streupro-
zess. Gleichung (5.5.1) gilt auch für elastische Streuprozesse. Hier gilt E k ′ = E k oder ⋃︀k′ ⋃︀ = ⋃︀k⋃︀
und k′ − k = G. Die Impulserhaltung stellt dann gerade die von-Laue-Bedingung dar.
Aus (5.5.1) wird klar, was in einem Experiment gemessen werden muss. Es muss sowohl die
Energie als auch der Impuls der Sonde vor und nach dem inelastischen Streuprozess gemes-
sen werden. Dann kann mit Hilfe von (5.5.1) die Energie bzw. Frequenz und der Wellenvek-
tor des Phonons bestimmt und daraus die Dispersionsrelation ω(q) abgeleitet werden.
Für die Messsonde können verschiedeneEnergie-
Teilchensorten verwendet werden. Allerdings ist
und Impulserhaltung beim inelastischen Streuprozess
dabei zu beachten, dass unterschiedliche Teilchen unterschiedliche E(k)-Beziehungen be-
𝒌, 𝑬𝒌 𝜗 𝑬𝒌′ = 𝑬𝒌 − ℏ𝝎𝒒
𝒌′ = 𝒌 − 𝒒 + 𝑮
𝒌, 𝑬𝒌 𝜗 𝑬𝒌′ = 𝑬𝒌 + ℏ𝝎𝒒
Abb. 5.16: Vektordiagram-
𝒌′ = 𝒌 + 𝒒 + 𝑮
me zum inelastischen Streu-
prozess. Wir haben G = 0 gewählt.
40
5.5 Experimentelle Methoden 205
4
10 1019
100 1015
Abb. 5.17: E(k)-Beziehung für Neutronen
thermischer Bereich
-4 11 und Photonen. Der Bereich thermischer
10 10
Ek (eV)
/1.6 (Hz)
Energien ist grau hinterlegt. Die rechte
-8 Skala zeigt die zur Energie äquivalente
10 107
Frequenz. Eingezeichnet ist auch der akus-
-12
10 103 tische Zweig einer Phononendispersions-
relation für ein Material mit einer Schall-
10-16 10-1 geschwindigkeit von etwa 5000 m⇑s und
einer Gitterkonstante von 1 Å. Der Rand
-20
10 10-5 der 1. Brillouin-Zone liegt typischerweise
100 103 106 109 bei einer Wellenzahl im Bereich zwischen
k (1/cm) 108 und 109 cm−1 .
42
sitzen. Dies ist anhand von Abb. 5.17 für Neutronen und Photonen gezeigt. Für diese gilt:
p2 ħ2 k 2
E(k) = = Neutronen ,
2M N 2M N (5.5.2)
E(k) = pc = ħkc Photonen .
Hierbei ist c = 2.998 × 108 m⇑s die Lichtgeschwindigkeit und M N = 1.67 × 10−27 kg die
Masse des Neutrons.
Abb. 5.17 zeigt, dass die inelastische Streuung von Photonen zur Aufnahme der Dispersi-
onsrelation ω(q) der Phononen nicht gut geeignet ist. Zwar liegt der Wellenvektor bzw.
die Wellenlänge von Photonen (z. B. Röntgenquanten) im richtigen Bereich. Wollen wir
den Bereich der 1. Brillouin-Zone abdecken, brauchen wir aber Wellenvektoren bis etwa
π⇑a ∼ 108 cm−1 . Da die Lichtgeschwindigkeit in einem Festkörper etwa 105 mal größer als
die Schallgeschwindigkeit ist, unterscheiden sich die Kreisfrequenzen von Röntgenstrahlen
und Gitterschwingungen bei gleicher Wellenzahl ebenfalls um etwa den Faktor 105 . Die re-
lative Frequenzänderung von Röntgenquanten bei einer Streuung am Kristallgitter ist des-
Analysator
Schlitze Detektor
elastisch
Probe Abb. 5.18: Phononenspek-
C (111)
Undulator Monochromator
Monochromator
Intensität
(hochauflösend)
tren von Diamant aufge-
nommen mit inelastischer
Röntgenstreuung für unter-
schiedliche Impulsüberträge
entlang der Γ − L-Richtung.
Die Energieauflösung des
Analysators betrug etwa
7.5 meV bei einer Rönt-
genenergie von 14 keV
(Daten: Argonne National
Laboratory).
halb nur sehr gering. Abb. 5.17 zeigt, dass für einen Impulsübertrag von 1 Å−1 = 108 cm−1
eine Photonenenergie von etwa 1 keV notwendig ist. Um nun die typischen Phononenener-
gien im meV-Bereich auflösen zu können, müssen relative Energieänderungen der Licht-
quanten im Bereich von ∆E⇑E ≃ 10−6 aufgelöst werden. Der Nachweis solch kleiner rela-
tiver Energieänderungen ist experimentell schwierig. Durch eine stetige Verbesserung der
Photonenquellen (Synchrotronstrahlung) wurden aber hier in den letzten Jahren beträcht-
liche Fortschritte gemacht. Es wurden insbesondere spezielle Systeme entwickelt, die eine
Energieauflösung ∆E⇑E im Bereich von 10−5 bis 10−13 für Röntgenenergien im Energiebe-
reich zwischen 6 und 30 keV besitzen. Mit solchen Systemen können die Phononendispersi-
onsrelationen von Festkörpern auch mit Hilfe von inelastischer Röntgenstreuung bestimmt
werden (siehe Abb. 5.18).
Für Elektronen besteht das gleiche Problem wie für Photonen. Elektronen haben bei einer
de Broglie-Wellenlänge von etwa 1 Å (d. h. k ∼ 1 Å−1 ) eine Energie von etwa 150 eV (siehe
Abb. 2.17). Deshalb müssen auch hier kleine relative Energieänderungen gemessen werden.
Hinzu kommt noch die geringe Eindringtiefe von Elektronen. Neutronen sind dagegen für
die Analyse der Phononen-Dispersion sehr gut geeignet. Bei einer de Broglie-Wellenlänge
von etwa 1 Å ist die Neutronenenergie in der gleichen Größenordnung wie die Phononen-
energie, so dass die relative Energieänderung groß ist und deshalb einfach gemessen werden
kann.
Kollimator Monochromator
Analysator
𝜶
Reaktor 𝜷
(Energieübertrag)
5.5 Experimentelle Methoden 207
mit Hilfe von Bragg-Reflexion hinsichtlich ihrer Wellenzahl und damit ihrer Energie analy-
siert. Durch den Winkel α wird also k und damit E k bestimmt. Durch den Winkel ϑ wird
die Richtung von k′ und schließlich durch den Winkel β die Länge ⋃︀k′ ⋃︀ des Wellenvektors,
also die Energie E k ′ der in k′ -Richtung gestreuten Neutronen selektiert. Gemäß (5.5.1) gilt
ħ 2 (k ′ − k 2 )
2
Wir können also bei vorgegebenem k durch Messung von k′ und ⋃︀k′ ⋃︀ den Wellenvektor q
und die Energie ħω q der Phononen bestimmen.
208 5 Gitterdynamik
Die in Abb. 5.19 gezeigte Anordnung nennt man ein Dreiachsenspektrometer. Für die Ent-
wicklung der Neutronenspektroskopie und -streuung und der damit verbundenen experi-
mentellen Techniken erhielten Bertram N. Brockhouse und Clifford G. Shull im Jahr 1994
den Nobelpreis für Physik.
Der Nachteil der in Abb. 5.19 gezeigten Methode ist die Tatsache, dass aufgrund des für die
Messung notwendigen Monochromators nur ein kleiner Bruchteil des Spektrums der aus
dem Reaktor kommenden Neutronen genutzt werden kann. Dieser Nachteil kann mit Hilfe
einer gepulsten Neutronenquelle beseitigt werden. Hier kann der Monochromator weggelas-
sen werden und es kann deshalb ein Großteil des Neutronenspektrums der Quelle genutzt
werden. Die Bestimmung der Energie der einfallenden Neutronen erfolgt dann dadurch,
dass man das Signal am Detektor zeitaufgelöst aufnimmt. Da Neutronen unterschiedlicher
Energie wegen E = 12 M n v 2 unterschiedliche Geschwindigkeiten haben, kommen sie am De-
tektor zeitlich versetzt an (Flugzeitspektrometer). Die Energie der Neutronen nach der Streu-
ung wird nach wie vor mit einem Analysatorkristall bestimmt.
1.0
Raman-
0.8 Streuung
opt
/ 0
0.4
Brillouin-
Streuung
0.2
cken (siehe Abb. 5.20). Wir sind also bei der inelastischen Lichtstreuung auf den Bereich
um q = 0 der 1. Brillouin-Zone beschränkt. Es ist üblich, dabei folgende Unterscheidung zu
machen:18 , 19
∎ Raman-Streuung:20
Inelastische Lichtstreuung an optischen Phononen. Da die optischen Phononen für q ≃ 0
hohe Frequenzen haben, ist bei der Raman-Streuung die erforderliche Energieauflösung
moderat.
∎ Brillouin-Streuung:21
Inelastische Lichtstreuung an akustischen Phononen. Da die akustischen Phononen für
q ≃ 0 sehr kleine Frequenzen haben, ist hier eine hohe Energieauflösung erforderlich.
Als Lichtquellen werden heute meist Laser verwendet. Da die Streuintensität proportional
zu Ω 4 ist, werden möglichst kurzwellige Laser verwendet. Diese Abhängigkeit gilt allerdings
nur für Ω ≫ ω q . Für die Raman-Streuung kann aber auch Ω ≃ ω q realisiert werden. Für
diesen Fall ist die Streuintensität stark erhöht, man spricht von resonanter Raman-Streuung.
Für die resonante Raman-Streuung sind durchstimmbare Laser notwendig (z. B. Dye-Laser).
Die Verwendung von extrem monochromatischem Laserlicht in Verbindung mit hochauf-
lösenden optischen Spektrometern (z. B. Fabry-Pérot-Interferometern) ist vor allem für die
Brillouin-Streuung erforderlich, die eine hohe Energieauflösung von bis zu ∆Ω⇑Ω ∼ 10−8
benötigt.
Da wir bei der inelastischen Lichtstreuung auf das Zentrum der 1. Brillouin-Zone beschränkt
sind, kommt im Erhaltungssatz für den Impuls der reziproke Gittervektor G nicht vor und
wir können für die Energie- und Impulserhaltung schreiben:
Hierbei sind Ω und Ω′ die Kreisfrequenzen des Lichts vor und nach dem Streuprozess.
Nach Gleichung (5.5.6) ist jede Lichtstreuung, bei der der Streuwinkel von null verschie-
den ist, mit der Erzeugung oder Vernichtung eines Phonons und damit mit einer Änderung
der Lichtfrequenz verknüpft. Die Verschiebung ±ħω q = ħΩ′ − ħΩ der ursprünglichen Pho-
tonenenergie wird als Raman-Verschiebung bezeichnet. Im Experiment sollten wir deshalb
im gestreuten Licht nur die Frequenzen Ω + ω q und Ω − ω q beobachten. In Wirklichkeit be-
obachtet man aber im abgelenkten Strahl auch die Frequenz Ω. Dies resultiert aus der elasti-
schen Lichtstreuung an Fehlordnungen im untersuchten Kristall, die wir als Rayleigh-Streu-
ung 22 bezeichnen. Ein typisches Frequenzspektrum ist in Abb. 5.21 gezeigt. Die Spektrallinie
mit Ω − ω q (Phononen-Erzeugung) wird gewöhnlich als Stokes-Linie, die Spektrallinie mit
18
D. A. Long, Raman Spectroscopy, McGraw-Hill, New York (1977).
19
A. Mooradiam, Light Scattering Spectra of Solids, G. B. Wright, ed., Springer, Berlin (1969).
20
Sir Chandrasekhara Venkata Raman, siehe Kasten auf Seite 210.
21
Léon Brillouin, geboren am 7. August 1889 in Sèvres, gestorben am 4. Oktober 1969 in New York.
22
John William Rayleigh, geboren 1842 in Langford, Großbritannien, gestorben 1919 in Terling
Place, Großbritannien. Nobelpreis für Physik 1904.
210 5 Gitterdynamik
I(Ω + ω q ) ∐︀n q ̃︀ −
ħω q
= = e kB T . (5.5.7)
I(Ω − ω q ) ∐︀n q ̃︀ + 1
23
Dieses Ergebnis erhalten wir, wenn wir die Bose-Einstein-Verteilungsfunktion (6.1.26) für die mitt-
lere Besetzungszahl der Phononen einsetzen. Eine ausführliche Diskussion der Besetzungswahr-
scheinlichkeit der Phononenzustände folgt später in Abschnitt 6.1.3.
5.5 Experimentelle Methoden 211
𝑰 Rayleigh
Stokes
Stokes 𝒌, 𝑬𝒌 Abb. 5.21: Typisches Fre-
𝜗
quenzspektrum bei der
Anti-Stokes inelastischen Lichtstreu-
ung. Neben der Stokes- und
Anti-Stokes Anti-Stokes-Linie durch Er-
𝒌, 𝑬𝒌 𝜗 zeugung und Vernichtung
eines Phonons tritt auch
die Rayleigh-Linie durch
𝛀 − 𝝎𝒒 𝛀 𝛀 + 𝝎𝒒 𝛀 elastische Lichtstreuung auf.
Bei tiefen Temperaturen sind wegen k B T ≪ ħω q nur sehr wenige Phononenzustände be-
setzt. Dadurch werden Anti-Stokes-Prozesse, bei denen Phononen vernichtet werden, un-
wahrscheinlich. Dies resultiert in einer im Vergleich zur Stokes-Linie sehr schwachen Anti-
Stokes-Linie.
Bei der Raman-Streuung wird die Probe mit Laserlicht bestrahlt51und das gestreute Licht mit
einem hochauflösenden Spektrometer analysiert. Da die Dispersionskurve der optischen
Phononen im Zentrum der Brillouin-Zone flach verläuft, hängt die Frequenz der wech-
selwirkenden Phononen kaum vom Wellenvektor ab. Das bedeutet, dass die beobachtete
Frequenzverschiebung praktisch nicht von der Beobachtungsrichtung abhängt. Wir wollen
darauf hinweisen, dass nicht alle Phononenlinien beobachtet werden können, die aufgrund
der Energie- und Impulserhaltung erlaubt wären. Eine weitere Voraussetzung ist, dass eine
endliche Kopplung zwischen der einfallenden Lichtwelle und der Gitterschwingung besteht.
Vereinfacht dargestellt erzeugt die einfallende Lichtwelle über die elektrische Suszeptibilität
der Probe eine mit der Frequenz Ω oszillierende elektrische Polarisation. Zur Raman-Streu-
ung kommt es, wenn die Gitterschwingung eine Modulation dieser Polarisation mit der Fre-
quenz ω q bewirkt. Es kommt dann zur Abstrahlung einer elektromagnetischen Welle mit
der Summen- bzw. Differenzfrequenz.
Abb. 5.22 zeigt das Raman-Spektrum des Kuprat-Supraleiters YBa2 Cu3 O6 . Bei dem ange-
gebenen Sauerstoffgehalt ist das Kuprat nicht supraleitend, sondern isolierend und antifer-
romagnetisch. Im Raman-Spektrum (B 1g -Symmetrie) fällt deshalb der elektronische Unter-
grund weg und man sieht deutlich die Stokes- und Anti-Stokes-Linie einer Phonon-Mode
bei etwa 340 cm−1 oder 40 meV, die einer gegenphasigen Schwingung der Sauerstoffatome
in den CuO2 -Ebenen des Kuprats zugeordnet werden kann. In Abb. 5.22 ist ferner gezeigt,
dass das Intensitätsverhältnis von Stokes- und Anti-Stokes-Linie gut durch Gleichung (5.5.7)
beschrieben werden kann. Die aus der Anti-Stokes-Linie und der Probentemperatur berech-
nete Stokes-Linie stimmt gut mit der gemessenen überein.
Bei der Brillouin-Streuung hängt aufgrund der linearen Dispersionsrelation der akustischen
Phononen im Zentrum der Brillouin-Zone die Frequenz der streuenden Phononen vom
Streuwinkel ab. Die typischen Frequenzänderungen der Photonen liegen im Bereich von nur
etwa 20 GHz. Ihr Nachweis erfordert hochauflösende Spektrometer. Vereinfacht betrachtet
kann die Brillouin-Streuung mit Hilfe der Bragg-Reflexion verstanden werden. Die Schall-
welle erzeugt im Festkörper eine Variation der Streudichte, an der die Lichtwelle gebeugt
wird. Die Beugungsbedingung entspricht der Bragg-Bedingung, wobei der Abstand d der
Gitterebenen durch die Periodizität der Streudichte, also der Wellenlänge λ q der Schallwelle
212 5 Gitterdynamik
100
Abb. 5.22: Stokes- und Anti- berechnet
Stokes-Linie von antiferro- Anti-Stokes (AS) ST ST
Stokes (ST)
magnetischem, isolierendem 80
Rayleigh
YBa2 Cu3 O6 aufgenommen Stokes berechnet YBa2Cu3O6
Intensität (cps/mW)
in B 1g -Symmetrie (gekreuzte aus Anti-Stokes
60 für T = 250 K (AFM)
Lichtpolarisation). Die Phonon-
Linie kann einer gegenphasigen O
Schwingung der Sauerstoffatome 40 Cu
in den CuO2 -Ebenen des Ku- = 458 nm
prats zugeordnet werden (siehe T = 250 K
20 AS
Inset). Neben der Stokes- und
Anti-Stokes-Linie ist auch die aus
der Anti-Stokes-Linie berechne- 0
te Stokes-Linie gezeigt, die sehr
gut mit der gemessenen überein- -100 -80 -60 -40 -20 0 20 40 60 80 100
stimmt (Quelle: WMI Garching). Raman-Verschiebung (meV)
2λ q sin θ = nλ . (5.5.8)
Hierbei ist λ die Lichtwellenlänge und θ = ϑ⇑2 der halbe Streuwinkel (vergleiche Abb. 5.21).
In dieser Betrachtungsweise wird die Frequenzverschiebung des Lichts durch den Doppler-
effekt erzeugt, da sich die streuenden Atome der fortlaufenden Schallwelle bewegen.
Literatur
N. W. Ashcroft, N. D. Mermin, Festkörperphysik, Oldenbourg Verlag, München (2012).
M. Born, R. Oppenheimer, Zur Quantentheorie der Molekeln, Ann. Phys. (Leipzig) 84, 457
(1927).
D. A. Long, Raman Spectroscopy, McGraw-Hill, New York (1977).
Liang-fu Lou, Introduction to phonons and electrons, World Scientific, Singapore (2003).
A. Mooradiam, Light Scattering Spectra of Solids, G. B. Wright, ed., Springer, Berlin (1969).
M. Planck: Zur Theorie des Gesetzes der Energieverteilung im Normalspektrum, Verhandlun-
gen der Deutschen physikalischen Gesellschaft 2 (1900) Nr. 17, S. 245, Berlin.
G. P Srivastava, The Physics of Phonons, Taylor & Francis Group, New York (1990).
F. Schwabl, Advanced Quantum Mechanics, Springer-Verlag, Berlin (2008).
W. Weber, Adiabatic bond charge model for the phonons in diamond, Si, Ge, and α-Sn, Phys.
Rev. B 15, 4789 (1977).
6 Thermische Eigenschaften
des Kristallgitters
Wir wollen uns in diesem Kapitel mit den ther-
mischen Eigenschaften des Kristallgitters beschäfti-
gen. Dabei werden wir nur die mit den Phononen
verbundenen Eigenschaften diskutieren. Die erhal-
tenen Ergebnisse sind deshalb hauptsächlich für Iso-
latoren relevant. Auf die thermischen Eigenschaften
von Festkörpern, die mit dem elektronischen System
oder mit magnetischen Anregungen zusammenhän-
gen, werden wir später bei der Diskussion von Me-
tallen, Supraleitern oder magnetischen Materialien
eingehen. Die mit dem Kristallgitter verbundenen thermischen Eigenschaften spielen al-
lerdings auch für diese Systeme eine Rolle, da der Beitrag der Gitterschwingungen immer
demjenigen der elektronischen oder magnetischen Anregungen überlagert ist.
Im Einzelnen werden wir folgende Eigenschaften von Isolatoren diskutieren:
∎ spezifische Wärme
∎ thermische Ausdehnung
∎ Wärmeleitfähigkeit
Zur Diskussion der thermischen Eigenschaften des Kristallgitters werden wir einige grund-
legende Beziehungen der Thermodynamik und der statistischen Physik verwenden. Diese
werden wir nur plausibel machen, ohne sie explizit abzuleiten.
214 6 Thermische Eigenschaften
Die Wärmekapazität eines Stoffes ist diejenige Wärmemenge ∆Q, die benötigt wird, um
seine Temperatur um 1 K zu erhöhen:
zugeführte Wärmemenge ∆Q
C≡ = . (6.1.1)
Temperaturerhöhung ∆T
Die auf diese Weise definierte Wärmekapazität hängt natürlich von der Stoffmenge ab. Um
verschiedene Materialien vergleichen zu können, wird C meistens auf die Stoffmenge 1 mol
bezogen. Wir bezeichnen diese molare Wärmekapazität mit c m :
∆Q J
cm ≡ ]︀ {︀ . (6.1.2)
∆T ⋅ mol K ⋅ mol
Alternativ können wir die Wärmekapazität pro Masse oder Volumen eines Stoffes angeben.
Wir bezeichnen diese Größe als spezifische Wärmekapazität
C J C J
c mass ≡ ⌊︀ }︀ c vol ≡ ]︀ {︀ . (6.1.3)
m K ⋅ kg V K ⋅ m3
Die hochgestellten Indizes werden wir im Folgenden meist weglassen und dann jeweils sa-
gen, ob es sich bei c um die auf die Masse oder das Volumen normierte Wärmekapazität
handelt. Der Zusammenhang zwischen der Wärmekapazität und der inneren Energie U folgt
aus dem 1. Hauptsatz der Thermodynamik:
dQ = dU − dW = dU + pdV . (6.1.4)
Hierbei ist dQ die dem System zugeführte Wärmemenge, dU die Änderung seiner inneren
Energie und dW = −pdV die am System geleistete Arbeit. Wir sehen, dass die durch die
zugeführte Wärmemenge dQ erzielte Änderung der inneren Energie davon abhängt, ob wir
den Druck p oder das Volumen V festhalten.
Halten wir das Volumen V des Festkörpers konstant, d. h. dV = 0, so erhalten wir die Wär-
mekapazität bei konstantem Volumen:
∂Q ∂U
CV ≡ ⋀︀ = ⋀︀ . (6.1.5)
∂T V ∂T V
Am häufigsten verwendet werden die auf die Masse m normierte spezifische Wärmekapa-
zität c V = C V ⇑m oder die auf das Volumen V normierte spezifische Wärmekapazität c V =
C V ⇑V . Wir sehen, dass C V direkt mit der inneren Energie des Festkörpers zusammenhängt.
6.1 Spezifische Wärme 215
In Experimenten ist es meist sehr schwierig, das Volumen eines Festkörpers konstant zu hal-
ten, da der Festkörper sich aufgrund anharmonischer Effekte ausdehnt (siehe Abschnitt 6.3).
Experimente werden fast immer bei konstantem Druck durchgeführt, weshalb die Wärme-
kapazität bei konstantem Druck
∂Q
Cp ≡ ⋀︀ (6.1.6)
∂T p
C p − C V = T V α V2 B . (6.1.7)
C V = 3r ′ N k B . (6.1.9)
die Avogadro-Konstante oder Loschmidtsche Zahl und ν die Molzahl ist. Für die molare
1
Anmerkung: In harmonischer Näherung ist C p = C V , da α V = 0, siehe Abschnitt 6.3.
2
Pierre Louis Dulong, geboren 1785 in Rouen, gestorben 1838 in Paris. Alexis Thérèse Petit, gebo-
ren 1791 in Vesoul, gestorben 1820 in Paris.
216 6 Thermische Eigenschaften
d 3 pd 3 r A(p, r)e−βH(p,r)
∐︀Ã︀ = ∫ . (6.1.11)
∫ d 3 pd 3 r e−βH(p,r)
Dabei ist H(p, r) die klassische Hamilton-Funktion und β = 1⇑k B T. Gleichung (6.1.11) ist
ein zentrales Ergebnis der klassischen Thermodynamik. Wir sehen, dass wir, um den Mit-
telwert zu erhalten, über alle Konfigurationen p, r summieren (Integration) und dabei die
Konfiguration mit einem Boltzmann-Faktor wichten müssen. Dadurch werden Konfigura-
tionen mit hoher Energie weniger wahrscheinlich als solche mit niedriger Energie. Der Nen-
ner in (6.1.11) dient nur der Normierung.
p2
H=∑ + U eq + U elharm . (6.1.12)
i 2M
Hierbei läuft die Summation über i über alle Punkte des Bravais-Gitters. Für die mittlere
Energie erhalten wir dann:
dΓHe−βH
∐︀Ũ︀ = ∫
∂
−βH
= − ln ∫ dΓe−βH . (6.1.13)
∫ dΓe ∂β
Hierbei bezeichnet
dΓ = ∏ d 3 u i d 3 p i (6.1.14)
i
6.1 Spezifische Wärme 217
das Integral über alle d 3 p i d 3 u i , wobei u i die Auslenkung des i-ten Atoms ist. Die Berech-
nung von ∐︀Ũ︀ gelingt mit folgenden Substitutionen
1 1 3
u i = ⌈︂ ̃ui d3ui = ̃i
d u (6.1.15)
β β 3⇑2
1 1 3
p i = ⌈︂ ̃pi d3 pi = d ̃
pi . (6.1.16)
β β 3⇑2
−βH p2
∫ dΓe = ∫ ∏ d 3 ud 3 p exp (−β ⌊︀∑ + U eq + U elharm }︀)
i i 2M
1 3 3 ̃
p2 U elharm
=∫ ∏ d ̃
u d ̃
p exp (−β ⌊︀∑ + U eq
+ }︀)
i β3 i 2Mβ β
̃
p2
= β−3N e−βU {∫ ∏ d 3 u
̃d 3 ̃
eq
p exp (− ∑ − U elharm )(︀
i i 2M
−3N −βU eq
=β e F, (6.1.17)
wobei die Größe F in den geschweiften Klammern nicht von β abhängt. Damit erhalten wir
∂
ln [︀β−3N e−βU F⌉︀
eq
∐︀Ũ︀ = −
∂β
F (−3N β−3N−1 e−βU − β−3N U eq e−βU )
eq eq
=−
β−3N e−βU eq F
3N
= U eq + = U eq + 3N k B T . (6.1.18)
β
Wir finden also in der Tat das Ergebnis (6.1.8) und damit C V = 3N k B .
Wir wollen hier noch zwei Anmerkungen machen. Erstens erhalten wir für T = 0 das Ergeb-
nis ∐︀Ũ︀ = U eq . Dies zeigt, dass wir klassisch gerechnet haben und daher Nullpunktsschwin-
gungen nicht berücksichtigt haben. Zweitens ist U eq ⇑Atom ∼ 1 eV und daher groß gegen
k B T ∼ meV. Um einen Vergleich zwischen Theorie und Experiment zu machen, bieten sich
deshalb Messgrößen an, die nicht von U eq abhängen. Eine solche Messgröße ist gerade C V .
1. Bei hohen Temperaturen nähert sich die gemessene spezifische Wärme dem Dulong-
Petit Wert an. Teilweise liegt c p oberhalb dieses Wertes, was allerdings darauf zurückzu-
führen ist, dass der experimentelle Wert c p und der Dulong-Petit-Wert c V darstellt und
immer c p ≥ c V gilt.
218 6 Thermische Eigenschaften
1.0
(a) 0.4 (b)
0.8
0.3 Tm
cp (J / g K)
cp (J / g K)
0.6
Tm
0.2
0.4
Ge
0.1 Si
0.2
0.0 0.0
0 300 600 900 1200 1500 0 400 800 1200 1600 2000
Temperatur (K) Temperatur (K)
(c) 2.0
1.6
cp (J / g K)
1.2
0.8
Diamant
0.4
0.0
0 200 400 600 800 1000
Temperatur (K)
Abb. 6.1: Spezifische Wärme c p von Germanium (a), Silizium (b) und Diamant (c); Tm markiert
die Schmelztemperaturen. Um den Wert in J/mol K zu erhalten, muss mit der Molmasse von8
Si (28.08 g/mol), Ge (72.61 g/mol) und Diamant (12 g/mol) multipliziert werden. Der Dulong-Petit
Wert für C V (gestrichelte Linie) beträgt 0.882 J/g K für Si, 0.343 J/g mol für Ge und 2.075 J/g mol für
Diamant.
2. Bei tiefen Temperaturen ist das klassische Ergebnis völlig falsch. Man beobachtet eine
drastische Abnahme der spezifischen Wärme mit abnehmender Temperatur. Das Expe-
riment liefert c p ∝ T 3 .
Während wir die Abweichungen der experimentellen Daten vom Dulong-Petit Wert
bei hohen Temperaturen auf anharmonische Effekte zurückführen können, zeigen die
starken Abweichungen bei tiefen Temperaturen deutlich das Versagen der klassischen
Beschreibung. Wir müssen unsere Überlegungen deshalb auf eine quantenmechanische
Beschreibung erweitern. Der Übergang von der klassischen Beschreibung nach Dulong-
Petit zur quantenmechanischen Beschreibung entspricht dem Übergang vom Rayleigh-
Jeansschen zum Planckschen Strahlungsgesetz bei der Beschreibung des Spektrums eines
schwarzen Strahlers. Wir werden auf diese Analogie zwischen Phononen und Photonen
später in Abschnitt 6.1.7 nochmals zurückkommen.
6.1 Spezifische Wärme 219
E n = (n + 12 ) ħω (6.1.19)
möglich. Für ħω ≫ k B T kann ein solcher Oszillator keine Energie aus dem Bad aufnehmen
und er verbleibt im Grundzustand. Bei genügend hohen Temperaturen, d. h. ħω ≪ k B T, ist
das natürlich möglich. Dies ist in Abb. 6.2 anschaulich dargestellt.
ℏ𝜔 ≫ 𝑘B 𝑇 ℏ𝜔 ≪ 𝑘B 𝑇
E E
In einem Kristall liegt nun eine Vielzahl von Eigenfrequenzen ω qr vor. Mit abnehmender
Temperatur verbleibt eine immer größere Zahl dieser Oszillatoren im Grundzustand. Wir
sprechen von einem „Ausfrieren“ der Schwingungsfreiheitsgrade. Dieses führt dazu, dass die
spezifische Wärme für T → 0 auch gegen null geht. Wir wollen im Folgenden diese Situation
10
quantitativ erfassen.
∑ E n e−βE n
∐︀Ũ︀ = U + 3N
eq n
. (6.1.20)
∑ e−βE n
n
220 6 Thermische Eigenschaften
Wie bei der klassischen Betrachtung wird jeder Zustand mit einem Boltzmann-Faktor ge-
wichtet. Setzen wir (6.1.19) in (6.1.20) ein, so erhalten wir
∞
∑ (n + 12 ) ħωe−β(n+ 2 )ħω
1
∐︀Ũ︀ = U eq + 3N
n=0
∞
∑ e−β(n+ 2 )ħω
1
n=0
)︀
⌉︀
∞ [︀
⌉︀
⌉︀
⌉︀ e−βħω⇑2 ∑ nħωe−βħωn ⌉︀
⌉︀
⌉︀
⌉︀
⌉︀ 1 ⌉︀
= U eq + 3N ⌋︀ ħω + ⌈︀ .
n=0
∞ (6.1.21)
⌉︀
⌉︀
⌉︀ 2 −βħω⇑2 −βħωn ⌉︀
⌉︀
⌉︀
⌉︀
⌉︀ e ∑ e ⌉︀
⌉︀
]︀ n=0 ⌊︀
Mit x ≡ e−βħω finden wir
)︀
⌉︀
∞ [︀
⌉︀
⌉︀
⌉︀ ∑ nx n ⌉︀⌉︀
⌉︀
⌉︀
⌉︀ 1 ⌉︀
∐︀Ũ︀ = U + 3N ħω ⌋︀ + ∞ ⌈︀ .
eq n=0
(6.1.22)
⌉︀
⌉︀
⌉︀ 2 n ⌉︀
⌉︀
⌉︀
⌉︀
⌉︀ ∑ x ⌉︀
⌉︀
]︀ n=0 ⌊︀
Mit den Identitäten
∞
1
∑x =
n
(6.1.23)
n=0 1−x
∞
d ∞ n d 1 x
∑n⋅x =x⋅ ∑x =x⋅ =
n
. (6.1.24)
n=0 dx n=0 dx 1 − x (1 − x)2
erhalten wir dann
1 x 1
∐︀Ũ︀ = U eq + 3N ħω ( + ) = U eq + 3N ħω ( + ∐︀ñ︀) . (6.1.25)
2 1−x 2
Wir definieren das Scharmittel ∐︀ñ︀ = ∑ nx n ⇑ ∑ x n = x⇑(1 − x) und erhalten unter Benut-
zung von x ≡ e−ħω⇑k B T
1
∐︀ñ︀ = ħω
e kB T
−1
1
∐︀Ũ︀ = U eq
+ 3N ħω ( + ∐︀ñ︀) . (6.1.26)
2
Das Scharmittel ∐︀ñ︀ gibt die mittlere Anregungszahl des Oszillators bzw. die mittlere Beset-
zungszahl der entsprechenden Phononen im thermischen Gleichgewicht bei der Tempera-
tur T an.
Gleichung (6.1.26) stellt einen Spezialfall der allgemeinen Bose-Einstein-Verteilungsfunkti-
on dar, deren Ableitung in Anhang B gegeben ist. Da bei den Phononen die Teilchenzahl
nicht erhalten bleibt, taucht in der Verteilungsfunktion kein chemisches Potenzial µ auf.
Dies ist völlig analog zu einem Photonengas (siehe hierzu Abschnitt 6.1.7). Der Tempera-
turverlauf der Bose-Einstein-Verteilung ist in Abb. 6.3 grafisch dargestellt. Wir sehen, dass
∐︀ñ︀ ∝ k B T für k B T ≫ ħω, was der klassischen Erwartung entspricht.
6.1 Spezifische Wärme 221
2
<n>
1
Abb. 6.3: Die Bose-Einstein-Verteilungs-
funktion. Bei hohen Temperaturen nimmt
die Besetzungszahl in etwa proportional
0
zur Temperatur zu. Die Funktion (∐︀ñ︀ + 12 )
0 1 2 3 nähert sich für hohe Temperaturen dem
kBT / ћ klassischen Grenzfall (gestrichelt) an.
13
Während wir also für die Phononen die für Bosonen geltende Bose-Einstein-Verteilungs-
funktion verwenden müssen, könnten wir für klassische (unterscheidbare) Teilchen mit der
Energie E n die Maxwell-Boltzmann-Verteilung
e−E n ⇑k B T
∐︀ñ︀ = N (6.1.27)
∑ e−E n ⇑k B T
n
verwenden.
Dreidimensionales Gitter mit mehratomiger Basis: Wir hatten bei unserer obigen Dis-
kussion eine einatomige Basis angenommen. Liegt eine mehratomige Basis mit r ′ Atomen
vor, so haben wir statt 3N jetzt 3N ′ = 3r ′ N Schwingungsmoden vorliegen. Wir müssen dann
die Schwingungsfrequenzen ω qr sowohl mit den erlaubten q-Vektoren als auch den mögli-
chen Polarisationen r durchnummerieren. In Analogie zu (6.1.26) können wir die mittlere
Besetzungszahl von Phononen des Typs q, r bei der Temperatur T zu
1
∐︀n qr ̃︀ = ħω qr
(r = 1, 2, . . . , 3r ′ ) (6.1.28)
e kB T
−1
angeben. Für die mittlere Energie finden wir damit
ħω qr
∐︀Ũ︀ = U eq + ∑ 12 ħω qr + ∑ ħω qr
. (6.1.29)
q,r q,r e kB T
−1
)︁⌊︂⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ]︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂)︂ )︁⌊︂⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ]︂⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ )︂
Nullpunktsschwingungen thermische Anregungen
222 6 Thermische Eigenschaften
Wir sehen, dass sich dieser Ausdruck deutlich vom klassischen Dulong-Petit Resultat un-
terscheidet. Er enthält erstens die Nullpunktschwingungen und der Beitrag der thermisch
angeregten Gitterschwingungen nimmt zu tiefen Temperaturen hin stark ab, da die mittlere
Besetzungszahl ∐︀n(ω, T)̃︀ der Phononen stark abnimmt.
In der Praxis werden die Summen meist durch Integrale ersetzt, indem man die Zustands-
dichte Z(q) im Impulsraum oder D(ω) im Frequenzraum benutzt. Benutzen wir D(ω), so
können wir die mittlere Energie ausdrücken durch
ω D,r ω D,r
ħω
∐︀Ũ︀ = U eq + ∑ ∫ D r (ω)dω + ∑ ∫ ħωD r (ω) ∐︀n(ω, T)̃︀dω . (6.1.30)
r 2 r
0 0
Hierbei gibt der 2. Term auf der rechten Seite wiederum den Beitrag der Nullpunktsschwin-
gungen an. Die charakteristische Abschneidefrequenz ω D werden wir in Abschnitt 6.1.5 bei
der Diskussion des Debye-Modell motivieren. Im 3. Term auf der rechten Seite kann die In-
tegrationsgrenze meist in sehr guter Näherung gegen unendlich verschoben werden, da die
mittlere Besetzungszahl ∐︀n(ω, T)̃︀ für große Frequenzen gegen null geht.
∂∐︀Ũ︀ ∂ ħω qr
CV = ⋁︀ = ∑ ħω qr
. (6.1.31)
∂T V q,r ∂T
e kB T
−1
Wir wollen diesen Ausdruck für den Grenzfall hoher und niedriger Temperaturen analysie-
ren.
1. Hohe Temperaturen: k B T ≫ ħω qr
In diesem Grenzfall können wir die Exponentialfunktion entwickeln und erhalten
kB T
∐︀n qr ̃︀ ≃ . (6.1.32)
ħω qr
∂ kB T
CV = ∑ ħω qr = ∑ k B = 3r ′ N k B . (6.1.33)
q,r ∂T ħω qr q,r
Wir finden also das klassische Dulong-Petit Gesetz. Dies war nach der obigen Diskussi-
on (vergleiche hierzu auch Abb. 6.2) zu erwarten. Für k B T ≫ ħω qr nehmen alle Schwin-
gungsmoden Energie aus dem Wärmebad auf. Es sind keine Freiheitsgrade eingefroren
und das System verhält sich klassisch.
6.1 Spezifische Wärme 223
2. Tiefe Temperaturen: k B T ≪ ħω qr
Die Diskussion des Tieftemperaturverhaltens ist etwas schwieriger. Um einen einfachen
Ausdruck abzuleiten, werden wir einige Näherungen machen. Zunächst nehmen wir an,
dass N groß ist (großer Kristall), so dass die Zustände im q-Raum dicht liegen. Wir kön-
nen dann die Summation über q in eine Integration überführen:
V
∑ → ∑ ∫ d qZ(q) = ∑ ∫ d q
3 3
. (6.1.34)
q,r r r (2π)3
1. BZ 1. BZ
1.0
0.6
akustische Zweige
0.4
Abb. 6.4: Zur Veranschaulichung der Nä-
0.2 herungen bei der Ableitung des Tieftem-
peraturgrenzfalles der Wärmekapazität.
𝝎 = 𝒌𝐁 𝑻/ℏ Da k B T klein ist, können die optischen
0.0 Moden vernachlässigt und die akustischen
-0.8 -0.4 0.0 0.4 0.8 Zweige durch lineare Dispersionsrelationen
qa / angenähert werden.
16
wobei wir für die mittlere Schallgeschwindigkeit der drei akustischen Moden
1 1 3 dΩ 1
= ∑∫ (6.1.37)
v s3 3 i=1 4π v i3
∞
verwendet haben. Das Integral ∫0 dx(︀x 3 ⇑(ex − 1)⌋︀ ergibt π 4 ⇑15, so dass wir
2π 2 kB T 3
CV = V kB ( ) (6.1.38)
5 ħv s
erhalten. Dieses Ergebnis ist in guter Übereinstimmung mit dem experimentell beobach-
teten T 3 -Verhalten der Wärmekapazität bei tiefen Temperaturen.
ΘE 2 eΘ E ⇑T
C VE = 3N k B ( ) . (6.1.42)
T (︀eΘ E ⇑T − 1⌋︀2
3
A. Einstein, Die Plancksche Theorie der Strahlung und die Theorie der spezifischen Wärme, Annalen
der Physik 327 (1), 180–190 (1907).
6.1 Spezifische Wärme 225
Wir erhalten also wiederum das Dulong-Petitsche Gesetz als Hochtemperaturgrenzfall. Fer-
ner erhalten wir eine starke Abnahme der Wärmekapazität zu tiefen Temperaturen hin. Dies
stimmt zwar mit dem Experiment qualitativ überein, das experimentell häufig beobachtete
T 3 -Verhalten bei tiefen Temperaturen wird allerdings nicht beschrieben.
Abb. 6.5 zeigt die molare Wärmekapazität von Diamant zwischen etwa 200 und 1300 K. Wir
sehen, dass das Einstein-Modell in diesem Temperaturbereich die experimentellen Daten
recht gut beschreibt. Bei tieferen Temperaturen treten allerdings starke Abweichungen auf.
Dies ist anschaulich klar, da in diesem Temperaturbereich die akustischen Phononen die do-
minierende Rolle spielen und deren Zustandsdichte sicherlich nicht mit D(ω) = 3N δ(ω −
ω E ) beschrieben werden kann. Die Einstein-Näherung ist immer dann gut, wenn die opti-
schen Phononen dominieren, die wegen ihrer häufig sehr flachen Dispersion gut mit dieser
Zustandsdichte beschrieben werden können.
24
Diamant
20
cp (J / mol K)
16 Einstein-Näherung
12
4
𝚯𝐄 = 𝟏𝟑𝟐𝟎 𝐊
0 Abb. 6.5: Molare Wärmekapazität von Dia-
0.0 0.2 0.4 0.6 0.8 1.0
mant verglichen mit der Einstein-Näherung
T / E unter Benutzung von Θ E = 1320 K.
17
Integral über die 1. Brillouin-Zone durch ein Integral über eine Kugel mit Radius q D
ersetzen. Dabei muss der Debye-Wellenvektor q D gerade so gewählt werden, dass das In-
tegral genau N Wellenvektoren enthält. Dies stellt bei 3 Dispersionszweigen sicher, dass
3N-Schwingungsmoden auftreten.
6.1 Spezifische Wärme 227
Wir müssen zunächst die Länge des Debye-Wellenvektors q D bestimmen. Wir wissen, dass
im q-Raum ein Zustand das Volumen (2π⇑L)3 einnimmt. Da wir pro Dispersionszweig
N Zustände vorliegen haben und diese in einer Kugel mit Radius q D enthalten sein müs-
sen, erhalten wir
2π 3 4 3
N( ) = πq D (6.1.44)
L 3
und damit
N 1⇑3
q D = (6π 2 ) . (6.1.45)
V
Analog erhalten wir für die Debye-Frequenz
N 1⇑3
ω D,i = q D v i = v i (6π 2 ) , (6.1.46)
V
wobei v i die Schallgeschwindigkeit des i-ten Dispersionszweiges ist. Die Zustandsdichte für
q2 2
jeden Dispersionszweig ist laut (5.3.26) durch D i (ω) = 2πV 2 v i = 2πV 2 ωv 3 gegeben. Wir sehen,
i
dass q D und ω D durch die Zellendichte N⇑V bestimmt werden, die wegen r ′ = 1 der Atom-
dichte entspricht. Die durch das Debye-Modell gemachte Vereinfachung der Phononen-
Zustandsdichte ist in Abb. 6.6 veranschaulicht. Während die Zustandsdichte in der Debye-
Näherung einer Parabel folgt, kann die wirkliche Zustandsdichte eine reichhaltige Struktur
zeigen. Insbesondere können scharfe Spitzen durch van Hove-Singularitäten auftreten (siehe
Abschnitt 5.3.3). Die Größe der Debye-Frequenz ω D ist dadurch bestimmt, dass das Integral
∫ D(ω)dω gerade die Anzahl der Schwingungsmoden ergeben muss. Die Fläche unter den
beiden D(ω)-Kurven in Abb. 6.6 muss deshalb genau gleich sein.
Mit den gemachten Näherungen können wir jetzt die Wärmekapazität schreiben als
qD
V ∂ 3 ħv i q
C VD = ∑ ∫ 4πq dq ħv i q⇑k B T
2
. (6.1.47)
(2π) ∂T i=1
3 e −1
0
25
Debye-
D() (109 s/cm3)
20 Näherung
realer
15 Festkörper
10
5
Abb. 6.6: Phononen-Zustandsdichte ei-
nes realen Festkörpers und die Debye-
𝝎𝐃
Näherung. Die Debye-Frequenz ω D bzw.
0 der Debye-Wellenvektor q D ist so gewählt,
0 10 20 30 40
dass die Flächen unter den Kurven gleich
(1012 s-1) sind.
21
228 6 Thermische Eigenschaften
Verwenden wir wiederum die durch (6.1.37) definierte mittlere Schallgeschwindigkeit v s der
drei Dispersionszweige, so erhalten wir
qD
∂ 3ħv s q 3 dq
C VD =V ∫ ħv s q⇑k B T . (6.1.48)
∂T 2π 2 e −1
0
ħω D ħv s q D ħv s N 1⇑3
ΘD ≡ = = (6π 2 ) (6.1.49)
kB kB kB V
Θ D ⇑T
T 3 x 4 ex dx
C VD = 9N k B ( ) ∫ . (6.1.50)
ΘD (ex − 1)2
0
Dies ist das berühmte Debye-Resultat für die Wärmekapazität, das in Abb. 6.7 grafisch darge-
stellt ist. Wir sehen, dass die molare Wärmekapazität durch einen materialspezifischen Para-
meter, die Debye-Temperatur Θ D , ausgedrückt werden kann. Das gleiche Ergebnis erhalten
wir, wenn wir die innere Energie gemäß U = ∫0 D ħωD(ω)∐︀n(ω, T)̃︀dω mit der Zustands-
ω
24
𝟑𝑵𝒌𝐁
20
cV (J/mol K)
16
12
D
Debye-Modell
8
0
Abb. 6.7: Spezifische Wärme berech- 0.0 0.4 0.8 1.2 1.6 2.0
net mit der Debye-Näherung (6.1.50). T / D
22
Das Tieftemperaturergebnis erhalten wir dabei wiederum, indem wir die obere Integrati-
onsgrenze gegen Unendlich gehen lassen. Das Integral ergibt in diesem Fall 4π 4 ⇑15. Das
erhaltene Ergebnis ist identisch zu (6.1.38). Wir sehen also, dass die Debye-Näherung das
4
Dabei benutzen wir für T ≫ Θ D , d. h. x ≪ 1, die Näherungen ex ≃ 1 und (ex − 1)2 ≃ x 2 .
6.1 Spezifische Wärme 229
Dulong-Petitsche Gesetz als Hochtemperaturgrenzfall liefert. Ferner erhalten wir aber auch
für tiefe Temperaturen das experimentell häufig beobachtete T 3 -Verhalten.5
Ein typisches experimentelles Ergebnis zum Tieftemperaturverhalten der Wärmekapazität
des Kristallgitters ist in Abb. 6.8 gezeigt, wo die molare Wärmekapazität von festem Argon
gegen die 3. Potenz der Temperatur geplottet ist. Es ergibt sich in sehr guter Näherung eine
Gerade.
20 Argon
cp (mJ/mol K)
16
12
8
Abb. 6.8: Molare Wärmekapazität von fes-
4 tem Argon geplottet gegen T 3 . Das ex-
perimentelle Ergebnis stimmt sehr gut
0
mit dem Debyeschen T 3 -Gesetz überein
0 2 4 6 8 (nach L. Finegold und N. E. Philips, Phys.
3 3
T (K ) Rev. 177, 1383–1391 (1969)).
23
Die Debye-Temperatur spielt eine wichtige Rolle in der Festkörperphysik. Die Debye-Tem-
peraturen der chemischen Elemente sind in Abb. 6.9 zusammengestellt. Die Größe der De-
bye-Temperatur ist ein Maß für die Größe der in einem Material vorkommenden Phononen-
frequenzen. Die Debye-Temperatur gibt auch den Grenzbereich zwischen einer klassischen
und einer quantenmechanischen Beschreibung der thermischen Eigenschaften des Kristall-
gitters an:
Dieses Ergebnis kann experimentell zum Beispiel anhand von nur eine Monolage dicken Ad-
sorbatfilmen von Gasatomen auf Graphitoberflächen beobachtet werden.6 Die adsorbierten
Gasatome werden nur schwach durch Van der Waals-Kräfte an die Unterlage gebunden und
bilden zweidimensionale Kristalle aus. Die gemessene spezifische Wärme verläuft tatsächlich
proportional zu T 2 .
2
Im Rahmen des Debye-Modells gilt für 3D-Systeme D(ω) = 2π 3V ω
2 v 3 , wobei v s die mittle-
s
re Schallgeschwindigkeit der akustischen Phononenzweige ist. Mit den Abkürzungen x =
ħω⇑k B T, dx = ħdω⇑k B T und x D = ħω D ⇑k B T = Θ D ⇑T erhalten wir
xD
3V kB T 3 x2
N ph = 2 3( ) ∫ x dx . (6.1.55)
2π v s ħ e −1
0
Für tiefe Temperaturen geht x D → ∞ und das Integral wird konstant. Die Phononenzahl
nimmt folglich proportional zu T 3 zu. Für hohe Temperaturen ist x ≪ 1. Wir können dann
die Exponentialfunktion durch 1 + x annähern und das Integral ergibt 12 (Θ D ⇑T)2 . Die Pho-
nonenzahl nimmt folglich proportional zu T zu. Insgesamt erhalten wir somit das Ergebnis:
)︀
⌉︀
⌉︀T 3 für T ≪ ΘD
N ph ∝ ⌋︀ (6.1.56)
⌉︀
⌉︀ T für T ≫ ΘD .
]︀
Als nächstes wollen wir die innere Energie der Nullpunktsschwingungen abschätzen. Ge-
mäß (6.1.30) gilt
ωD
ħω
U0 = ∫ D(ω)dω . (6.1.57)
2
0
3V ω 2
Setzen wir die Zustandsdichte D(ω) = 2π 2 v s3
ein und benutzen v s3 = ω 3D ⇑q 3D sowie
q 3D = 6π 2 N⇑V , so erhalten wir
U 0 = 98 N k B Θ D . (6.1.58)
6
S. V. Hering, S. W. Sciver and O. E. Vilches, Apparent new phase of monolayer 3 He and 4 He films
adsorbed on grafoil as determined from heat capacity measurements, J. Low Temp. Phys. 25, 793–
805 (1976).
6.1 Spezifische Wärme 231
Be B C N O F Ne
1440 Debye Temperatur (K) ... 2230 ... ... ... 75
2.00 Thermische Leitfähigkeit bei 300K (W/cmK) 0.27 1.29 ... ... ... ...
Na Mg Al Si P S Cl Ar
158 400 ... 428 645 ... ... ... 92
1.41 1.56 2.37 1.48 ... ... ... ...
K Ca Sc Ti V Cr Mn Fe Co Ni Cu Zn Ga Ge As Se Br Kr
91 230 360 420 380 630 410 470 445 450 343 327 320 374 282 90 ... 72
1.02 ... 0.16 0.22 0.31 0.94 0.08 0.80 1.00 0.91 4.01 1.16 0.41 0.6 0.50 0.02 ... ...
Rb Sr Y Zr Nb Mo Tc Ru Rh Pd Ag Cd In Sn Sb Te I Xe
56 147 280 291 275 450 ... 600 480 274 225 209 108 200 211 153 ... 64
0.58 ... 0.17 0.23 0.54 1.38 0.51 1.17 1.50 0.72 4.29 0.97 0.82 0.67 0.24 0.02 ... ...
Cs Ba La Hf Ta W Re Os Ir Pt Au Hg Tl Pb Bi Po At Rn
38 110 142 252 240 400 430 500 420 240 165 71.9 78.5 105 119 ... ... 64
0.36 ... 0.14 0.23 0.58 1.74 0.48 0.88 1.47 0.72 3.17 ... 0.46 0.35 0.08 ... ... ...
Fr Ra Ac
... ... ... ...
... ... ...
Ce Pr Nd Pm Sm Eu Gd Tb Dy Ho Er Tm Yb Lu
... ... ... ... ... ... ... 200 ... 210 ... ... ... 120 210 ...
0.11 0.13 0.16 ... 0.13 ... 0.11 0.11 0.11 0.16 0.14 0.17 0.35 0.16
Th Pa U Np Pu Am Cm Bk Cf Es Fm Md No Lr
... 163 ... 207 ... ... ... ... ... ... ... ... ... ... ... ...
0.54 ... 0.28 0.06 0.07 ... ... ... ... ... ... ... ... ...
Vergleichen wir diese Energie mit der thermischen Energie (3. Term auf der rechten Seite
von (6.1.30))
ωD
1
U th (T) = ∫ ħωD(ω) dω , (6.1.59)
eħω⇑k B T −1
0
Wir können nun diesen Ausdruck benutzen (vergleiche hierzu auch Abschnitt 5.3.3), um die
mittlere Photonenzahl zu bestimmen, deren Frequenz ω = c⋃︀k⋃︀ im Intervall (︀ω, ω + dω⌋︀ liegt.
Diese erhalten wir, indem wir die erlaubten Impulszustände über das gesamte Volumen des
k-Raumes aufsummieren, das in einer Kugelschale mit dem inneren Radius k = ω⇑c und
dem äußeren Radius k + dk = (ω + dω)⇑c enthalten ist. Wir müssen ferner noch berück-
sichtigen, dass es für Photonen zwei Polarisationsrichtungen gibt (es gibt nur transversale
elektromagnetische Wellen), was wir durch einen zusätzlichen Faktor 2 berücksichtigen. Wir
erhalten somit
8π ω 2 dω
2η(k)(4πk 2 dk) = . (6.1.61)
(2πc)3 eħω⇑k B T − 1
Wir wollen nun die mittlere Energiedichte u(ω, T)dω der Photonen beider Polarisations-
richtungen im Frequenzbereich zwischen ω und ω + dω berechnen. Da jedes Photon in die-
sem Intervall die Energie ħω hat, erhalten wir
ħ ω 3 dω
u(ω, T)dω = . (6.1.63)
π 2 c 3 eħω⇑k B T − 1
Dieser Ausdruck stellt das in Abschnitt 5.4.1 erwähnte Plancksche Strahlungsgesetz dar, das
wir mit den für die Beschreibung des Phononengases eingeführten Konzepten sehr einfach
ableiten können.
6.2 Anharmonische Effekte 233
Dieses Ergebnis, dass die Dichte U der über alle Frequenzen integrierten Strahlungsenergie
eines Photonengases proportional zu T 4 ist, kennen wir als das Stefan-Boltzmannsche Ge-
setz. Differenzieren wir dieses Ergebnis nach der Temperatur und multiplizieren mit dem
Volumen, so erhalten wir die Wärmekapazität des Photonengases zu
4π 2 kB T 3
=V kB ( ) .
photon
CV (6.1.65)
15 ħc
Um den entsprechenden Ausdruck für das Phononengas zu erhalten, müssen wir nur die
Lichtgeschwindigkeit c durch die Schallgeschwindigkeit v s ersetzen und berücksichtigen,
dass wir beim Licht nur 2 transversale Moden haben, bei den Phononen dagegen 2 trans-
versale und eine longitudinale Mode.8 Wir müssen deshalb noch mit dem Faktor 32 mul-
tiplizieren. Wir sehen sofort, dass wir dann die Tieftemperaturnäherung (6.1.38) der Wär-
mekapazität des Phononengases erhalten. Umgekehrt hätten wir auch Gleichung (6.1.38)
aufintegrieren können und hätten dadurch das Stefan-Boltzmann-Gesetz erhalten.
1. Es gibt keine thermische Ausdehnung. Dies erkennen wir sofort aus Abb. 6.10. Erhöhen
wir die Temperatur, so werden zwar höhere Schwingungszustände angeregt, der Schwer-
punkt der Schwingungszustände bleibt allerdings bei einem parabelförmigen, harmoni-
schen Potenzial unverändert.
2. Die elastischen Konstanten sind druck- und temperaturunabhängig.
3. Es gilt C p = C V , d. h. die üblicherweise im Experiment gemessene Wärmekapazität C p
ist bei hohen Temperaturen T > Θ D konstant.
4. Es gibt keine Wechselwirkung zwischen den Gitterschwingungen.9
∞ 4 ∞ x3
7
Wir schreiben ∫ u(ω, T)dω = ħ
π2 c 3
( k BħT ) ∫e x −1
dx mit x = ħω⇑k B T. Das Integral ergibt
0 0
∞
x3 π4
∫ e x −1
dx = 15
, womit wir das Ergebnis (6.1.64) erhalten.
0
8
Im Tieftemperaturgrenzfall können wir die optischen Moden vernachlässigen.
9
Dies ist völlig analog zu elektromagnetischen Wellen, bei denen Wechselwirkungen erst dann auf-
treten, wenn die Polarisation P in nichtlinearer Weise mit dem elektrischen Feld zusammenhängt.
234 6 Thermische Eigenschaften
In realen Kristallen ist keine dieser Konsequenzen gegeben. Dies zeigt uns, dass die Vernach-
lässigung anharmonischer Effekte zwar eine bequeme aber in vielen Fällen zu grobe Verein-
fachung war. Wir werden deshalb jetzt anharmonische Effekte in unsere Überlegungen mit
einbeziehen. Dabei werden wir die anharmonischen Effekte in zwei Gruppen aufteilen:
∎ Gleichgewichtseigenschaften:
• thermische Ausdehnung
• Druck- und Temperaturabhängigkeit der elastischen Konstanten
∎ Transporteigenschaften:
• Wärmeleitfähigkeit
∂2 U
mü = − ⋁︀ u = −ku (6.2.3)
∂x 2 x 0
u = u 0 e ı(qx−ωt) . (6.2.4)
Alle ω und q sind hierbei unabhängig voneinander und es gilt das Superpositionsprinzip.
Das heißt, falls u 1 (x, t) und u 2 (x, t) Lösungen der linearen Differentialgleichung sind, so
ist es auch jede Linearkombination dieser beiden Lösungen.
∂2 U 3 ∂3 U
mü = − ⋁︀ u − ⋁︀ u 2 . (6.2.5)
∂x 2 x 0 6 ∂x 3 x 0
Es tauchen also die Terme u 2p+1 , u p+1 u p , u p u p−1 und u 2p−1 auf, die quadratisch in der Aus-
lenkung sind. Aufgrund dieser quadratischen Terme gilt das lineare Superpositionsprinzip
nicht mehr. Dies lässt sich sofort anhand der Linearkombination
u(x, t) = u 01 e ı(q 1 x−ω 1 t) + u 02 e ı(q 2 x−ω 2 t) (6.2.7)
aus zwei ebenen Wellen zeigen. Aufgrund der quadratischen Terme erhalten wir jetzt Terme
der Form
u 01 u 02 e ı(︀(q 1 +q 2 )x−(ω 1 +ω 2 )t⌋︀ . (6.2.8)
Wir sehen, dass wir aufgrund des anharmonischen Potenzials eine Kopplung der beiden
Wellen zu einer neuen Welle mit
ω3 = ω1 + ω2 q3 = q1 + q2 (6.2.9)
236 6 Thermische Eigenschaften
erhalten. Solche Prozesse nennen wir Drei-Phononen-Prozesse. Es lässt sich leicht zeigen,
dass bei Hinzunahme des u 4 -Terms dann auch Vier-Phononen-Prozesse möglich sind. Die-
ser Prozess und solche noch höherer Ordnung sind allerdings wesentlich unwahrscheinli-
cher als der Drei-Phononen-Prozess, da der Betrag der anharmonischen Terme mit zuneh-
mender Ordnung üblicherweise stark abnimmt.
Die Drei-Phononen-Prozesse sind sehr wichtig. Würde es solche Prozesse nicht geben, so
wären die Phononen völlig entkoppelt und eine einmal im Kristall angeregte Gitterschwin-
gung würde für eine unendliche Zeit fortbestehen. Es könnte sich dann in einem Kristall
auch kein thermisches Gleichgewicht einstellen. Durch die Drei-Phononen-Prozesse sind
nun Wechselwirkungen zwischen den Phononen möglich, bei denen entweder zwei Phono-
nen in ein neues umgewandelt werden können oder andersherum ein Phonon in zwei neue
Phononen zerfällt.
Für Drei-Phononen-Prozesse gilt der Energieerhaltungssatz
ħω 3 = ħω 1 + ħω 2 (6.2.10)
q3 + G = q1 + q2 (6.2.11)
für die Wellenvektoren. Diese Gleichung lässt sich auch als Impulserhaltungssatz auffassen,
da ħq als der Quasi-Impuls eines Phonons aufgefasst werden kann. Der reziproke Gitter-
vektor G ist stets so zu wählen, dass sämtliche Wellenvektoren innerhalb der 1. Brillouin-
(a) (b) 𝒒𝟏
𝒒𝟏
𝒒𝟐
𝒒𝟐 𝒒𝟑 𝒒𝟑
𝑮
(c)
1.0 1. Brillouin-Zone
Abb. 6.11: Drei-Phononen-Prozesse in ei-
𝐿
nem zweidimensionalen quadratischen Git- 0.8 𝑮
ter: (a) Normalprozess und (b) Umklappro-
(bel. Einh.)
Zone liegen. Nach Rudolf Ernst Peierls10 bezeichnen wir Drei-Phononen-Prozesse, bei de-
nen G = 0 gilt, als Normalprozesse und solche, bei denen G ≠ 0, als Umklappprozesse.
In Abb. 6.11 sind ein Normalprozess und ein Umklappprozess für ein zweidimensionales
quadratisches Gitter dargestellt. Die 1. Brillouin-Zone ist ein Quadrat mit der Seiten-
länge 2π⇑a. Bei einem Normalprozess liegt der Summenwellenvektor q3 innerhalb der
1. Brillouin-Zone. Bei einem Umklappprozess reicht hingegen der Vektor q1 + q2 über
den Rand der 1. Brillouin-Zone hinaus. Erst durch die Wahl eines geeigneten reziproken
Gittervektors G wird erreicht, dass q3 wieder innerhalb der 1. Brillouin-Zone liegt. Aller-
dings ist jetzt q3 den Wellenvektoren q1 und q2 mehr oder weniger entgegengesetzt. Daher
rührt der Name Umklappprozess. Wir werden bei der Diskussion der Wärmeleitfähigkeit
in Abschnitt 6.4 sehen, dass die Häufigkeit von Umklappprozessen wesentlich für die Größe
des Wärmewiderstands ist.
Zur Berechnung von ∐︀ũ︀ benutzen wir (6.2.2) und die Tatsache, dass die anharmonischen
Terme −bu 3 und −cu 4 klein sind gegenüber au 2 . Wir entwickeln daher und erhalten mit
β = 1⇑k B T
Die Integrale mit den ungeraden Potenzen in u verschwinden aus Symmetriegründen, wor-
aus sofort folgt, dass in harmonischer Näherung ∐︀ũ︀ = 0, d. h. die Gleichgewichtsposition
der Atome bleibt gleich und wir haben keine thermische Ausdehnung. Mit den beiden Inte-
gralen
∞ ⌋︂
4 −βau 2 3 π β
∫ duβbu e = b (6.3.6)
4 (βa)5⇑2
−∞
∞ ⌋︂
−βau 2 π
∫ due = (6.3.7)
(βa)1⇑2
−∞
3b
∐︀ũ︀ = kB T . (6.3.8)
4a 2
Die relative Längenänderung eines Kristalls ist durch ∐︀ũ︀⇑R 0 gegeben, wobei R 0 der Gleich-
gewichtsabstand der Atome ist. Damit ergibt sich für den linearen thermischen Ausdeh-
nungskoeffizienten
1 ∂∐︀ũ︀ 3b k B
αL = ⋁︀ = 2 . (6.3.9)
R 0 ∂T p 4a R 0
Wir sehen, dass die thermische Ausdehnung null wird, wenn b = 0. In diesem Fall haben
wir ein völlig symmetrisches Potenzial vorliegen. Dies ist in Abb. 6.12 veranschaulicht. Mit
zunehmender Temperatur werden höhere Schwingungszustände besetzt. Bei einem asym-
metrischen Potenzial wächst dann der Gleichgewichtsabstand der Atome an, während er bei
einem völlig symmetrischen Potenzial gleich bleibt.
6.3 Thermische Ausdehnung 239
𝑼 𝒖 𝐡𝐚𝐫𝐦 =𝟎 𝑼𝐡𝐚𝐫𝐦
𝒖
𝒙𝟎
𝒙 Abb. 6.12: Zur Veranschaulichung der ther-
mischen Ausdehnung durch anharmonische
U
Effekte. Bei höherer Temperatur werden höhere
Schwingungszustände besetzt, deren Schwer-
punkte für ein anharmonisches Potenzial bei
größeren Gleichgewichtsabständen liegen. Dies
führt im thermischen Mittel zu einem größeren
Atomabstand.
⎨ ⎬
⎝ ′ ⎠
T
p=−
∂ ⎝U − T ∫ dT ∂ U(T ′ , V )⎠ .
⎝ ′ ⎠ (6.3.11)
∂V ⎝ T ∂T ⎠
⎪ 0 ⎮
Mit (vergleiche (6.1.29))
ħω qr
∐︀Ũ︀ = U eq + ∑ 12 ħω qr + ∑ ħω qr
(6.3.12)
q,r e −1
q,r kB T
( ∂T )
∂p
∂V
( ) = − ∂p V , (6.3.14)
∂T p ( ∂V )
T
folgt mit ( ∂T ) = 0, dass V unabhängig von T ist und deshalb der thermische Ausdehnungs-
∂p
V
koeffizient verschwindet.
∂S ∂S ∂S ∂p
( ) =( ) +( ) ( ) . (6.3.16)
∂T V ∂T p ∂p T ∂T V
Da C V = ( ∂U ) = T ( ∂T
∂T V
∂S
)V und C p = ( ∂U ) = T ( ∂T
∂T p
∂S
) p erhalten wir durch Multiplikation
von (6.3.16) mit T:
∂S ∂p
CV = C p + T ( ) ( ) . (6.3.17)
∂p T ∂T V
15
Es gilt dV = ( ∂V
∂p
) d p + ( ∂V ) dT. Betrachten wir eine Änderung, die bei konstantem Volumen
∂T p
T
∂p
stattfindet, so ist dV = 0 und wir erhalten ( ∂V ) = − ( ∂V
∂T p ∂p
) ( ∂T ) .
T V
6.3 Thermische Ausdehnung 241
∂V ∂p
CV = C p − T ( ) ( ) . (6.3.18)
∂T p ∂T V
Wir können ferner
∂V ∂V
dV = ( ) dT + ( ) dp (6.3.19)
∂T p ∂p T
bilden und berücksichtigen, dass für einen Prozess bei konstantem Volumen dV = 0. Wir
erhalten somit
∂V ∂V ∂p
0=( ) +( ) ( ) . (6.3.20)
∂T p ∂p T ∂T V
Formen wir diesen Ausdruck um, so ergibt sich
∂p ( ∂V )
∂T p
( ) =− . (6.3.21)
∂T V ( ∂V
∂p
)
T
Diese wichtige Beziehung lässt sich mit Hilfe des thermischen Ausdehnungskoeffizienten
α V = V1 ( ∂V ) und der isothermen Kompressibilitat bzw. des inversen Bulk-Moduls B1 =
∂T p
− V1 ( ∂V
∂p
) ausdrücken. Wir erhalten für die Differenz der Wärmekapazitäten
T
C p − C V = T V Bα V2 . (6.3.23)
Für ein harmonisches Potenzial hängt der Druck zum Aufrechterhalten eines bestimmten
Volumens nicht von T ab. Aus (6.3.22) folgt dann C p = C V und α V = 0.
Hierbei haben wir B = − V1 ∂V ⋃︀ benutzt und n r (q) ist die Planck-Verteilung. Für die spezi-
∂p T
fische Wärme erhielten wir (vergleiche (6.1.31))
1 ∂∐︀Ũ︀ 1 ∂ ħω qr
cV = ⋁︀ = ∑ ħω qr
(6.3.26)
V ∂T V V q,r ∂T
e kB T
−1
oder für den Beitrag der Mode (q, r)
1 ∂
c V ,r (q) = ħω qr n r (q) . (6.3.27)
V ∂T
Man definiert nun den Grüneisen-Parameter
und
∑ γ q,r c V ,r (q)
q,r
γ≡ . (6.3.29)
∑ c V ,r (q)
q,r
Setzen wir den Ausdruck (6.3.28) für den Grüneisen-Parameter in (6.3.13) ein, so erhalten
wir nach Multiplikation mit V die Zustandsgleichung
Hierbei ist U(T) die gesamte innere Energie einschließlich des Beitrags der Nullpunkts-
schwingungen.
Der Grüneisen-Parameter drückt aus, dass die relative Frequenzänderung der Gitterschwin-
gungen proportional zur relativen Volumenänderung ist. Die typischen Werte des Grünei-
sen-Parameters γ liegen bei etwa 2 und sind relativ unabhängig vom Material. Im Ausdruck
für den thermischen Ausdehnungskoeffizienten taucht der Bulk-Modul im Nenner auf. Wir
erwarten deshalb als Faustregel, dass weiche Materialien einen großen thermischen Ausdeh-
nungskoeffizienten besitzen. Da der Bulk-Modul nur schwach von der Temperatur abhängt,
wird der Temperaturverlauf der thermischen Ausdehnung fast ausschließlich von der spezi-
fischen Wärme bestimmt. Dies ist für viele Materialien in sehr guter Übereinstimmung mit
der experimentellen Beobachtung. Bei tiefen Temperaturen besitzt die thermische Ausdeh-
nung aufgrund des T 3 -Verhaltens von c V eine starke Temperaturabhängigkeit, während sie
bei hohen Temperaturen dann fast konstant wird.
6.4 Wärmeleitfähigkeit 243
5 Silizium
C
4
L (10 K )
-1
-6
0
Abb. 6.13: Temperaturabhängigkeit des
-1 Längenausdehnungskoeffizienten von Sili-
0 400 800 1200 zium (nach Y. Okada, Y. Tokumaru, J. Appl.
T (K) Phys. 56, 314 (1984)).
33
Das in Abb. 6.13 gezeigte Beispiel macht deutlich, dass es nicht immer möglich ist, den
Grüneisen-Parameter durch Messung der thermischen Ausdehnung und der spezifischen
Wärme zu bestimmen. Besser ist die direkte Messung der Frequenzverschiebung der Gitter-
schwingungen bei Änderung des Volumens. Zum Beispiel kann der Grüneisen-Parameter
der optischen Phononen zuverlässig bestimmt werden, indem man die Druckverschiebung
von Raman-Spektren misst. Ferner erlauben Ultraschallexperimente die Messung der An-
harmonizität der akustischen Phononenzweige.
6.4 Wärmeleitfähigkeit
In Festkörpern wird Wärme sowohl durch Phononen als auch durch Elektronen transpor-
tiert. In Metallen überwiegt üblicherweise der Beitrag der Elektronen. Dies bedeutet aber
nicht, dass Isolatoren schlechte Wärmeleiter sind. So ist bei tiefen Temperaturen die thermi-
sche Leitfähigkeit von einigen kristallinen Isolatoren (z. B. Al2 O3 , SiO2 ) größer als diejenige
von Kupfer.
Im Gegensatz zu den bisher diskutierten thermischen Eigenschaften des Kristallgitters ist
die Wärmeleitfähigkeit keine Gleichgewichtsgröße. Ein Wärmestrom wird von einem Tem-
244 6 Thermische Eigenschaften
J h = −κ∇T . (6.4.1)
Dabei sorgt das Minuszeichen dafür, dass die Wärme vom heißen zum kalten Ende der Probe
fließt. Die Einheit der Wärmeleitfähigkeit ist W/m K.
Eine Nebenbedingung zu (6.4.1) ist üblicherweise die Forderung, dass kein Netto-Teilchen-
fluss stattfindet. Das heißt, es fließen genauso viele Teilchen von links nach rechts wie von
rechts nach links: JTl = JrT . Allerdings haben die vom wärmeren Ende kommenden Teilchen
eine höhere mittlere Energie, so dass J hl ≠ Jrh . Im Allgemeinen ist ferner κ wie jeder andere
Transportkoeffizient eines Festkörpers eine tensorielle Größe. Nur in isotropen Festkörpern
ist κ ein Skalar.
6.4.2 Transporttheorie
Bei der Diskussion der spezifischen Wärme waren die Größen ∐︀Ũ︀ und ∐︀ñ︀ thermische
Gleichgewichtsgrößen für eine bestimmte Temperatur. Bei der Diskussion der Wärmeleit-
fähigkeit haben wir es jetzt mit einer räumlich variierenden Temperatur zu tun. Um eine
Beschreibung dieser Situation zu ermöglichen, nehmen wir an, dass die räumliche Variation
der Temperatur klein ist, so dass wir in einem genügend großen Raumgebiet (mit einer ge-
nügend großen Zahl von Atomen) eine in erster Näherung homogene Situation annehmen
können und wir deshalb die mittlere Phononenzahl ∐︀ñ︀ für dieses Gebiet angeben können.
Für benachbarte Gebiete nehmen wir dann leicht unterschiedliche Temperaturen an, wo-
durch ∐︀ñ︀ eine Funktion der Ortskoordinate wird.
Um die Wärmeleitfähigkeit eines Festkörpers zu berechnen, müssen wir den Wärme-
strom J h als Funktion von ∐︀ñ︀ angeben. Wie in Abb. 6.14 skizziert ist, wird die Wärme-
menge Q, die in der Zeit τ in x-Richtung über die Fläche A transportiert wird, durch die
Energiedichte mal das Volumen Av x τ eines Quaders der Querschnittsfläche A und der
Länge v x τ bestimmt, d. h. Q = (U⇑V ) ⋅ Av x τ. Hierbei ist v x die mittlere Geschwindigkeit
der Phononen, die die Energie transportieren. Diese Geschwindigkeit ist durch die Grup-
pengeschwindigkeit ∂ω⇑∂q x der Gitterschwingungen gegeben. Die Wärmestromdichte J h,x
ist die pro Querschnittsfläche A und Zeit τ in x-Richtung transportierte Wärmemenge,
d. h. J h,x = (U⇑V )v x . Mit Hilfe der inneren Energie U des Phononensystems können wir
deshalb die Wärmestromdichte schreiben als
1 1 1 1 ∂ω qr
J h,x = ∑ ħω qr ( + ∐︀n qr ̃︀) v x (q, r) = ∑ ħω qr ( + ∐︀n qr ̃︀) . (6.4.2)
V q,r 2 V q,r 2 ∂q x
6.4 Wärmeleitfähigkeit 245
Wir werden im Folgenden aus Gründen der Übersichtlichkeit die Indizes q, r weglassen.
Gleichung (6.4.2) zeigt, dass im thermischen Gleichgewicht J h = 0, da hier die Besetzungs-
zahlen für positive und negative q-Werte gleich sind und aus der Symmetrie der Dispersi-
onskurven v x (q) = −v x (−q) folgt. Hierdurch verschwindet die Summe in (6.4.2).
Ein endlicher Wärmestrom existiert nur dann, wenn die mittlere Phononenzahl ∐︀ñ︀ vom
Gleichgewichtswert ∐︀ñ︀0 abweicht. Wir wollen nun den Wärmestrom
36
als Funktion der Ab-
weichung ∐︀ñ︀ − ∐︀ñ︀0 vom thermischen Gleichgewicht ausdrücken:
1
J h,x = ∑ ħω(∐︀ñ︀ − ∐︀ñ︀ )v x .
0
(6.4.3)
V q,r
Wir müssen uns zunächst die Frage stellen, wie ∐︀ñ︀ sich in einem bestimmten Raumgebiet
ändern kann. Hierzu tragen zwei Prozesse bei: Erstens können mehr oder weniger Phononen
in dieses Gebiet hinein- statt hinausdiffundieren. Zweitens können Phononen durch Drei-
Phononen-Prozesse in andere Phononen zerfallen. Wir können also schreiben:
d∐︀ñ︀ ∂∐︀ñ︀ ∂∐︀ñ︀
= ⋁︀ + ⋁︀ . (6.4.4)
dt ∂t Diffusion ∂t Zerfall
Diese Gleichung stellt einen Spezialfall der Boltzmann-Transportgleichung dar, die wir spä-
ter auch zur Beschreibung des Ladungstransports in Festkörpern verwenden werden (ver-
gleiche Abschnitt 9.4).
Wir werden im Folgenden nur so genannte stationäre Zustände behandeln, bei denen
sich ∐︀ñ︀ zeitlich nicht ändert, d. h. d∐︀ñ︀
dt
= 0. Wir werden ferner für die zeitliche Änderung
der Phononenbesetzungszahl durch Zerfallsprozesse einen einfachen Relaxationsansatz
∂∐︀ñ︀ ∐︀ñ︀ − ∐︀ñ︀0
⋁︀ =− (6.4.5)
∂t Zerfall τ
machen. Das heißt, wir beschreiben den Zerfall der Phononen durch eine einzige mittlere
Zerfallszeit τ, die unabhängig von der Energie ist. Wir sehen, dass die Zerfallsrate propor-
tional zur Abweichung vom thermischen Gleichgewicht ansteigt.
Der Diffusionsterm hängt mit dem Temperaturgradienten zusammen. In einem Zeitinter-
vall ∆t werden alle Phononen, die sich ursprünglich an der Stelle x − v x ∆t befunden haben,
am Ort x ankommen. Wir können deshalb schreiben:
∂∐︀ñ︀ 1 ∂∐︀ñ︀ ∂∐︀ñ︀0 ∂T
⋁︀ = lim (︀∐︀n(x − v x ∆t)̃︀ − ∐︀n(x)̃︀⌋︀ = −v x = −v x
∂t Diffusion ∆t→0 ∆t ∂x ∂T ∂x
246 6 Thermische Eigenschaften
(6.4.6)
Hierbei haben wir ∐︀ñ︀ durch ∐︀ñ︀0 ersetzt, nachdem wir den Temperaturgradienten ∂T
∂x
ein-
geführt haben. Dies ist möglich, da wir einen stationären Zustand und lokales thermisches
Gleichgewicht vorausgesetzt haben. Setzen wir die Ausdrücke (6.4.4) bis (6.4.6) in (6.4.3)
ein, so erhalten wir
0
1 2 ∂∐︀ñ︀ ∂T
J h,x = − ∑ ħωτv x . (6.4.7)
V q,r ∂T ∂x
Für kubische oder isotrope Festkörper können wir ∐︀v x2 ̃︀ = 13 v 2 setzen16 und erhalten dadurch
für die Wärmestrom
0
1 2 ∂∐︀ñ︀ ∂T
J h,x = − ∑ ħωτv . (6.4.8)
3V q,r ∂T ∂x
1
κ = c V vℓ . (6.4.9)
3
Wir sehen, dass die spezifische Wärme der Phononen und deren Gruppengeschwindigkeit
eine entscheidende Rolle für die Wärmeleitfähigkeit spielen. Phononen nahe am Zonenrand
oder optische Phononen tragen deshalb wenig zum Wärmetransport bei. Eine wichtige Rolle
spielt aber auch die mittlere freie Weglänge der Phononen. Diese wird durch die Streupro-
zesse der Phononen bestimmt, die wir später noch im Detail diskutieren werden.
In der obigen Herleitung haben wir vernachlässigt, dass die Größen in (6.4.9) frequenzab-
hängig sind und dass unterschiedliche Phononenzweige unterschiedlich zum Wärmetrans-
port beitragen. Wir können dieser Tatsache Rechnung tragen, indem wir über die verschie-
denen Phononenzweige r aufsummieren und über die Phononenfrequenz integrieren. Wir
erhalten dann
1 dc V ,r
κ= ∑∫ v r (ω)ℓ r (ω)dω . (6.4.10)
3 r dω
Wir können diese Gleichung in vielen Fällen vereinfachen. Zum Beispiel können wir bei
tiefen Temperaturen die optischen Phononenzweige vernachlässigen und die akustischen
mit einer linearen Dispersion v r = ω⇑q = const annähern.
̃V τ dT = − 1 n C
J h,x = −n∐︀v x2 ̃︀C ̃V v 2 τ dT . (6.4.11)
dx 3 dx
Hierbei haben wir berücksichtigt, dass ein Nettoenergiefluss vom Teilchenfluss in beide
Richtungen beigetragen wird und dadurch der Faktor 1⇑2 wieder herausfällt. Teilchen,
die vom wärmeren zum kälteren Teil fließen, transportieren die Wärmemenge +C ̃V ∆T in
die eine Richtung, und solche, die vom kälteren zum wärmeren fließen, die Wärmemen-
ge −C̃V ∆T (Kälte) in die entgegengesetzte. Mit c V = n C
̃V und ℓ = vτ erhalten wir dann
wiederum das Ergebnis (6.4.9)
1
κ = c V vℓ . (6.4.12)
3
Schreiben wir in (6.4.11) den Temperaturgradienten entlang einer Probe der Länge L als
dT⇑dx = −(T2 − T1 )⇑L = −∆T⇑L, so können wir (6.4.11) umschreiben in
1 ℓ
J h,x = (c V ⋅ ∆T) (v ⋅ ) . (6.4.13)
3 L
Wir sehen, dass der Wärmestrom durch die Überschusswärmedichte ∆Q⇑V = c V ⋅ ∆T gege-
ben ist, die mit einer effektiven Geschwindigkeit v ⋅ Lℓ durch die Probe transportiert wird. Für
einen diffusiven Prozess gilt dabei v ⋅ Lℓ ≪ v oder ℓ ≪ L. Anschaulich bedeutet dies, dass ein
Phonon L⇑ℓ Streuprozesse macht, bevor es die Probe durchquert hat. Seine Geschwindigkeit
ist deshalb um den Faktor ℓ⇑L gegenüber einem Phonon, das die Probe ohne Streuprozess
durchqueren kann, heruntergesetzt.
Die Temperaturabhängigkeit der spezifischen Wärme haben wir bereits ausführlich in den
Abschnitten 6.1.4 und 6.1.5 diskutiert. Wir müssen uns hier deshalb noch mit den Streupro-
zessen der Phononen beschäftigen.
248 6 Thermische Eigenschaften
6.4.3.1 Streuprozesse
In Nichtmetallen sind die wichtigsten Streuprozesse für Phononen:
∎ Phonon-Phonon-Streuung
∎ Streuung an Defekten, Oberflächen etc.
Phonon-Phonon-Streuung: In Abschnitt 6.2 haben wir bereits diskutiert, dass durch an-
harmonische Effekte Wechselwirkungseffekte zwischen Phononen möglich sind. So kann
durch einen Drei-Phonon-Prozess ein Phonon in zwei neue Phononen zerfallen bzw. umge-
kehrt zwei Phononen in ein neues umgewandelt werden. Bezüglich des letzteren Prozesses
könnten wir vermuten, dass dieser umso häufiger vorkommt, je höher die Dichte der Phono-
nen ist. Das heißt, die Streuwahrscheinlichkeit sollte proportional zu n ph sein und deshalb
die mittlere freie Weglänge
1
ℓ∝ . (6.4.15)
n ph (T)
Wir haben aber in Abschnitt 6.2 gelernt, dass wir bei Drei-Phononen-Prozessen in Normal-
prozesse und Umklappprozesse unterscheiden können. Wir müssen deshalb analysieren, wie
diese beiden Streuprozesse zum Wärmewiderstand beitragen.
Betrachten wir zunächst die Normalprozesse. Für diese gilt q1 + q2 = q3 . Das heißt, in einem
Gas von Phononen bleibt bei internen Streuprozessen der Gesamtimpuls Q (und natürlich
auch die Gesamtenergie) erhalten, so dass
Q = ∑ n q,r ħqr = const (6.4.16)
q,r
gilt. Da die Normalprozesse den Gesamtimpuls der Phononen also nicht ändern, kann sich
eine Gleichgewichtsverteilung der Phononen bei der Temperatur T mit einer bestimmten
Driftgeschwindigkeit entlang des Festkörpers bewegen.
Wir sehen, dass Normalprozesse den Wärmetransport überhaupt nicht behindern. Um einen
endlichen Wärmewiderstand zu erhalten, sind also nicht nur Prozesse notwendig, die zu ei-
ner endlichen mittleren freien Weglänge, sondern auch zu einer Thermalisierung der Pho-
nonen führen. Solche Prozesse sind die Umklappprozesse. Da bei Streuprozessen mit Pho-
nonen nur der so genannte Kristallimpuls erhalten bleibt, gilt q1 + q2 = q3 + G, wobei G ein
6.4 Wärmeleitfähigkeit 249
reziproker Gittervektor ist. Der Impuls G wird an das Gitter abgegeben, so dass sich der Ge-
samtimpuls des Phononengases ändern kann. Der Impulsverlust des Phononengases führt
dann zum Wärmewiderstand des Gitters.
Wir sehen, dass für tiefe Temperaturen die mittlere freie Weglänge der Phononen bezüg-
lich der Phonon-Phonon-Streuung exponentiell anwächst. Deshalb wird bei genügend tie-
fen Temperaturen die mittlere freie Weglänge durch die von der Temperatur unabhängige
Defektstreuung bestimmt. Wir erwarten also, dass ℓ von hohen Temperaturen her kommend
zunächst ∝ 1⇑T und dann ∝ eΘ D ⇑T ansteigt und dann unterhalb einer von der Probengröße
und Probenreinheit abhängigen Temperatur sättigt. Bei sehr reinen Proben wird die mittle-
re freie Weglänge größer als der Probendurchmesser d. Streuung findet dann hauptsächlich
an der Probenoberfläche statt und wir können ℓ ≃ d setzen. Die Wärmeleitfähigkeit in die-
sem Temperaturbereich, den man als Casimir-Bereich bezeichnet, hängt damit stark von der
Probengeometrie und der Beschaffenheit der Probenoberfläche ab.
Um die Temperaturabhängigkeit von κ zu erhalten, müssen wir noch die Temperaturabhän-
gigkeit von c V berücksichtigen. Wir haben in Abschnitt 6.1 gesehen, dass c V für T ≫ Θ D in
etwa konstant ist und für T ≪ Θ D proportional zu T 3 verläuft. Für den mittleren Tempera-
turbereich erhalten wir, abhängig vom verwendeten Modell, unterschiedliche T-Abhängig-
keiten für c V . Die Details sind hier allerdings nicht so wichtig, da die exponentielle T-Ab-
hängigkeit der mittleren freien Weglänge das Verhalten dominiert. Insgesamt erwarten wir
folgende Temperaturabhängigkeit der Wärmeleitfähigkeit:
)︀
⌉︀ 1
T ≫ ΘD
⌉︀
⌉︀
⌉︀ T
für (Ph-Ph-Streuung)
⌉︀ n Θ D ⇑T
κ ∝ ⌋︀T e , n ≃ 0 − 3 für T ≪ ΘD (Ph-Ph-Streuung) (6.4.22)
⌉︀
⌉︀
⌉︀
⌉︀
⌉︀ T ⋘ ΘD
]︀T
3
für (Ph-Defekt-Streuung)
In Abb. 6.15 und Abb. 6.16 ist die Temperaturabhängigkeit der thermischen Leitfähigkeit
von hochreinem Si und Ge sowie isotopenreinem (99.7%) 28 Si und isotopenreinem (99.99%)
70
Ge gezeigt. Wir erkennen gut den theoretisch erwarteten Verlauf. Für tiefe Temperaturen
steigt die Wärmeleitfähigkeit zunächst proportional zu etwa T 3 an, hat dann ein Maximum
und fällt zu höheren Temperaturen schnell zunächst etwa proportional zu eΘ D ⇑T und dann
proportional zu 1⇑T ab. Wir sehen, dass dielektrische Kristalle eine sehr hohe thermische
Leitfähigkeit haben können, die so hoch wie diejenige von Metallen ist (vergleiche hierzu
Abschnitt 7.3.2). Für isotopenreines Silizium und Ge erreicht κ Werte bis zu 6 000 W/m K
bzw. bis zu mehr als 10 000 W/m K. Synthetischer Saphir besitzt mit κ max ≃ 20 000 W/m K
bei 30 K eine der höchsten Wärmeleitfähigkeiten. Dieser Wert ist höher als die maximale
Wärmeleitfähigkeit von Kupfer, die etwa 10 000 W/m K beträgt, liegt aber unterhalb des
Wertes für metallisches Ga, dessen Wärmeleitfähigkeit 84 500 W/m K bei 1.8 K beträgt.
4
10
∝ 𝑻𝟑
4
10
3
3 10
10
(W / m K)
(W / m K)
2
10
Si Si
∝ 𝟏/𝑻 1
2
10 10
28Si
0
10 natSi
Abb. 6.15: Wärmeleitfähigkeit von Silizium. Links: hochreines Si (nach C. J. Glassbrenner, G. A. Slack,
Phys. Rev. 134, 1058 (1964)). Rechts: Hochreines natürliches Silizium (nach M. G. Holland, Phys.
Rev. 132, 2461 (1963); W. S. Capinski, Appl. Phys. Lett. 71, 2109 (1997)) sowie isotopenreines (99.7%)
28
Si (nach W. S. Capinski, Appl. Phys. Lett. 71, 2109 (1997)).
3
10 𝑱𝒉 ∥ [𝟎𝟎𝟏]
3 (a)
10
(b)
(d)
(a)
2 (e)
(W / m K)
(W / m K)
10 (c)
(b)
1 2
10 10
(c)
Ge Ge
0
10 0 1 2 3 0 1 2
10 10 10 10 10 10 10
T (K) T (K)
Abb. 6.16: Wärmeleitfähigkeit von Germanium. Links: hochreines Ge mit unterschiedlicher Akzeptor- 42
Dotierung; (a) 103 , (b) 1015 , (c) 2.3 ⋅ 1016 , (d) 4.2 ⋅ 1018 und (e) 5 ⋅ 1019 cm−3 (nach J. A. Carruthers et al.,
Proc. Royal Soc. 238, 502 (1957)). Rechts: Hochreines natürliches Germanium und isotopenreines
70
Ge; (a) 99.99%, (b) 96.3%, (c) natürliches Ge (nach V. I. Ozhogin et al., Pisma Zh. Eksp. Teor. Fiz. 63,
463–467 (1996)).
252 6 Thermische Eigenschaften
In Abb. 6.17 ist die Wärmeleitfähigkeit von NaF-Kristallen mit unterschiedlicher Defekt-
dichte gezeigt. Die Defekte wurden durch Bestrahlung mit hochenergetischer Röntgenstrah-
lung erzeugt. Wir erkennen wiederum die typische Temperaturabhängigkeit der Wärme-
leitfähigkeit und außerdem die Reduktion der maximalen Wärmeleitfähigkeit durch die
vergrößerte Defektdichte.
4
10
(a)
NaF
(b)
(c)
(W / m K)
3
10 (d)
10
3
SiO2
2
10
kristallin
(W / m K)
101
I
100 II
∝ 𝑻𝟑 Abb. 6.18: Temperaturabhängigkeit der
-1
10 amorph Wärmeleitfähigkeit in kristallinem (Rau-
-2 III ten) und amorphem Quarz (Dreiecke).
10
Die blauen Linien zeigen das Ergebnis für
10
-3 ∝ 𝑻𝟐 weitere Quarz- und Borsilikat-Gläser, die
alle eine ähnliche Temperaturabhängigkeit
10-4
10
-1
10
0
10
1
10
2 zeigen (nach R. C. Zeller, R. O. Pohl, Phys.
T (K) Rev. B 4, 2029 (1971)).
49
Bei hohen Temperaturen (Bereich I) liegt die Wellenlänge der den Wärmetransport dominie-
renden Phononen bei etwa 1 nm. Schätzen wir aus der gemessenen Wärmeleitfähigkeit einen
groben Wert für die mittlere freie Weglänge ab, so erhalten wir Werte unterhalb von 1 nm.
Das heißt, ℓ ist in der gleichen Größenordnung oder sogar kleiner als die Wellenlänge der
Phononen. Eine Beschreibung des Wärmetransports im Phononenbild erscheint deshalb
nicht mehr sinnvoll. Eine genaue theoretische Erklärung des beobachteten Verhaltens steht
noch aus.
Im Bereich mittlerer Temperaturen (Bereich II) zeigt die Wärmeleitfähigkeit häufig ein Pla-
teau. Da in diesem Temperaturbereich c V mit der Temperatur stark zunimmt, muss ℓ stark
abnehmen, um das beobachtete Plateau zu erklären. Als Mechanismen werden Streuung an
Punktdefekten, die räumliche Lokalisierung von Phononen oder die Streuung an weichen
Phononen (vergleiche hierzu Abschnitt 11.4.1) vorgeschlagen.
Im Bereich tiefer Temperaturen (Bereich III) zeigt die Wärmeleitfähigkeit eine in etwa
quadratische Temperaturabhängigkeit. Ferner beobachtet man, dass der Absolutwert von κ
für unterschiedliche Systeme ähnlich ist. Dieses Verhalten können wir mit der resonanten
Wechselwirkung der in diesem Temperaturbereich dominierenden langwelligen Phononen
mit Zweiniveausystemen erklären. Zum Beispiel können wir uns vorstellen, dass Atome
zwischen zwei Zuständen in der amorphen Struktur hin- und hertunneln und durch diese
Tunnelkopplung ein Zweiniveausystem bilden. Stimmt die Phononenenergie ħω mit der
Energiedifferenz E 12 der Zweiniveausysteme überein, so können die Phononen Über-
gänge zwischen den beiden Niveaus induzieren. Da im thermischen Gleichgewicht für
das Verhältnis der Besetzungszahlen im oberen und unteren Zustand des Zweiniveausys-
tems n 1 ⇑n 2 = exp(−E 12 ⇑k B T) gilt, folgt für die Besetzungszahldifferenz
E 12 ħω
δn = n 2 − n 1 = n tanh ( ) = n tanh ( ) (6.4.24)
2k B T 2k B T
mit n = n 1 + n 2 . Nehmen wir eine breite Verteilung der Energiedifferenzen E 12 und fer-
ner für die Energie der den Wärmetransport dominierenden Phononen ħω ∼ k B T an, so
sehen wir, dass sich δn nicht mit der Temperatur ändert. Für die Streurate erhalten wir
dann 1⇑ℓ ∝ δnσ ∝ nT, da der Streuquerschnitt σ ∝ ω ∝ T. Letzteres folgt aus der Tatsa-
che, dass das mittlere Auslenkungsquadrat einer Gitterschwingung proportional zu ihrer
254 6 Thermische Eigenschaften
Frequenz ist (vergleiche hierzu Abschnitt 9.3.2). Mit 1⇑ℓ ∝ nT und c V ∝ T 3 erhalten wir
κ = 13 c V ℓv ∝ T 2 ⇑n (6.4.25)
2πħv
ħω th = = kB T (6.4.26)
λ th
erhalten. Alle Schwingungsmoden mit λ < λ th können bei der Temperatur T nicht mehr
angeregt werden. Reduzieren wir die Abmessung D einer Probe so weit, dass D ≤ λ th ⇑2, so
sind unterhalb der Temperatur
hv
T∗ = (6.4.27)
2k B D
alle relevanten Schwingungsmoden in dieser Raumrichtung ausgefroren und es liegt effektiv
eine Probe mit reduzierter Dimensionalität vor. Mit einer typischen Phononenausbreitungs-
geschwindigkeit von v = 5 000 m/s und D = 100 nm erhalten wir T ∗ ≃ 1 K.
2𝜋 ℎ𝑣𝑝ℎ ℎ𝑣𝑝ℎ
mit ℏ𝜔𝑝ℎ = ℏ𝑞𝑣𝑝ℎ = ℏ 𝑣𝑝ℎ ⇒ = 𝑘𝐵 𝑇 ⋆ ⇒ 𝑇⋆ =
𝜆𝑝ℎ 2𝐷 2𝑘𝐵 𝐷
6.4 Wärmeleitfähigkeit 255
Der Wärmefluss von der heißen zur kalten Seite des eindimensionalen Stegs ist gegeben
durch (vergleiche (6.4.3))
1
J h,x = ∑ ħω qr (∐︀n 1 ̃︀ − ∐︀n 2 ̃︀)v x,qr . (6.4.28)
L q,r
Hierbei sind ∐︀n 1 ̃︀ und ∐︀n 2 ̃︀ die mittleren thermischen Besetzungszahlen der Gitterschwin-
gungen bei den Temperaturen T1 und T2 und v x,qr = ∂ω qr ⇑∂q ihre Gruppengeschwindigkeit.
Mit der Zustandsdichte Z(q) können wir die Summe über q in ein Integral umwandeln und
erhalten
∞
1
J h,x = ∑ ∫ ħω qr Z(q)(∐︀n 1 ̃︀ − ∐︀n 2 ̃︀)v x,qr dq . (6.4.29)
L r
0
Aus Z(q) ⋅ dq = D(ω) ⋅ dω folgt mit der eindimensionalen Zustandsdichte Z (1) (q) = L⇑2π
die Zustandsdichte im Frequenzraum D(ω) = (L⇑2π)(1⇑v x,qr ) und wir erhalten
∞
1
J h,x = ∑ ∫ ħω r (∐︀n 1 ̃︀ − ∐︀n 2 ̃︀)dω r . (6.4.30)
2π r
0
Bemerkenswert ist dabei, dass die Gruppengeschwindigkeit der Phononen in (6.4.30) gerade
herausfällt.
Um das Integral auszuwerten, müssen wir jetzt noch einen Ausdruck für ∐︀n 1 ̃︀ − ∐︀n 2 ̃︀ finden.
Nach (6.4.5) und (6.4.6) ist
∂∐︀ñ︀ dT
∐︀n 1 ̃︀ − ∐︀n 2 ̃︀ = −v x,qr τ . (6.4.31)
∂T dx
Wir betrachten jetzt den interessanten Fall, dass die mittlere freie Weglänge ℓ = v x,qr τ größer
als die Länge L des Stegs wird. In diesem Fall werden Phononen von einem Wärmereservoir
in den Steg emittiert und wandern ohne Rückstreuung zum anderen. Da ein Wärmereservoir
eine höhere Temperatur besitzt, erhalten wir einen effektiven Wärmestrom vom heißeren
zum kälteren Reservoir. Da ferner die effektive mittlere freie Weglänge gerade der Länge L
des Stegs entspricht, können wir −v x,qr τ ∂T
∂x
durch −L ∂T
∂x
= T1 − T2 = ∆T, also die Tempera-
turdifferenz der beiden Wärmereservoire, ersetzen und erhalten ∐︀n 1 ̃︀ − ∐︀n 2 ̃︀ ≃ ∂∐︀ñ︀
∂T
∆T. Set-
zen wir dies in (6.4.30) ein und benutzen die Abkürzung x ≡ ħω r ⇑k B T, so erhalten wir den
thermischen Leitwert
∞
J h,x k B2 T x 2 ex π 2 k B2 T
G≡ = ∑ 𝒯r ∫ dx = ∑ 𝒯 r = ∑ 𝒯r ⋅ G 0 . (6.4.32)
(ex − 1)
2
∆T h r r 3 h r
0
Hierbei sind 𝒯r ≤ 1 die Transmissionskoeffizienten, welche die Kopplung der im Steg pro-
pagierenden Moden an die Reservoire charakterisieren. Wir sehen, dass im Idealfall 𝒯r = 1
jede Schwingungsmode zum Leitwert den gleichen Beitrag
π 2 k B2 T
G0 ≡ = 9.46 × 10−13 W⇑K2 ⋅ T(︀K⌋︀ (6.4.33)
3h
256 6 Thermische Eigenschaften
liefert. Für den in Abb. 6.19 gezeigten Steg gibt es eine longitudinale Dilatationsschwin-
gung, zwei transversale Biegeschwingungen und eine Torsionsschwingung – also insgesamt
4 Schwingungsmoden.
Der durch (6.4.32) gegebene thermische Leitwert konnte in Experimenten mit vier, nur et-
wa 200 nm breiten Stegen, die in eine 60 nm dicke Siliziumnitridmembran strukturiert wur-
den, beobachtet werden.18 Die verwendete Probe ist im Inset von Abb. 6.20 gezeigt. Auf der
Insel im Zentrum der Probe ist ein Au-Heizer aufgebracht, der über vier auf den Stegen
verlaufenden Nb-Leitungen mit den Zuleitungen verbunden ist. Man verwendet supralei-
tendes Nb für die Zuleitungen, damit es in den Zuleitungen selbst zu keinen Heizeffekten
kommt und da supraleitendes Nb ferner eine sehr kleine thermische Leitfähigkeit besitzt.
Da jeder der vier Stege mit jeweils 4 Schwingungsmoden beiträgt und alle vier Stege parallel
geschaltet sind, erwarten wir bei tiefen Temperaturen einen thermischen Leitwert von 16G 0 .
Dies stimmt mit der experimentellen Beobachtung gut überein. Bei höheren Temperaturen,
T > T ∗ ≃ 0.8 K, verhalten sich die Stege wie dreidimensionale Proben und der Leitwert steigt
proportional zu T 3 an. Die Übergangstemperatur T ∗ ≃ 0.8 K stimmt gut mit dem für eine
Phononengeschwindigkeit v ≃ 6 000 m/s und W ≃ 200 nm erwarteten Wert überein.
Wir haben in unserer obigen Überlegung angenommen, dass die von einem Wärmereservoir
emittierten Phononen mit Wahrscheinlichkeit T = 1 zum anderen Reservoir transmittiert
werden. Liegt eine endliche Rückstreuung der Phononen vor, so können wir dies im Aus-
druck (6.4.32) für den thermischen Leitwert einfach durch eine Transmissionswahrschein-
lichkeit T < 1 berücksichtigen.
100
𝝅𝟐 𝒌𝟐𝐁 𝑻
𝑮𝟎 =
𝟑𝒉
Gth / 16 G0
10
2 µm
Literatur
A. Einstein, Die Plancksche Theorie der Strahlung und die Theorie der spezifischen Wärme,
Annalen der Physik 327 (1), 180–190 (1907).
R. Berman, Thermal Conduction in Solids, Clarendon Press, Oxford (1976).
H. S. Carslaw, J. C. Jaeger, Conduction of Heat in Solids, Oxford University Press, Oxford
(1959).
H. J. Goldsmid, Introduction to Thermoelectricity, Springer Series in Materials Science,
Springer-Verlag, Berlin (2010).
S. V. Hering, S. W. Sciver and O. E. Vilches, Apparent new phase of monolayer 3 He and 4 He
films adsorbed on grafoil as determined from heat capacity measurements, J. Low Temp.
Phys. 25, 793–805 (1976).
G. S. Nolas, J. Sharp, J. Goldsmid, Thermoelectrics: Basic Principles and New Materials Deve-
lopments, Springer-Verlag, Berlin (2001).
K. Schwab, E. A. Henriksen, J. M. Worlock, M. L. Roukes, Measurement of the quantum of
thermal conductance, Nature 404, 974–977 (2000).
T. M. Tritt (ed.), Thermal Conductivity: Theory, Properties, and Applications, Kluwer Acade-
mic/Plenum Publishers, New York (2004).
J. M. Ziman, Electrons and Phonons: The Theory of Transport Phenomena in Solids, Oxford
Classic Texts in the Physical Sciences, Oxford University Press, Oxford (2001).
18
K. Schwab, E. A. Henriksen, J. M. Worlock, M. L. Roukes, Measurement of the quantum of thermal
conductance, Nature 404, 974–977 (2000).
7 Das freie Elektronengas
In den vorangegangenen Kapiteln haben wir die Eigenschaften von Isolatoren behandelt. Bei
diesen Materialien sind die Elektronen fest an die Gitteratome gebunden, wir sprechen von
lokalisierten Elektronen. Wir wollen uns nun den Eigenschaften von Materialien zuwenden,
bei denen delokalisierte Elektronen vorliegen. Um zunächst ein handhabbares Modell für
solche Systeme zu entwickeln, werden wir zwei grundlegende Annahmen machen:
Jahr 1897, wurde von Paul Drude1 eine klassische Modellvorstellung für ein Gas freier Elek-
tronen entwickelt.2 Diese klassische Theorie basierte zwar auf der falschen Annahme, dass
die Geschwindigkeitsverteilung der Elektronen im freien Elektronengas durch die klassi-
sche Maxwell-Boltzmann-Verteilung beschrieben werden kann, hatte aber trotzdem eini-
ge eher zufällige Erfolge wie die Ableitung des Ohmschen Gesetzes oder des Verhältnisses
zwischen elektrischer und thermischer Leitfähigkeit. Diese klassische Theorie konnte aber
nicht die spezifische Wärme, die Thermokraft oder die magnetische Suszeptibilität von Me-
tallen erklären. Nach der Entwicklung der Quantenmechanik hat dann Arnold Sommerfeld3
die Drudesche Theorie auf eine quantenmechanische Basis gestellt. Wir sprechen deshalb
heute oft vom Drude-Sommerfeld-Modell des freien Elektronengases. Sommerfeld hat das
Paulische Ausschließungsprinzip auf die freien Elektronen angewendet und ihre Geschwin-
digkeitsverteilung mit der richtigen Quantenstatistik, nämlich der Fermi-Dirac-Statistik be-
schrieben (Übergang vom klassischen zum Quantengas).
1
Paul Drude, geboren am 12. Juli 1863 in Braunschweig, gestorben am 5. Juli 1906 in Berlin.
2
Paul Drude, Zur Elektronentheorie der Metalle, I. Teil, II. Teil, und Berichtigung, Annalen der Physik
1, 556–613 (1900); ibid 3, 369–402 (1900); ibid 7, 687–692 (1902).
3
Arnold Sommerfeld, siehe Kasten auf Seite 262.
7.1 Modell des freien Elektronengases 261
∫ d r ⋃︀Ψk (r)⋃︀ = 1 .
3 2
(7.1.3)
V
Das heißt, die Wahrscheinlichkeit, das Elektron irgendwo innerhalb des Potenzialkastens
mit Volumen V zu finden ist eins. Einsetzen in die Schrödiger-Gleichung ergibt die Disper-
sionsrelation für die freien Elektronen
ħ2 k 2
E(k) = . (7.1.4)
2m
Die ebenen Wellen Ψk (r) sind Eigenfunktionen des Impulsoperators ħı ∇. Es gilt nämlich
ħ
∇Ψk (r) = ħkΨk (r) . (7.1.5)
ı
Wir sehen, dass die Zustände Ψk (r) einen wohldefinierten Impuls
p = ħk (7.1.6)
haben. Mit der Impuls-Orts-Unschärferelation bedeutet dies, dass die Ortsunschärfe beliebig
groß ist, wir haben es mit vollkommen delokalisierten Elektronen zu tun.
7.1.1.1 Randbedingungen
Als Randbedingung haben wir vorgegeben, dass sich die Elektronen in einem Kristall mit
Volumen V = L x ⋅ L y ⋅ L z aufhalten sollen. Wir berücksichtigen dies über die periodischen
Randbedingungen
Ψk (x, y, z) = Ψk (x + L x , y, z) = Ψk (x, y + L y , z) = Ψk (x, y, z + L z ) , (7.1.7)
262 7 Das freie Elektronengas
Im Gegensatz zu den Gitterschwingungen, die wir in Abschnitt 5.3 behandelt haben, gibt es
hier keinen maximalen Wellenvektor bzw. minimale Wellenlänge. Bei den Gitterschwingun-
gen wurde der maximale Wellenvektor π⇑a durch den Rand der 1. Brillouin-Zone gegeben
und resultierte aus der periodischen Anordnung der Gitteratome mit Abstand a. Hier be-
7.1 Modell des freien Elektronengases 263
trachten wir ein in ein Volumen eingesperrtes Teilchengas ohne jegliche periodische Struk-
tur. Es existiert deshalb hier kein maximaler Wellenvektor.
Einen bestimmten Elektronenzustand können wir durch die Angabe der drei Zahlen n x , n y
und n z sowie durch Angabe des Spin-Index σ = ± 12 spezifizieren. Aufgrund der zwei mögli-
chen Spin-Stellungen gibt es also zu jedem Wellenvektor k genau zwei Elektronenzustände
mit unterschiedlicher Spin-Richtung. Die Energieeigenwerte dieser Zustände lauten
(2π)3 (2π)3
3D: = (7.1.12)
Lx L y Lz V
Für die dreidimensionale Zustandsdichte Z(k) für beide Spin-Richtungen erhalten wir in
Analogie zu (5.3.17)
V
Z(k) = 2 . (7.1.13)
(2π)3
𝒌𝒚
𝟐𝝅/𝑳𝒚
𝟐𝝅/𝑳𝒙
𝑨 = (𝟐𝝅)²/𝑳𝒙𝑳𝒚
6
264 7 Das freie Elektronengas
Entsprechende Ausdrücke ergeben sich für den 1D- oder 2D-Fall. Wir erhalten bis auf den
Faktor 2 durch die beiden möglichen Spin-Richtungen das gleiche Ergebnis wie für die Pho-
nonen. Wird V groß, so liegen die Zustände im k-Raum sehr dicht und wir können ∑k durch
∫ d k Z(k) ersetzen.
3
Wir bestimmen zunächst die Zahl der Zustände im k-Raum, indem wir über eine Schale
(︀E(k), E(k) + ∆E⌋︀ im k-Raum integrieren. Wir erhalten
k(E+∆E) k(E+∆E)
V
∫ Z(k) d k = 2
3
∫ d3k , (7.1.15)
(2π)3
k(E) k(E)
V
wobei (2π) 3 die Dichte der Zustände im k-Raum ist und der Faktor 2 aus der Spin-Entartung
resultiert. Die Zustandsdichte im Energieraum ergibt sich dann aus der Bedingung, dass die
Zahl der Zustände erhalten bleibt,
k(E+∆E) E(k)+∆E
V
2 ∫ d3k = ∫ D(E) dE ≃ D(E)∆E (7.1.16)
(2π)3
k(E) E(k)
und der bekannten Dispersion E(k) = ħ 2 k 2 ⇑2m in Analogie zu (5.3.25). Da die Flächen kon-
stanter Energie im k-Raum Kugeloberflächen sind, erhalten wir für einen dreidimensionalen
Festkörper
k(E+∆E)
V
∫ Z(k) d 3 k = 2 4πk 2 ∆k = D(E)∆E . (7.1.17)
(2π)3
k(E)
ħ2 k
Mit ∆E = m
∆k ergibt sich daraus die Zustandsdichte für beide Spin-Richtungen zu
V 2m 3⇑2 1⇑2
D(E) = ( ) E (3D-Elektronengas) . (7.1.18)
2π 2 ħ 2
Die Zustandsdichte D(E) gibt die Zahl der Zustände pro Energieintervall für beide Spin-
Richtungen an. In vielen Lehrbüchern wird die Zustandsdichte für eine Spin-Richtung oder
pro Energieintervall und Volumen angegeben. Diese können aus (7.1.18) leicht erhalten wer-
den, indem wir durch 2 bzw. das Volumen teilen.
Entsprechende Beziehungen können wir für ein- und zweidimensionale Elektronengassys-
teme ableiten, wie sie heute häufig in Halbleiterheterostrukturen realisiert werden. Für ein
7.1 Modell des freien Elektronengases 265
A 2m 0
D(E) = ( ) E = const (2D-Elektronengas) . (7.1.20)
2π ħ 2
L 2m 1⇑2 −1⇑2
D(E) = ( ) E (1D-Elektronengas) . (7.1.22)
π ħ2
⌋︂
Wir sehen, dass die Zustandsdichte für ein 3D-Elektronengas proportional zu⌋︂ E, für ein
2D-Elektronengas konstant und für ein 1D-Elektronengas proportional zu 1⇑ E ist (siehe
Abb. 7.2).
3D 2D 1D
D (E)
D (E)
D (E)
E E E
Φ
Abb. 7.3: Potenzialverlauf im Modell frei-
er Elektronen. Im Inneren des Potenzialtopfs 𝐻
verschwindet die potenzielle Energie, da wir
freie Teilchen angenommen haben. Die Po- 𝐸F
tenzialtiefe ergibt sich aus der Summe der
Austrittsarbeit Φ und der Fermi-Energie E F . − 𝐿/2 0 +𝐿/2 𝑥
die wir dabei erreichen, ist die Fermi-Energie E F .4 Die Fermi-Energie trennt bei T = 0 die
besetzten Zustände (E ≤ E F ) von den unbesetzten Zuständen (E > E F ). Das daraus resul-
tierende Potenzialbild ist in Abb. 7.3 skizziert. Innerhalb des Potenzialtopfs verschwindet
die potenzielle Energie. Alle Elektronenzustände sind bis zur Fermi-Energie besetzt. Um ein
Elektron aus dem Metall zu entfernen, müssen wir die Austrittsarbeit Φ aufbringen. Die Aus-
trittsarbeiten von Metallen liegen im Bereich von 2 bis 6 eV (z. B. Kupfer: Φ = 4.3 . . . 4.5 eV),
so dass unsere obige Annahme eines unendlich hohen Potenzialwalls gut gerechtfertigt ist.
Die Tiefe des Potenzialwalls ergibt sich zu H = Φ + E F . Da E F ebenfalls einige eV beträgt
(siehe Tabelle 7.1), liegt H typischerweise im 10 eV Bereich.
Da die Flächen konstanter Energie für ein 3D-Elektronengas Kugeloberflächen sind, ergibt
sich bei T = 0 im k-Raum eine Kugel mit Radius k F , die alle besetzten Zustände enthält. Wir
nennen diese Kugel Fermi-Kugel (siehe Abb. 7.4). Ihr Radius ist durch die Fermi-Wellen-
zahl k F gegeben, ihre Oberfläche bezeichnen wir als Fermi-Fläche. Die Größe der Fermi-
Wellenzahl können wir leicht bestimmen, indem wir die Anzahl der möglichen Zustände
innerhalb der Fermi-Kugel gleich der Elektronenzahl N setzen:
V 4
N = 2( ) ⋅ ( πk F3 ) . (7.1.23)
(2π) 3 3
)︁⌊︂⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂]︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ )︂ )︁⌊︂⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ]︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ )︂
Zustandsdichte Volumen
im k-Raum im k-Raum
Hierbei haben wir die Dichte Z(k) der Zustände im k-Raum benutzt, in der der Faktor 2
auftaucht, da ja jeder Zustand mit zwei Elektronen entgegengesetzten Spins besetzt werden
kann. Lösen wir nach k F auf und benutzen die Teilchendichte n 3D = N⇑V in einem 3D-
Elektronengas, so erhalten wir5
4
Benannt nach Enrico Fermi, geboren am 29. September 1901 in Rom, gestorben am 29. November
1945 in Chicago, Nobelpreis für Physik 1938.
5
Vergleiche hierzu die analoge Ableitung des Debye-Wellenvektors (6.1.45) in Abschnitt 6.1.5. Beide
Ausdrücke unterscheiden sich um den Faktor 21⇑3 , da wir bei dem Elektronensystem die Spin-
Entartung vorliegen haben.
7.1 Modell des freien Elektronengases 267
𝒌𝒛
𝒌𝑭
D (E)
Fermi-Kante
𝒌𝒚 besetzt unbesetzt
𝒌𝒙
0.0 0.4 0.8 1.2 1.6
E / EF
Abb. 7.4: Fermi-Kugel und Zustandsdichte für ein 3D-Elektronengas bei T = 0. Die besetzten und
unbesetzten Zustände sind durch eine scharfe Fermi-Kante getrennt.
𝜆F
Analog erhalten wir für 2D- und 1D-Elektronengase mit den Ladungsträgerdichten n 2D =
N⇑A und n 1D = N⇑L
Mit (7.1.24) können wir für 3D-Elektronengase die folgenden Größen angeben:
ħ 2 k F2 ħ2
EF = = (3π 2 n)2⇑3 Fermi-Energie (7.1.27)
2m 2m
EF
TF = Fermi-Temperatur (7.1.28)
kB
2π
λF = Fermi-Wellenlänge (7.1.29)
kF
p F ħk F
vF = = Fermi-Geschwindigkeit (7.1.30)
m m
Wir sehen, dass die Fermi-Energie E F bzw. die Fermi-Temperatur TF nur von der Teilchen-
dichte n 3D abhängt. Dies gilt auch für 2D- und 1D-Elektronengase, für die leicht analoge
Ausdrücke angeleitet werden können.6
Größenordnungen: Wir wollen kurz die Größenordnung der gerade eingeführten Größen
abschätzen. In typischen Metallen ist die Elektronendichte n ∼ 5 ⋅ 1022 cm−3 . Damit erhalten
6
Die Teilchendichte in Atomkernen (Protonen, Neutronen) ist wesentlich größer als die Elektro-
nendichte in Festkörpern, deshalb ist die Fermi-Energie dort auch wesentlich höher.
268 7 Das freie Elektronengas
Zu beachten ist hierbei, dass die Wellenlänge der Elektronenwellen im Bereich von 1 Å liegt
und damit in der gleichen Größenordnung wie der Atomabstand im Festkörper liegt. Auf-
grund unserer Diskussion in Kapitel 2 erwarten wir deshalb starke Beugungseffekte der Elek-
tronenwellen im Festkörper. Ferner ist TF wesentlich größer als die typischen Schmelztem-
peraturen von Festkörpern. Wir haben also in der Praxis immer den Fall T ≪ TF vorliegen.
In Tabelle 7.1 sind die Werte von E F und TF für einige Metalle angegeben.
Die Fermi-Geschwindigkeit spielt für ein Elektronengas eine ähnliche Rolle wie die thermi-
sche Geschwindigkeit der Teilchen in einem klassischen Gas. Da T ≪ TF bzw. E th = k B T ≪
E F ist allerdings die thermische Geschwindigkeit eines „klassischen⌈︂ Elektronengases“
wesentlich kleiner als die Fermi-Geschwindigkeit. Während v F = 2E F ⇑m ≃ 108 cm⇑s,
würde⌈︂die thermische Geschwindigkeit eines klassischen Elektronengases bei 300 K nur
v th = 2k B T⇑m ≃ 107 cm⇑s betragen.
Wir wollen zuletzt noch die Zustandsdichte bei der Fermi-Energie angeben. Mit (7.1.18)
und (7.1.27) erhalten wir
3 n 3 N
D(E F ) = V = . (7.1.36)
2 EF 2 EF
7.1 Modell des freien Elektronengases 269
Häufig wird die Zustandsdichte auch pro Einheitsvolumen angegeben, so dass sie dann nur
durch den Quotienten von Elektronendichte n und Fermi-Energie E F bestimmt ist.
ħ2 k 2
E ges = 2 ∑ . (7.1.37)
k≤k F 2m
Der Faktor 2 berücksichtigt hierbei wiederum die Spinentartung. Ähnlich wie wir es für die
Gitterschwingungen getan haben, nehmen wir an, dass das Volumen V groß ist und deshalb
die Zustände im k-Raum sehr dicht liegen. Wir können dann die Summation durch eine
Integration ersetzen, ∑ k E(k) → ∫ k Z(k)E(k) d 3 k, und erhalten
kF kF
V ħ2 k 2 3 V ħ2 k 2 V ħ2 5
E ges =2 ∫ d k = 2 ∫ 4πk 2
dk = k . (7.1.38)
(2π)3 2m (2π)3 2m 10π 2 m F
0 0
Mit n = N⇑V = k F3 ⇑3π 2 erhalten wir für die Gesamtenergie pro Teilchen
E ges 3 3
= E F = k B TF . (7.1.39)
N 5 5
Im Gegensatz zu einem Gas klassischer Teilchen, für das die Energie pro Teilchen 32 k B T
beträgt und damit für T → 0 verschwindet, besitzt das Fermi-Gas selbst bei T = 0 eine große
Energie pro Teilchen. Dies ist eine direkte Folge des Pauli-Verbots.
Druck: Der Druck, der von dem Elektronengas ausgeübt wird, ist
∂E ges 2 E ges
p = −( ) = . (7.1.40)
∂V N=const 3 V
Hierbei haben wir den Ausdruck (7.1.27) für die Fermi-Energie verwendet. Da in die Fermi-
Energie n = N⇑V eingeht, ist diese vom Volumen abhängig. Gleichung (7.1.40) bedeutet,
dass wir zum Komprimieren eines völlig wechselwirkungsfreien Teilchengases eine Kraft
aufwenden müssen. Dies erscheint zunächst ungewöhnlich, da die Teilchen ja keine ab-
stoßenden Kräfte aufeinander auswirken. Allerdings ändern wir bei der Komprimierung
die Abmessungen des Potenzialtopfes, in dem die Teilchen eingesperrt sind, und damit ih-
re Energien. Bei einer Verringerung des Volumens vergrößern wir die möglichen Wellen-
vektoren (k ∝ 2π⇑L) und damit die Teilchenenergien (E ∝ k 2 ). Dies führt insgesamt zu ei-
ner Erhöhung der Gesamtenergie des Teilchensystems. Diese Energieerhöhung müssen wir
über die Arbeit ∫ p dV aufbringen.
270 7 Das freie Elektronengas
Kompressibilität: Für die Kompressibilität κ bzw. den Bulk-Modul B = 1⇑κ erhalten wir
(vergleiche (3.2.27))7
1 ∂p 2
= B = −V ( ) = n EF . (7.1.41)
κ ∂V T=const 3
7.1.2.1 Fermi-Dirac-Verteilung
Die Besetzungswahrscheinlichkeit der für die Teilchen eines Elektronengases zur Verfügung
stehenden Zustände ist durch die Fermi-Dirac-Verteilung
1
f (E) = E−µ (7.1.42)
e kB T
+1
gegeben. Hierbei ist µ das so genannte chemische Potenzial, dessen Bedeutung wir weiter
unten noch genauer diskutieren werden. Eine Ableitung der Fermi-Dirac-Verteilung ist in
Anhang B gegeben.
Die Fermi-Dirac-Verteilungsfunktion gibt an, mit welcher Wahrscheinlichkeit ein Zustand
mit der Energie E bei der Temperatur T besetzt ist. Sie ist in Abb. 7.5 grafisch dargestellt. Wir
sehen, dass mit zunehmender Temperatur eine Umverteilung der Besetzung der Elektronen-
zustände von E < E F nach E > E F erfolgt. Da aber k B T ≪ E F , ist der Anteil der Elektronen,
die an dieser Umverteilung teilnehmen, üblicherweise sehr klein. Bei Raumtemperatur ist
für typische Metalle k B T⇑E F ∼ 10−2 und es nimmt nur etwa 1% aller Elektronen an der Um-
verteilung teil. Dies wird bei der späteren Diskussion der thermischen Eigenschaften oder
der Transporteigenschaften des Elektronengases eine große Rolle spielen. In Abb. 7.5 gibt
1.0
0.8 / kBT = 10
Abb. 7.5: Grafische Darstellung der
0.6 Fermi-Dirac Verteilungsfunktion in
Abhängigkeit von der reduzierten
f (E)
die rote Kurve (µ⇑k B T = 200) die Situation bei Raumtemperatur realistisch wieder. Die Auf-
weichung der Fermi-Funktion ist kaum zu erkennen, da der Bereich der Breite k B T, über
den die Aufweichung stattfindet, in diesem Fall nur 0.005 ⋅ E⇑µ beträgt.
Abb. 7.6 zeigt das Produkt aus Zustandsdichte und Fermi-Verteilungsfunktion für T = 0
und T > 0. Wir sehen wiederum, dass sich die Anzahl der besetzten Zustände nur inner-
halb eines schmalen Intervalls der Breite k B T um E⇑µ = 1 ändert. Bei T = 0 fällt D(E) f (E)
bei E = µ abrupt auf null ab, während dieser Abfall bei endlichen Temperaturen über ein
Energieintervall der Breite ∼ k B T verschmiert ist.
1.8
1.0
0.8
1.5 0.6
f(E)
0.4 2kBT
1.2 0.2
0.0
0.0 0.2 0.4 0.6 0.8 1.0 1.2
E/
D(E) f(E)
0.9
T=0
0.6
0.3
T>0
0.0
0.0 0.2 0.4 0.6 0.8 1.0 1.2 1.4
E/
Abb. 7.6: Zustandsdichte mal Besetzungswahrscheinlichkeit als Funktion der reduzierten Energie E⇑µ
für T = 0 und T > 0. Beim Übergang von T = 0 zu T > 0 ändert sich die Besetzung der Zustände nur
innerhalb eines Energieintervalls der Breite k B T um E⇑µ = 1. Das Inset zeigt die Fermi-Dirac-Vertei-
lungsfunktionen für T = 0 und T > 0.
272 7 Das freie Elektronengas
µ(T = 0) = E F . (7.1.43)
Für beliebige Temperaturen können wir den Wert des chemischen Potenzials bestimmen,
indem wir berücksichtigen, dass die Summe über alle Besetzungswahrscheinlichkeiten aller
Elektronen gerade die Elektronenzahl N ergeben muss. Es muss also gelten
Bei der Lösung dieses Integrals verwendet man meist die Sommerfeld-Entwicklung. Der
Grundgedanke ist dabei der, dass wegen k B T ≪ µ die Verteilungsfunktion f (E) nur in ei-
nem schmalen Bereich der Breite k B T um E ≃ µ von der Verteilungsfunktion für T = 0 ab-
∞
weicht. Das Integral ∫0 D(E) f (E) dE weicht also vom Integral ∫0 D(E) dE bei T = 0 nur
µ
wenig ab, da sich die Integranden nur in der Nähe von E = µ unterscheiden und f (E) ober-
halb von E = µ schnell auf Null abfällt. Wir können deshalb eine Taylor-Entwicklung der
Stammfunktion um E = µ vornehmen (Sommerfeld-Entwicklung) und erhalten:9
∞
N = ∫ D(E) f (E) dE
0
µ
∞
d 2n−1 D(E)
= ∫ D(E) dE + ∑ (k B T)2n a n ( ) . (7.1.45)
n=1 dE 2n−1 E=µ
0
Mit
µ EF µ
9
siehe hierzu Anhang C oder Festkörperphysik, N. W. Ashcroft, N. D. Mermin, Oldenbourg Verlag,
München (2012).
7.1 Modell des freien Elektronengases 273
erhalten wir
⎨ ⎬
⎝ ⎠
EF 2
⎝
N = ∫ D(E) dE + ⎝(µ − E F )D(E F ) + (k B T) 2π
(
dD(E)
) ⎠⎠
⎝ 6 dE E=µ ⎠
0 ⎪ ⎮
̃.
= N(T = 0) + N (7.1.48)
2 ( d D(E)
dE
)
2π
µ(T) = E F − (k B T)
E=µ
(7.1.50)
6 D(E F )
⌋︂
Mit D(E) = ( )
V 2m 3⇑2
2π 2 ħ 2
E erhalten wir schließlich
π2 T 2
µ(T) = E F ⌊︀1 − ( ) }︀ (7.1.51)
12 TF
Diese Abhängigkeit ist in Abb. 7.7 gezeigt. Da bei Raumtemperatur für typische Metalle
T⇑TF ∼ 10−2 , können wir auch bei Raumtemperatur in guter Näherung µ(300 K) ≃ E F
schreiben.
Anmerkung: Das chemische Potenzial stellt eine wichtige thermodynamische Größe dar.
Es ist allgemein definiert durch die Gibbssche Fundamentalgleichung der inneren Energie U:
dU = T dS − p dV + ∑ µ i dn i . (7.1.52)
i
1.00
Raumtemperatur:
/ EF
𝝁 ≃ 𝑬𝐅
Dabei ist T die absolute Temperatur, S ist die Entropie, p der Druck, V das Volumen
und n i ist die Stoffmenge der Systemkomponente i. Bringen wir zwei thermodynamische
Systeme in Kontakt und lassen Wärme und Teilchenaustausch zu, so befinden sich diese
beiden Systeme genau dann im thermodynamischen Gleichgewicht, wenn T1 = T2 , p 1 = p 2
und µ 1 = µ 2 gilt. Das chemische Potenzial spielt also insbesondere bei Kontaktphänomenen
(z. B. Diode, Halbleiterheterostrukturen, Metall-Halbleiter-Kontakt) eine wichtige Rolle.
Der Wert von µ entspricht immer derjenigen mittleren Energie, die man aufbringen muss,
um dem System ein weiteres Teilchen hinzuzufügen.
∂∐︀Ũ︀
C Vklassisch = ⋁︀ = 2 ⋅ N ⋅ 3 ⋅ 12 k B = 3N k B . (7.2.1)
∂T V
Dieser klassische Wert, den wir nach dem Drude-Modell erwarten, ist jedoch um etwa den
Faktor 100 größer als der gemessene Wert. Dies war einer der ersten Hinweise darauf, dass
das klassische Drude-Modell die Situation nicht richtig beschreibt. Um das richtige Ergebnis
zu erhalten, müssen wir eine quantenmechanische Beschreibung vornehmen und das Pauli-
Prinzip berücksichtigen.
Die innere Energie eines Elektronengases erhalten wir ganz allgemein, indem wir über alle
Energiezustände multipliziert mit deren Besetzungswahrscheinlichkeit aufsummieren:
U = ∑ E(k) f (E k ) . (7.2.2)
k,σ
Mit Hilfe der Zustandsdichte D(E) können wir die Summation über alle k durch eine Inte-
gration über die Energie ersetzen:
∞ ∞
V 2m 3⇑2 E 3⇑2
U = ∫ dE E D(E) f (E) = ( ) ∫ (E−µ)⇑k B T dE . (7.2.3)
2π 2 ħ 2 e +1
0 0
7.2 Spezifische Wärme 275
Die Auswertung dieses Integrals ist leider schwierig, da es nicht analytisch lösbar ist. Man
verwendet deshalb die Sommerfeld-Entwicklung (siehe Anhang C)
µ
π2 d
U ≃ ∫ E D(E) dE + (k B T)2 ( )︀ED(E)⌈︀) +...
6 dE E≃E F
0
EF µ
π2 dD(E F )
≃ ∫ E D(E) dE + ∫ E D(E) dE + (k B T)2 ⌊︀E F + D(E F )}︀
6 dE
0 EF
π2 dD(E F )
≃ U(T = 0) + E F D(E F )(µ − E F ) + (k B T)2 ⌊︀E F + D(E F )}︀
6 dE
π 2 dD(E F ) π2
≃ U(T = 0) + E F ⌊︀D(E F )(µ − E F ) + (k B T)2 }︀ + (k B T)2 D(E F ) .
6 dE 6
(7.2.4)
̃ in (7.1.49) und muss deshalb ver-
Der Term in eckigen Klammern entspricht gerade N
schwinden. Somit erhalten wir
π2
U = U(T = 0) + (k B T)2 D(E F ) . (7.2.5)
6
∂U π2 2
CV = ⋀︀ = k T D(E F ) . (7.2.6)
∂T V 3 B
F)
Mit der Zustandsdichte D(E
V
= 32 ENF V = 3 n
2 EF
erhalten wir schließlich die auf das Volumen
bezogene spezifische Wärmekapazität
π 2 2 D(E F ) π 2 nk B2
cV = kB T= T =γT (7.2.7)
3 V 2 EF
π 2 2 D(E F ) π 2 nk B2
γ= k = , (7.2.8)
3 B V 2 EF
der durch D(E F ) und damit durch die Dichte und Masse der Ladungsträger bestimmt wird.
1.2
𝑻 = 𝟎
1.0
0.8
f (E)
0.6
𝜹𝑬 ∼ 𝒌𝐁𝑻
Abb. 7.8: Plausibilitätsbetrachtung zur
0.4
Wärmekapazität des Elektronengases. Ge-
zeigt ist eine Fermi-Dirac-Verteilungsfunk- 0.2
tion bei T = 0 (rot) und T > 0 (blau). Der 𝑻 > 𝟎
schattierte Bereich zeigt den Energiebereich 0.0
der Breite k B T, aus dem die Elektronen 0.0 0.2 0.4 0.6 0.8 1.0 1.2 1.4
zur Wärmekapazität beitragen können. E / EF
23
Fermi-Energie teilnehmen. Die Anzahl dieser Elektronen ist N th ≃ D(E F )k B T. Jedes dieser
Elektronen trägt etwa die Energie k B T zu U bei. Wir erwarten deshalb
U ≃ U(T = 0) + D(E F )(k B T)2 (7.2.9)
3N k B2
C V = 2D(E F )k B2 T = T. (7.2.10)
EF
Daraus ergibt sich eine spezifische Wärmekapazität c V = C V ⇑V , die bis auf den Faktor π 2 ⇑6
mit dem Ergebnis (7.2.7) übereinstimmt.
Wir sehen, dass die Wärmekapazität des Elektronengases proportional zu T zunimmt. Im
Vergleich zum klassischen Ergebnis C Vklass = 3N k B taucht in (7.2.7) bzw. (7.2.10) noch der
Faktor T⇑TF auf. Das heißt, dass wir wegen T ≪ TF nur einen kleinen Bruchteil der klas-
sisch erwarteten Wärmekapazität erhalten. Die Ursache dafür ist das Pauli-Prinzip, das bei
der klassischen Betrachtung natürlich außer Acht gelassen wurde. Es führt dazu, dass ein
Großteil der Elektronen nicht zur Wärmekapazität beitragen kann. Ihre Freiheitsgrade sind
quasi „eingefroren“.
Kalium
6
cp / T (mJ/mol K )
2
𝒄𝒎
𝒑
4 = 𝟐. 𝟎𝟖 + 𝟐. 𝟓𝟕 𝑻𝟐
𝑻
m
3
Abb. 7.9: Molare spezifische Wärme
von Kalium bei tiefen Temperaturen.
2
2 Geplottet ist c m
p ⇑T gegen T (Daten
0.0 0.3 0.6 0.9 1.2 1.5 1.8
aus W. H. Lien, N. E. Phillips, Phys.
2 2
T (K ) Rev. 133, A1370 (1964)).
zeigt, gibt es aber vor allem für die 3d-Übergangsmetalle große Abweichungen zwischen
Theorie und Experiment. Dies zeigt, dass das Modell der freien Elektronen für diese Metalle
wohl zu einfach ist. Für die 3d-Übergangsmetalle tragen die 3d-Elektronen zwar wesentlich
zur Zustandsdichte beim Fermi-Niveau bei, diese Elektronen sind aber stark lokalisiert und
können deshalb schlecht mit völlig delokalisierten, freien Elektronen beschrieben werden.
Tabelle 7.2: Vergleich zwischen experimentellem und nach (7.2.8) berechneten Wert des Sommerfeld-
Koeffizienten γ der elektronischen spezifischen Wärme.
Die beobachteten Abweichungen zwischen γ exp und γ theor haben im Allgemeinen folgende
Ursachen:
∎ Die Wechselwirkung der Elektronen mit dem durch die positiven Ionen gebildeten Kris-
tallpotenzial. Wir werden in Kapitel 8 sehen, dass dies zu einer Bandmasse m∗ der Elek-
tronen führt, die wesentlich größer als m sein kann. Deshalb kann γ ∝ m∗ auch wesent-
lich größer werden als der Wert, den wir mit der Masse m des freien Elektrons berechnen.
∎ Die Wechselwirkung der Elektronen mit den Phononen. Diese Wechselwirkung führt
auch zu einer erhöhten effektiven Masse. Anschaulich können wir argumentieren, dass
die Elektronen bei ihrer Bewegung durch das Kristallgitter dieses verformen. Sie müssen
dann eine Deformation mitschleppen, die zu einer erhöhten effektiven Masse führt.
∎ Die Wechselwirkung der Elektronen untereinander führt in ähnlicher Weise zu einer
erhöhten effektiven Masse.
10
Z. Fisk, H. R. Ott, T. M. Rice, J. L. Smith, Heavy-elctron metals, Nature 20 124–129 (1986).
11
M. B. Maple, Novel Types of Superconductivity in f-Electron Systems, Phys. Today 39(3), 72 (1986).
12
F. Steglich, Schwere-Fermionen-Supraleitung, Physik Journal, Nr. 8/9 (2004).
13
Frank Steglich, geboren am 14. März 1941 in Dresden. Steglich studierte von 1960 bis 1966 Physik
in Münster und Göttingen. 1969 promovierte er in Göttingen mit einer Arbeit zur thermischen
Leitfähigkeit in stark fehlgeordneten dünnen metallischen Filmen. 1976 habilitierte er sich an der
Universität zu Köln im Fach Physik. Von 1978 bis 1998 war er Professor für Experimentalphy-
sik am Institut für Festkörperphysik der Technischen Hochschule/Technischen Universität Darm-
stadt. 1996 war er Gründungsdirektor des Max-Planck-Instituts für chemische Physik fester Stoffe
in Dresden und übernahm dort die Abteilung Festkörperphysik. Steglich gilt als der Entdecker der
Schwere-Fermionen-Supraleitung (1979).
7.3 Transporteigenschaften 279
gung der magnetischen Momente koordiniert wird. Dieser Mechanismus scheint nicht nur
der Supraleitung in Metallen mit schweren Fermionen zugrunde zu liegen. Man vermutet
vielmehr, dass in ihm auch der Schlüssel zum Verständnis der Hochtemperatur-Supralei-
ter zu finden ist. Deshalb werden heute Schwere-Fermionen-Systeme immer noch intensiv
erforscht.
7.3 Transporteigenschaften
Wir werden uns in diesem Abschnitt mit den Transporteigenschaften des freien Elektro-
nengases beschäftigen. Dabei werden wir die Konzepte verwenden, die wir bereits in Ab-
schnitt 6.4 bei der Behandlung des Wärmetransports durch die Phononen eingeführt haben.
Eine genauere Diskussion der Transporteigenschaften von Festkörpern folgt in Kapitel 9,
nachdem wir das Modell freier Elektronen durch Berücksichtigung der periodischen Struk-
tur von kristallinen Festkörpern verfeinert haben und die daraus resultierende Bandstruktur
eingeführt haben.
Jq = σ E = −σ∇ϕ el . (7.3.1)
Hierbei haben wir verwendet, dass wir die elektrische Feldstärke E als Gradienten eines elek-
trischen Potenzials ϕ el schreiben können. Wir erkennen dann sofort die Analogie zum Aus-
druck (6.4.1) für die Wärmestromdichte Jh . Die Einheit der elektrischen Leitfähigkeit ist
1⇑Ωm oder A⇑Vm.
7.3.1.2 Drude-Modell
Aus historischen Gründen diskutieren wir zunächst das bereits im Jahr 1900 von Paul Drude
eingeführte Modell.14 Obwohl dieses Modell von falschen Annahmen ausging, konnte es den
linearen Zusammenhang zwischen elektrischer Stromdichte und elektrischem Feld (Ohm-
sches Gesetz) und auch den Zusammenhang zwischen elektrischer und thermischer Leit-
fähigkeit (Wiedemann-Franz-Gesetz) richtig erklären.
Drude ging von der Annahme aus, dass die Elektronen in einem Metall mit einem klassi-
schen Teilchengas beschrieben werden können. Die Elektronen bewegen sich mit der mittle-
ren thermischen Geschwindigkeit v th und stoßen ständig mit den Atomrümpfen. Die Elek-
tronen werden durch die Wirkung des elektrischen Feldes E beschleunigt und durch Stöße
14
Paul Drude, Zur Elektronentheorie der Metalle, I. Teil, II. Teil, und Berichtigung, Annalen der Physik
1, 556–613 (1900); ibid 3, 369–402 (1900); ibid 7, 687–692 (1902).
280 7 Das freie Elektronengas
dv vD
m = −eE − m . (7.3.2)
dt τ
Der Term m vτD hat die Form einer Reibungskraft und berücksichtigt die Stöße. Die Driftge-
schwindigkeit vD = v − vth gibt die vom elektrischen Feld zusätzlich bewirkte Geschwindig-
keitskomponente wider. Diese relaxiert durch Stöße innerhalb der charakteristischen Stoß-
zeit τ. Im stationären Fall ist dv⇑dt = 0 und wir erhalten
eτ
vD = − E = −µE . (7.3.3)
m
Hierbei haben wir die Beweglichkeit 15
⋃︀v D ⋃︀ eτ
µ≡ ⋃︀E⋃︀
= (7.3.4)
m
eingeführt. Die Beweglichkeit gibt an, welche Driftgeschwindigkeit vD der Ladungsträger pro
elektrische Feldstärke E erzeugt wird. Mit der Elektronendichte n erhalten wir die elektrische
Stromdichte zu
ne 2 τ
Jq = −envD = E = ne µE (7.3.5)
m
und damit die elektrische Leitfähigkeit
J q ne 2 τ
σ= = = ne µ . (7.3.6)
E m
Aus den bei Raumtemperatur gemessenen Leitfähigkeiten von Metallen ergeben sich Streu-
zeiten in der Größenordnung von 10−14 s, was zusammen mit der thermischen Geschwin-
digkeit von etwa 105 m⇑s zu mittleren freien Weglängen im Å-Bereich führt. Drude ging
deshalb davon aus, dass die Elektronen an den Atomrümpfen gestreut werden, da ja deren
Abstand gerade im Å-Bereich liegt. Eine offensichtlich falsche Annahme des Drude-Modells
ist, dass alle Elektronen beschleunigt und gestreut werden, da dies ja nicht mit der Fermi-
Dirac-Verteilung der Leitungselektronen vereinbar ist.
7.3.1.3 Sommerfeld-Modell
Die falschen Annahmen von Drude wurden von Arnold Sommerfeld korrigiert. Zur Be-
schreibung des elektrischen Transports in Metallen ging er von einem Gas freier Fermionen
aus, die der Schrödinger-Gleichung gehorchen und dem Pauli-Prinzip unterliegen. Mit
diesen Grundannahmen können wir mit Hilfe von einfachen Überlegungen einen Aus-
druck für die elektrische Leitfähigkeit ableiten, der das Verhalten von einfachen Metallen
15
Man beachte: Aufgrund ihrer negativen Ladung q = −e ist die Driftgeschwindigkeit vD der Elek-
tronen antiparallel zu E. Die Bewegung von Ladungsträgern mit Ladung q = −e antiparallel zu E ist
allerdings gleichbedeutend zu einer Bewegung von Ladungsträgern mit Ladung q = +e parallel zu
E. Die Beweglichkeit wird als Verhältnis der Beträge der Driftgeschwindigkeit und des elektrischen
Feldes, also als positive Größe definiert.
7.3 Transporteigenschaften 281
ħ 1 ħk
Jq = −e n ∐︀ṽ︀ = −e n ∐︀k̃︀ = −e ∑ . (7.3.7)
m V k,σ m
Im thermischen Gleichgewicht ist ∐︀k̃︀ = 0 und es fließt kein elektrischer Strom. Eine endliche
elektrische Stromdichte erhalten wir nur in einer Nichtgleichgewichtssituation. In Analogie
zu (6.4.3) können wir schreiben:
enħ enħ
Jq = − )︀∐︀k̃︀ − ∐︀k̃︀0 ⌈︀ = − δk . (7.3.8)
m m
Wir sehen, dass wir nur dann eine endliche Stromdichte erhalten, wenn die Impulsverteilung
der Elektronen von der Gleichgewichtsverteilung abweicht.
Wir müssen jetzt klären, wie sich die Impulsverteilung der Elektronen in einem bestimmten
Raumgebiet ändern kann. Hierzu tragen erstens von außen wirkende Kräfte und zweitens
Streuprozesse der Elektronen bei. Wir können also schreiben:
Wir werden im Folgenden nur stationäre Prozesse behandeln, d. h. Prozesse bei denen
d∐︀k̃︀
dt
= 0. Wir werden ferner für die zeitliche Änderung des mittleren Elektronenimpulses
durch Streuprozesse wie beim Drude-Modell einen einfachen Relaxationsansatz
machen. Das heißt, wir beschreiben die Änderung des mittleren Elektronenimpulses durch
eine mittlere Streuzeit τ. Die Änderung von ∐︀k̃︀ durch eine äußere Kraft F erhalten wir aus
der Bewegungsgleichung
∂∐︀ṽ︀ ∂∐︀k̃︀
F = −e E = m =ħ (7.3.11)
∂t ∂t
zu
∂∐︀k̃︀ eE
⋁︀ =− (7.3.12)
∂t Kraft ħ
16
Wir werden im Folgenden positive Elementarladungen mit e und negative mit −e bezeichnen. Die
Richtung der Stromdichte Jq = nev stimmt dann mit der technischen Stromrichtung überein.
282 7 Das freie Elektronengas
(a) ky (b) ky
kF
kF
kx kx
dkx
Abb. 7.10: Die Fermi-Kugel umschließt alle besetzten Elektronenzustände im k-Raum. (a) Für F =
0 ist der Gesamtimpuls null, da es zu jedem Wellenvektor k einen entsprechenden Wellenvektor −k
gibt. (b) Für F ≠ 0 wächst jeder Wellenvektor im Zeitinterval t um δk = Ftħ an. Dies entspricht einer
Verschiebung der Fermi-Kugel um δk. Die Zustände im hellblauen Bereich auf der linken Seite werden
in den dunkelblauen Bereich auf der rechten Seite umverlagert.
eEt
∐︀k̃︀(t) − ∐︀k̃︀0 = δk = − . (7.3.13)
ħ
Das bedeutet, dass durch die Kraft F der mittlere Impuls aller Elektronen innerhalb der Zeit t
um ħδk geändert wird. Dies entspricht der Verschiebung der gesamtem Fermi-Kugel um δk
innerhalb der Zeit t (siehe hierzu Abb. 7.10). Schalten wir die äußere Kraft ab, so relaxiert
δk ∝ e−t⇑τ aufgrund von Streuprozessen wieder gegen null.
Mit der Bedingung d∐︀k̃︀
dt
= 0 folgt aus (7.3.9)
eE
δk = − τ (7.3.14)
ħ
und wir erhalten damit aus (7.3.8) das Ohmsche Gesetz
ne 2 τ
Jq = E = ne µ E = −ne vD (7.3.15)
m
mit der Beweglichkeit [vergleiche (7.3.4)]
eτ
µ= . (7.3.16)
m
Wie beim Drude-Modell gibt die Beweglichkeit an, welche mittlere Driftgeschwindigkeit
vD = ħδk⇑m der Ladungsträger pro elektrische Feldstärke erzeugt wird. Für die elektrische
Leitfähigkeit ergibt sich mit der Definition (7.3.1)
ne 2 τ ne 2 ℓ
σ = ne µ = = . (7.3.17)
m mv F
Hierbei haben wir die mittlere freie Weglänge ℓ = v F τ benutzt. Die mittlere freie Weglänge
ist die Strecke, die ein Elektron innerhalb der mittleren Zeit τ zwischen zwei Streuprozessen
7.3 Transporteigenschaften 283
𝒌𝒚
erlaubt
verboten 𝒌𝑭
𝒌𝒙
Abb. 7.11: Zur Veranschaulichung des Ener-
giebereichs derjenigen Elektronen, für die
Streuprozesse möglich sind. Streuprozesse weit
innerhalb der Fermi-Kugel sind durch das Pauli-
Prinzip verboten. Nur Elektronen im Energie-
bereich der Breite ∼ k B T um die Fermi-Energie
𝒌 𝑩 𝑻 ≪ 𝑬𝑭 können an Streuprozessen teilnehmen.
32
zurücklegen kann. Zu beachten ist, dass zur Berechnung von ℓ die tatsächliche Geschwindig-
keit der Elektronen, d. h. die Fermi-Geschwindigkeit vF = ħkF ⇑m verwendet werden muss,
und nicht etwa die mittlere Driftgeschwindigkeit vD der Elektronen. Dies liegt daran, dass
nur Elektronen in einem schmalen Energieintervall der Breite ∼ k B T um die Fermi-Energie
an Streuprozessen teilnehmen können (siehe Abb. 7.11). Da der maximale Energieübertrag
bei einem Stoßprozess in der Größenordnung k B T ≪ E F liegt, können Elektronen weit un-
terhalb der Fermi-Energie keine Streuprozesse machen, da es keine freien Zustände gibt,
in die sie gestreut werden könnten. Das Pauli-Prinzip verbietet ja eine Doppelbesetzung.
Nur die Elektronen in dem Aufweichungsbereich der Breite ∼ k B T der Fermi-Kugel, al-
so diejenigen mit v ≃ v F , finden freie Zustände und können gestreut werden. Wir wollen
schließlich noch darauf hinweisen, dass die in Abb. 7.10 gezeigte Verschiebung δk der Fermi-
Kugel bei moderaten Feldstärken sehr klein ist. Für E = 102 V⇑m und τ = 10−14 s erhalten wir
δk ≃ 103 cm−1 , was verschwindend klein gegenüber k F ≃ 108 cm−1 ist (in Abb. 7.10 ist die
Verschiebung also viel zu groß dargestellt). Dies zeigt uns, dass der Stromfluss aufgrund des
angelegten elektrischen Feldes durch die Umverlagerung eines nur sehr kleinen Bruchteils
der Elektronen zustande kommt. Im Gegensatz zum Drude-Modell, wo sich alle Elektronen
mit v D bewegen und alle zum Stromfluss beitragen, sind dies beim Sommerfeld-Modell nur
die wenigen, aber wesentlich schnelleren Elektronen an der Fermi-Fläche.
Die Interpretation des Ergebnisses (7.3.17) für die elektrische Leitfähigkeit ist evident.
Wir erwarten natürlich, dass die transportierte Ladungsmenge proportional zu ne ist. Der
Faktor e⇑m muss auftauchen, da die Beschleunigung eines Elektrons im elektrischen Feld
proportional zu e⇑m ist. Die Zeit τ bzw. die mittlere freie Weglänge ℓ = v F τ beschreibt
schließlich das Zeit- bzw. Längenintervall, in dem ein Elektron durch das elektrische Feld
beschleunigt werden kann, bevor es durch einen Streuprozess wieder abgebremst wird. Die
mittlere freie Weglänge der Elektronen beträgt typischerweise einige 10 bis 100 nm, kann
aber bei tiefen Temperaturen und sehr reinen Materialien bis in den cm-Bereich ansteigen.
Streuprozesse werden wir im Detail erst in Abschnitt 9.3 diskutieren.
284 7 Das freie Elektronengas
Anmerkung zum Drude-Modell: Drude ging ursprünglich von einem klassischen freien
Elektronengas aus und erhielt für dieses⌈︂System ebenfalls das Ergebnis (7.3.17). Die mitt-
lere thermische Geschwindigkeit v th = 2k B T⇑m in einem solchen klassischen Gas ist bei
Raumtemperatur allerdings nur etwa 105 m⇑s und damit um mehr als eine Größenordnung
kleiner als die Fermi-Geschwindigkeit. Da man durch Messung von σ die Streuzeit τ be-
stimmt, berechnet man mit ℓ = v th τ im Rahmen des Drude-Modells eine sehr kleine mittlere
freie Weglänge im Bereich von nur 1 bis 10 Å. Drude nahm deshalb an, dass die Elektronen
an den positiven Atomrümpfen gestreut werden. Diese Vorstellung ist natürlich falsch. Wir
werden in Kapitel 8 sehen, dass die freie Weglänge für Elektronen (bei T = 0) in einem per-
fekten Kristallgitter unendlich groß wird. Streuprozesse kommen nur aufgrund von Abwei-
chungen von der perfekten periodischen Struktur zustande. Wir wollen schließlich darauf
hinweisen, dass im Rahmen des Drude-Modells (kein Pauli-Prinzip) alle Elektronen gestreut
werden können, während bei Berücksichtigung des Pauli-Prinzips nur ein kleiner Teil T⇑TF
der Elektronen nahe an der Fermi-Kante streuen kann.
1. Streuung an Phononen,
2. Streuung an Defekten und Verunreinigungen,
3. Streuung an der Probenoberfläche.
Wirken in einem Material mehrere Streuprozesse parallel, so kann die gesamte Streuzeit mit
Hilfe der empirischen Matthiessen-Regel bestimmt werden, nach der sich die Streuraten ad-
dieren:
1 1 1 1
= + + +... . (7.3.18)
τ τ1 τ2 τ3
𝝆
Streuung an Defekten,
Streuung an
Phononen
Verunreinigungen
𝝆𝐏𝐡 ∝ 𝑻
1. Hohe Temperaturen: T ≫ Θ D :
Wegen τ1ph ∝ ∐︀ñ︀ ∝ ΘTD erwarten wir
ρ ph ∝ T . (7.3.19)
2. Tiefe Temperaturen: T ≪ Θ D :
Innerhalb eines Debye-Modells (Zustandsdichte D(ω q ) ∝ ω 2q ) erhalten wir für die
ω∗
Zahl der Phononen ∫0 D(ω q )dω q ∝ ω∗ 3 . Mit ħω∗ ≃ k B T erhalten wir ∐︀ñ︀ ∝ T 3 . Wir
erwarten deshalb τ1ph ∝ ∐︀ñ︀ ∝ T 3 und damit ρ ph ∝ T 3 . Im Experiment beobachtet
man allerdings ρ ph ∝ T 5 . Dies liegt daran, dass wir zusätzlich noch einen Gewichts-
faktor zur Bewertung der Streuprozesse berücksichtigen müssen. Betrachten wir die
Streuung um einen Winkel ϑ zwischen den Wellenvektoren k und k′ vor und nach
der Streuung, so sehen wir aus Abb. 7.13, dass die Geschwindigkeitskomponente in
der ursprünglichen Richtung v − δv = v cos ϑ ist. Die verlorene relative Driftgeschwin-
digkeit ist also δv⇑v = 1 − cos ϑ. Da die Streuung um kleine Winkel nur kleine relative
Impulsüberträge liefert, muss der zusätzliche Gewichtsfaktor (1 − cos ϑ) berücksichtigt
werden. Für kleine ϑ (tiefe Temperaturen) gilt (1 − cos ϑ) ≃ 12 ϑ 2 ∝ q 2 = ω 2q ⇑v s2 , wobei v s
die Schallgeschwindigkeit ist. Wegen ω q = k B T⇑ħ ist (1 − cos ϑ) ∝ T 2 und wir erhalten
insgesamt
ρ ph ∝ T 5 . (7.3.20)
𝒌′
𝒒
𝜗 𝜹𝒗 𝜗 Abb. 7.13: Zur Veranschaulichung des
Gewichtsfaktors bei der Bewertung von
𝒗 𝐜𝐨𝐬𝝑 𝒌 Streuprozessen.
Streuung
1.0 an+ Defektenoptischer
undZweig Verunreinigungen: Die Anzahl der Defekte und Verunreini-
gungen in einer Probe ist temperaturunabhängig. Deshalb erwarten wir einen temperatur-
1/2
2
unabhängigen Beitrag
1. Brillouin-Zone
zum0.4elektrischen Widerstand. Diesen Beitrag können wir bei sehr tiefen Temperaturen
beobachten,
0.2 wenn der akustischer
Beitrag Zweig
durch die Elektron-Phonon-Streuung sehr klein wird. Man
nennt diesen temperaturunabhängigen Beitrag auch den Restwiderstand. In sehr reinen
0.0
einkristallinen Proben kann die mittlere freie Weglänge aufgrund von Defekten und
-1.0 -0.5 0.0 0.5
Verunreinigungen größer als1.0 1.5 2.0
die Probengröße werden. In diesem Fall müssen wir einen
qa /
34
286 7 Das freie Elektronengas
6 6 0.3
Ag, rein
D
Ag + 0.02 at % Sn
5 5 Au: 175 K
Ag + 0.5 at % Au
Cu + 3.32 at% Ni Na: 202 K
Cu: 303 K
(10 cm)
4 4 0.2
(10 cm)
Al: 395 K
/ (D)
Cu + 2.16 at% Ni Ni: 472 K
-6
3 3
-6
Cu + 1.12 at% Ni
2 2 0.1
1 1
Cu, rein
0 0 0.0
100 150 200 250 300 100 150 200 250 300 0.0 0.1 0.2 0.3 0.4 0.5
Abb. 7.14: Temperaturabhängigkeit des spezifischen elektrischen Widerstands von verschiedenen Me-
tallen: (a) Ag mit unterschiedlichen Verunreinigungskonzentrationen, (b) Cu mit Ni-Verunreinigung
(nach J. Linde, Ann. Phys. 5, 15 (1932)) und (c) reduzierter spezifischer Widerstand gegen reduzierte
Temperatur für unterschiedliche reine Metalle (nach D. K. C. MacDonald, in Handbuch der Physik XIV,
S. Flügge, Hrsg., Springer Verlag (1956)).
35
ρ(300 K)
RRR = . (7.3.22)
ρ0
Für reine Materialien wird der Widerstand bei 300 K durch die Elektron-Phonon-Streuung
dominiert. Gleichzeitig wird der Restwiderstand ρ 0 sehr klein und man erhält sehr hohe
RRR-Werte von bis zu 106 . Bei Legierungen wird dagegen auch bei 300 K der Widerstand
durch die Verunreinigungsstreuung dominiert und man erhält RRR ≃ 1. Eine weitergehende
Diskussion von Streuprozessen und die daraus resultierende Temperaturabhängigkeit des
elektrischen Widerstandes erfolgt in Abschnitt 9.3.
7.3 Transporteigenschaften 287
π 2 nk B2 τ
κ= T. (7.3.25)
3 m
In Metallen überwiegt die thermische Leitfähigkeit der Elektronen üblicherweise die ther-
mische Leitfähigkeit des Kristallgitters deutlich. Nur in stark verunreinigten oder ungeord-
neten Metallen wird die Streuzeit τ sehr klein und die Wärmeleitfähigkeit des Gitters kann
in die gleiche Größenordnung kommen wie diejenige des Elektronensystems. In Tabelle 7.3
sind die experimentellen Werte von κ(272 K) für einige Metalle aufgelistet.
Tabelle 7.3: Experimentelle Werte der thermischen Leitfähigkeit und der Lorenz-Zahl von Metallen bei
272 K (Quelle: G. W. C. Kaye, T. H. Laby, Table of Physical and Chemical Constants, Langmans Green,
London (1966)).
Wir sehen, dass gute elektrische Leiter auch gute Wärmeleiter und umgekehrt sind. In Ta-
belle 7.3 sind die Lorenz-Zahlen einiger Metalle aufgelistet. Sie stimmen gut mit dem theo-
retischen Wert überein.
Experimentell findet man, dass das Wiedemann-Franz-Gesetz immer nur bei hohen Tem-
peraturen (größenordnungsmäßig etwa 100 K) gut erfüllt ist und auch der nach (7.3.27)
erwartete Wert der Lorenz-Zahl gemessen wird. Zu tiefen Temperaturen hin nimmt dann
allerdings der Wert der Lorenz-Zahl ab und wird bei tiefen Temperaturen wieder konstant.
Grund für diese Temperaturabhängigkeit ist eine unterschiedliche Wichtung der Streu-
prozesse beim elektrischen und thermischen Transport. Für den elektrischen Widerstand
kommt es vor allem auf eine effektive Impulsrelaxation der Elektronen an, da der durch das
elektrische Feld erzeugte Zusatzimpuls δk abgegeben werden muss. Dies ist am effektivsten
durch Prozesse möglich, bei denen der Impuls von k ≃ +k nach k ≃ −k geändert wird.
Diese Prozesse führen zwar auch zu einem thermischen Widerstand, für den thermischen
Widerstand kommt es allerdings vor allem auf eine effektive Energierelaxation an. Ein
Temperaturgradient erzeugt nämlich keinen Zusatzimpuls der Elektronen, sondern eine
Zusatzenergie. Für eine Energierelaxtion sind aber auch Prozesse mit kleiner Impulsände-
rung (z. B. von k F + δk nach k F − δk mit δk ≪ k F ) effektiv. Diese Prozesse, die vor allem bei
tiefen Temperaturen wichtig sind, da die Phononenzustände mit hohen Impulsen ausfrieren,
tragen wenig zum elektrischen Widerstand bei. Dies erklärt die Abnahme der Lorenz-Zahl
mit abnehmender Temperatur.
Anmerkung zum Drude-Modell: Wir wollen hier nochmals eine Anmerkung zum
klassischen Drude-Modell machen. Ein großer Erfolg dieses Modells war, dass es das
Wiedemann-Franz-Gesetz richtig vorhersagte. Dies basierte allerdings auf dem Zufall, dass
sich zwei fehlerhafte Annahmen gerade gegenseitig kompensiert haben. Im Drude-Modell
wird im Ausdruck2κ = 13 c V v 2 τ der klassische Dulong-Petit-Wert c V = 3nk B anstelle des rich-
tigen Werts cv = π2 nk B TTF eingesetzt, d. h. ein um etwa den Faktor T⇑TF zu großer Wert. Dies
wird aber wiederum kompensiert, indem die thermische Geschwindigkeit v th 2
= 2k B T⇑m
anstelle der richtigen Fermi-Geschwindigkeit v F = 2k B TF ⇑m, also ein um etwa T⇑TF zu
2
niedriger Wert verwendet wird. Dadurch wird im Drude-Modell durch Zufall der richtige
7.3 Transporteigenschaften 289
4
10
hochreines Kupfer (99.999%)
3
10 Kupfer
(W / m K)
Aluminium
2
10 Konstantan
Messing
1
10
Edelstahl
0
10
Abb. 7.15: Temperaturabhängigkeit
0 1 2 3 der Wärmeleitfähigkeit von reinen
10 10 10 10
Metallen (Cu, Al) und Legierungen
T (K) (Messing, Konstantan, Edelstahl).
Ausdruck für die thermische Leitfähigkeit und somit auch das Wiedemann-Franz-Gesetz
erhalten.
Diese führt in Metallen zu einer im Vergleich mit Isolatoren viel kleineren mittleren freien
Weglänge und damit zu einem sehr kleinen Beitrag der Phononen zur Wärmeleitfähigkeit.
Die in Isolatoren dominierende Phonon-Phonon-Streuung ist in Metallen im Vergleich zur
Elektron-Phonon-Streuung vernachlässigbar klein. Der Beitrag des Gitters zur Wärmeleit-
fähigkeit von Metallen kann nur dann beobachtet werden, wenn der elektronische Beitrag
stark unterdrückt wird. Dies ist z. B. in Legierungen der Fall, in denen die Elektronen stark
an Fremdatomen und Defekten gestreut werden, so dass sie wenig zur Wärmeleitfähigkeit
beitragen können.
7.3.3 Thermokraft
Bei der Herleitung der Wärmeleitfähigkeit haben wir angenommen, dass kein Ladungstrans-
port stattfindet. Betrachten wir den in Abb. 7.16 gezeigten eindimensionalen metallischen
Leiter, dessen Temperatur T1 am einen Ende größer ist als die Temperatur T2 am anderen,
so erhalten wir im Mittel eine Elektronenbewegung von T1 nach T2 . Da die Elektronen aber
den Leiter nicht verlassen können, sammeln sie sich bei T2 an, was zu einem elektrischen
Feld E x parallel zum Temperaturgradienten dT⇑dx führt. Wir definieren nun
E ≡ S ∇T . (7.3.29)
1 dv dv
v diff = ]︀v(x 0 ) + (−vτ) − v(x 0 ) − (vτ){︀
2 dx dx
dv d v2 τ dv 2 dT
= −τv = −τ ( )=− . (7.3.31)
dx dx 2 2 dT dx
20
Thomas Johann Seebeck, deutsch-baltischer Physiker, geboren am 9. April 1770 in Reval (heute
Tallinn), gestorben am 10. Dezember 1831 in Berlin.
21
Th. J. Seebeck, Magnetische Polarisation der Metalle und Erze durch Temperaturdifferenz (1822–23),
in Ostwald’s Klassiker der Exakten Wissenschaften Nr. 70, Verlag von Wilhelm Engelmann, Leipzig
(1895).
7.3 Transporteigenschaften 291
𝒅𝑻/𝒅𝒙 𝑬 𝒙
+ 𝒗𝟏 𝒗𝟐
+ e e
+
+
𝑻𝟏 𝒙𝒐 − 𝒗𝝉 𝒙𝒐 𝒙𝒐 + 𝒗𝝉 𝑻𝟐
heiß kalt
𝒗𝐝𝐢𝐟𝐟 𝒗𝐝𝐫𝐢𝐟𝐭
Abb. 7.16:eindimensionales
Zur Entstehung der Thermokraft. Als Ladungsträger werden Elektronen mit Ladung −e an-
Modell:
genommen, so dass sich am kalten (heißen) Ende eine Anhäufung
𝑣1 − 𝑣2 1 negativer (positiver) Ladung ergibt.
mittlere Teilchengeschwindigkeit bei 𝑥0 : 𝑣diff = = 𝑣 𝑥0 − 𝑣𝜏 − 𝑣 𝑥0 + 𝑣𝜏
2 2
1 𝑑𝑣 𝑑𝑣
Taylor-Entwicklung um 𝑥 = 𝑥0 : 𝑣diff = 𝑣 𝑥0 + −𝑣𝜏 − 𝑣 𝑥0 − (𝑣𝜏)
2 𝑑𝑥
Wir können dieses Ergebnis auf drei Dimensionen erweitern, indem𝑑𝑥 wir v x2 durch 13 v 2 er-
22 𝑑𝑣 𝑑 𝑣2 𝜏 𝑑𝑣 2 𝑑𝑇
setzen und erhalten 𝑣diff = −𝜏𝑣 = −𝜏 = −
𝑑𝑥 𝑑𝑥 2 2 𝑑𝑇 𝑑𝑥
1 d mv 2
( ) ∇T + e E = 0 (7.3.34)
3 dT 2
2
ergibt. Wir benutzen jetzt noch, dass d
dT
( mv2 ) = c V ⇑n, also gleich der Wärmekapazität pro
Teilchen entspricht, und erhalten
1
E=− c V ∇T . (7.3.35)
3ne
Mit der Definition (7.3.29) der Thermokraft ergibt sich
1 π2 kB kB T π2 kB T
S=− cV = − =− . (7.3.36)
3ne 6 e EF 6 e TF
Hierbei haben wir den Ausdruck (7.2.7) für die spezifische Wärme des freien Elektronen-
gases benutzt. Wir erhalten für die Thermokraft S ≃ −142 µV⇑K ⋅ TTF . Mit TTF ≃ 10−2 erhalten
wir also Werte im Bereich von −1 µV⇑K. Dieser Wert wird in einfachen Metallen in der Tat
22
Es gilt v x2 + v 2y + v z2 = v 2 und außerdem v x2 = v 2y = v z2 für ein isotropes Medium. Deshalb können
wir v x2 durch 13 v 2 ersetzen.
292 7 Das freie Elektronengas
beobachtet. Allerdings wird die beobachtete Temperaturabhängigkeit und auch das Vorzei-
chen der Thermokraft im Modell des freien Elektronengases häufig nicht richtig wiederge-
geben. Experimentell findet man für einige Metalle sogar eine positive Thermokraft. Eine
Erklärung dieser Tatsache erfordert die Einbeziehung des Gitterpotenzials in die Transport-
theorie (siehe hierzu Kapitel 8). Die im Ausdruck für die Thermokraft auftretenden Terme
können wir anschaulich interpretieren. Der Faktor T⇑TF trägt der Tatsache Rechnung, dass
nur ein kleiner Bruchteile T⇑TF der Elektronen zu dem Prozess beitragen kann, der zur Ther-
mokraft führt. Der Faktor k B ⇑e gibt gerade das Verhältnis der von den einzelnen Elektronen
im Mittel transportierten Entropie und Ladungsmenge an. Erstere resultiert aus dem ange-
legten Temperaturgradienten ∇T, letztere führt zu einem elektrischen Feld E ∝ −∇ϕ el .
Anmerkung zum Drude-Modell: Das klassische Drude-Modell liefert einen viel zu hohen
Wert für die Thermokraft. Dies resultiert daher, dass man in (7.3.36) den um etwa den Fak-
tor T⇑TF ∼ 100 zu großen klassischen Wert c V = 3k B für die Wärmekapazität pro Teilchen
einsetzt. Im Rahmen des klassischen Modells tragen alle Elektronen zur Thermokraft bei. In
Wirklichkeit ist es aber aufgrund des Pauli-Prinzips nur ein kleiner Anteil T⇑TF .
gegeben. Zusätzlich zur Kraft FE = −eE durch das elektrische Feld müssen wir die Lorentz-
Kraft FL = −e v × B berücksichtigen. Für die zeitliche Änderung des mittleren Wellen-
vektors ∐︀k̃︀ aufgrund der wirkenden Kräfte und von Streuprozessen erhalten wir dann
(vergleiche (7.3.12))
Im stationären Zustand muss diese Änderung verschwinden. Mit der mittleren Drift-
geschwindigkeit δv = ∐︀ṽ︀ = ħδk
m
erhalten wir also
eτ
δv = − (︀E + δv × B⌋︀ . (7.3.39)
m
Hierbei erscheint in der Lorentz-Kraft nur die mittlere Zusatzgeschwindigkeit δv, da diese
ja eine mittlere Kraft auf alle Elektronen darstellt. Für E = 0 können wir im Kristall zu je-
dem Elektron mit Geschwindigkeit v auch ein Elektron mit Geschwindigkeit −v finden, so
dass die mittlere Lorentz-Kraft verschwindet. Wir weisen darauf hin, dass die eben gemachte
23
Wir benutzen im Folgenden wiederum die Elementarladung e als positive Größe, die Ladung eines
Elektrons beträgt also q = −e.
7.3 Transporteigenschaften 293
Betrachtung nur zur Abschätzung der mittleren Driftgeschwindigkeit und damit des mitt-
leren Driftstromes verwendet werden kann. Eine detaillierte Beschreibung der Bewegung
einzelner Elektronen in einem Kristallgitter werden wir erst in Kapitel 9 diskutieren.
Wir nehmen im Folgenden an, dass das Magnetfeld parallel zur z-Achse ausgerichtet ist. Wir
erhalten dann aus Gleichung (7.3.39) für die kartesischen Komponenten von δv:
Ex
δv x = −ω c τ ( + δv y ) (7.3.40)
B
Ey
δv y = −ω c τ ( − δv x ) (7.3.41)
B
Ez
δv z = −ω c τ ( ). (7.3.42)
B
Hierbei haben wir die Zyklotronfrequenz
eB
ωc ≡ = 1.76 × 1011 s−1 ⋅ B (︀T⌋︀ (7.3.43)
m
verwendet.24 Lösen wir das Gleichungssystem (7.3.40)–(7.3.42) nach δv x , δv y und δv z auf
und führen die Stromdichte Jq = −neδv ein, so erhalten wir
⎛ J q,x ⎞ σ0 ⎛ 1 −ω c τ 0 ⎞ ⎛E x ⎞
⎜ J q, y ⎟ = ⎜+ω τ 1 0 ⎟ ⎜E y ⎟ . (7.3.44)
⎝ J q,z ⎠ 1 + ω c τ ⎝ 0
c
0 1 + ω 2c τ 2 ⎠ ⎝ E z ⎠
2 2
Hierbei ist
ne 2 τ
σ0 = . (7.3.45)
m
7.3.4.1 Hall-Effekt
Wir betrachten nun die in Abb. 7.17 gezeigte Probenform. Das von außen angelegte elektri-
sche Feld soll in x-Richtung zeigen, das Magnetfeld in z-Richtung. Ein Ladungsfluss soll nur
24
Für τ → ∞ ergibt sich aus (7.3.38) d∐︀k̃︀
dt
= Fħ = −eE
ħ
− e δv×B
ħ
und somit δv̇ = mħ d∐︀k̃︀
dt
= − eE
m
− e δv×B
m
.
Wir erhalten damit
e
δv̇ x = − E x − ω c δv y
m
e
δv̇ y = − E y + ω c δv x
m
e
δv̇ z = − E z .
m
Die Lösung dieses Gleichungssystems ist eine Kreisbewegung in der x y-Ebene mit der Kreisfre-
quenz ω c . Den Fall ω c τ ≫ 1 werden wir aber erst später in Kapitel 9 diskutieren. In diesem Fall
sind die ebenen Elektronenwellen keine guten Eigenzustände mehr. Wir müssen den Effekt des
Magnetfeldes gleich von Anfang an berücksichtigen und neue Eigenzustände berechnen. Für Me-
talle ist ℓ ≃ 100 nm bzw. τ = ℓ⇑v F ≃ 10−13 s. Mit ω c ≃ 1011 s−1 bei B = 1 T ist für Metalle üblicher-
weise ω c τ ≪ 1. Dies ändert sich nur bei sehr hohen Magnetfeldern und sehr reinen Proben bei
sehr tiefen Temperaturen.
294 7 Das freie Elektronengas
𝑬𝒙 𝑩𝒛
𝑬𝒚
- 𝑭𝐄
𝑭𝐋 𝑱𝒒, 𝒙
𝒛
𝒚
𝒙
Abb. 7.17: Zur Veranschaulichung des Hall-Effekts. Die Elektronen bewegen sich entgegen der tech-
nischen Stromrichtung Jq in die negative x-Richtung. Sie werden dabei durch die Lorentz-Kraft in die
negative y-Richtung abgelenkt und bauen ein elektrisches Querfeld E y auf. Im stationären Zustand
kompensiert die Kraft FE = −eE y durch das Hall-Feld die Lorentz-Kraft FL = −eδv × B.
in x-Richtung möglich sein. Aus der Bedingung J q, y = 0 erhalten wir dann aus (7.3.44)
ω c τE x + E y = 0 48
(7.3.46)
oder
eBτ
E y = −ω c τ E x = − E x = −µBE x . (7.3.47)
m
Wir sehen also, dass sich in der Probe ein elektrisches Querfeld in y-Richtung aufbaut. Die-
se Erscheinung bezeichnen wir als Hall-Effekt.25 Das transversale elektrische Feld nennen
wir Hall-Feld. Das Hall-Feld kommt dadurch zustande, dass die Elektronen aufgrund der
Lorentz-Kraft eine Ablenkung in y-Richtung erfahren und sich dadurch auf der einen Stirn-
fläche der Probe ansammeln und von der gegenüberliegenden abwandern. Dieser Prozess
hält solange an, bis das entstandene elektrische Feld die Ablenkung der Elektronen im Ma-
gnetfeld gerade kompensiert.
Wir können in (7.3.47) mit Hilfe von (7.3.44) das elektrische Feld E x auch durch J q,x aus-
drücken und erhalten:
eBτ eBτ J q,x
Ey = − E x = −µBE x = − = R H BJ q,x . (7.3.49)
m m σ0
Die Größe
1
RH = − (7.3.50)
ne
bezeichnen wir als Hall-Koeffizienten und
Ey
ρx y = = RH B (7.3.51)
J q,x
25
Edwin Herbert Hall, geboren am 7. November 1855 in Great Falls, Maine; gestorben am 20. No-
vember 1938 in Cambridge, Massachusetts. 1879 entdeckte Hall im Alter von 24 Jahren den später
nach ihm benannten Hall-Effekt. Diese Entdeckung geschah im Zusammenhang mit seiner Dok-
torarbeit unter Henry Augustus Rowland (1848–1901). Von 1881 bis 1921 forschte er an der Har-
vard Universität auf dem Gebiet der Thermoelektrizität.
7.3 Transporteigenschaften 295
ρH I
U H = R H BJ q b = ρ H J q b = (7.3.48)
d
gegeben ist. Das heißt, U H steigt mit zunehmender elektrischer Stromdichte J q und zu-
nehmendem Magnetfeld B sowie mit zunehmender Probenbreite b an. Da man im Ex-
periment B und J q (z. B. wegen Heizeffekten) nicht beliebig erhöhen kann, muss man die
Probenbreite erhöhen, um eine genügend große Hall-Spannung zu erzielen. Dabei muss al-
lerdings beachtet werden, dass man nicht durch eine gegenseitige Verschiebung der Span-
nungsabgriffe für U H einen longitudinalen Spannungsanteil mitmisst.
Abb. 7.18: Typische Probengeometrie zur Messung des Hall-Effekts: Hall-Barren mit Länge L,
Breite b und Dicke d, das Magnetfeld steht senkrecht auf der Probenebene.
longitudinaler Magnetwiderstand ρ∥ B ∥ Jq
(7.3.53)
transversaler Magnetwiderstand ρ⊥ B ⊥ Jq .
Die relative Änderung des elektrischen Widerstands als Funktion des angelegten Magnet-
feldes
ρ(B) − ρ(0) ∆ρ
MR = = (7.3.54)
ρ(0) ρ
wird als Magnetowiderstandseffekt oder kurz als MR-Effekt (MR: Magneto Resistance) be-
zeichnet.
Transversaler Magnetwiderstand: Wir betrachten wieder die in Abb. 7.17 gezeigte Geo-
metrie. Der von außen aufgeprägte Strom soll in x-Richtung fließen und das Magnetfeld soll
in z-Richtung angelegt sein. Mit der Bedingung J q,y = 0 folgt aus (7.3.44)
ω c τE x + E y = 0 . (7.3.55)
Setzen wir den daraus folgenden Ausdruck für E y in (7.3.44) ein, so erhalten wir
σ0 σ0
J q,x = (E x − ω c τE y ) = (E x + ω 2c τ 2 E x )
1 + ωc τ
2 2 1 + ω 2c τ 2
σ0
= (1 + ω 2c τ 2 )E x = σ0 E x . (7.3.56)
1 + ω 2c τ 2
Wir sehen also, dass ρ(B) = 1⇑σ0 = const ist. In der gezeigten Konfiguration verschwindet al-
so der transversale Magnetwiderstand.26 Die Ursache dafür ist, dass die aus dem Hall-Feld E y
resultierende Kraft −eE y die Lorentz-Kraft −eδv × B = eδv x B z ŷ gerade kompensiert. Die
Ladungsträger können sich somit mit der Driftgeschwindigkeit δv x in x-Richtung bewegen,
ohne dass sie die Lorentz-Kraft aufgrund des anliegenden Magnetfeldes spüren. In Experi-
menten beobachtet man allerdings für alle nicht-magnetischen Metalle immer einen endli-
chen Magnetwiderstand. Dies zeigt, dass das Bild der freien Elektronen zu einfach ist und
wir für die Erklärung des transversalen Magnetwiderstands unser Modell erweitern müs-
sen. Dies können wir z. B. im Rahmen des Modells freier Elektronen durch ein so genanntes
Zweiband-Modell tun, das wir später in Abschnitt 9.9.2 vorstellen werden. Wir werden in
26
Man beachte, dass die Randbedingung J q,y = 0 nur für die in Abb. 7.18 gezeigte Probengeometrie
erfüllt ist. Wir können aber auch eine andere Konfiguration wählen (z. B. eine Corbino-Scheibe,
siehe The Hall and Corbino Effects, E. P. Adams, Proc. Am. Phil. Soc. 54, 47–51 (1915)), für wel-
che die Randbedingung E y = 0 vorliegt. In diesem Fall folgt aus (7.3.44) J q,x = 1+ωσ02 τ 2 E x , d.h ein
c
endlicher Magnetwiderstand ∆ρ⇑ρ ∝ B 2 .
7.3 Transporteigenschaften 297
Kapitel 9 aber auch sehen, dass wir bei Berücksichtigung des periodischen Gitterpotenzi-
als und des damit verbundenen Übergangs von freien Elektronen zu Kristallelektronen eine
starke Modifikation der Bewegung von Elektronen in elektrischen und magnetischen Fel-
dern erhalten. Dies werden wir in Kapitel 9 genauer diskutieren.
Anschaulich können wir uns den positiven Magnetwiderstand durch eine Verkleinerung der
effektiven freien Weglänge ℓ zwischen zwei Stoßereignissen erklären. Die Elektronen bewe-
gen sich nämlich zwischen zwei Stößen (z. B. mit Verunreinigungen oder Phononen) auf
gekrümmten Bahnen. Nur die langsame Driftgeschwindigkeit erfolgt geradlinig, da sich die
Lorentz-Kraft aufgrund des B-Feldes und die Kraft aufgrund des Hall-Feldes gerade kom-
pensieren. Wichtig ist, dass die Bewegungsgeschwindigkeit zwischen zwei Stößen der Fermi-
Geschwindigkeit entspricht, die wesentlich größer ist als die mittlere Driftgeschwindigkeit
der Elektronen und folglich in einer wesentlich größeren Lorentz-Kraft resultiert. Eine Plau-
sibilitätsbetrachtung zur Verkürzung der mittleren freien Weglänge durch ein transversales
Magnetfeld wird im nachfolgenden Kasten gemacht.
Der beobachtete positive Magnetwiderstand folgt der so genannten Kohler-Regel27 , 28 , 29
∆ρ ρ(B) − ρ(0) B
= =F( ) = F (ω c τ) . (7.3.57)
ρ0 ρ(0) ρ(0)
Hierbei ist F eine Funktion, die von der Art des jeweiligen Metalls abhängt. Da der Magnet-
widerstand nicht vom Vorzeichen von B abhängen darf, kann die Funktion F keine lineare
Funktion in B sein. Experimentell beobachtet man in kleinen Feldern meist eine quadrati-
sche Abhängigkeit. Eine Plausibilitätsbetrachtung dafür ist im nachfolgenden Kasten gege-
ben, eine tiefer gehende Diskussion folgt später in Kapitel 9.
Der positive Magnetwiderstand tritt auch in magnetischen Metallen auf, auch wenn er dort
teilweise von wesentlich größeren negativen Magnetowiderstandseffekten (der Widerstand
nimmt mit zunehmendem Feld ab) überlagert wird. Gleichung (7.3.57) zeigt, dass der posi-
tive Magnetwiderstand sehr groß werden kann, wenn ρ 0 sehr klein bzw. die Streuzeit τ sehr
groß ist. Dies ist in sehr reinen Metallen bei sehr tiefen Temperaturen der Fall.30 So nimmt
z. B. in reinem Cu oder Ag der Widerstand in angelegten Feldern von etwa 10 T bei niedrigen
Temperaturen um bis zu 100% zu.31 Bei Raumtemperatur ist der positive Magnetwiderstand
aber generell klein und deshalb nicht für Anwendungen nutzbar.
ℓ⇑2 φ φ 1 φ 3
= sin ( ) ≃ − ( ) (7.3.58)
Rc 2 2 6 2
und damit
1 2 2
ℓ = ℓ 0 (1 − τ ωc ) . (7.3.59)
24
Der spezifische Widerstand ρ ist reziprok zur effektiven mittleren freien Weglänge ℓ und
damit ergibt sich
−1 1 2 2 −1
∆ρ ℓ 0 (1 − τ ωc ) − ℓ−1
= 24 0
. (7.3.60)
ρ0 ℓ−1
0
2
Mit σ = ne 2 τ⇑m und ω c = eB⇑m folgt dann = ( ρB0 ) , was der Kohler-Regel ent-
∆ρ 1
ρ0 24n 2 e 2
spricht.
𝝋/𝟐 𝝋/𝟐
𝑹𝒄
𝑹𝒄
Abb. 7.19: Driftbewegung von Elektronen ohne (a) und mit (b) Magnetfeld. Vollständige Umläufe
auf Landau-Bahnen sind nur bei sehr niedrigen Temperaturen, sehr reinen Proben und hohen Ma-
gnetfeldern zu erwarten.
lel zum Magnetfeld erfolgt. Dies steht im Widerspruch zu den experimentellen Befunden.
Da die Bewegung zwischen den einzelnen Streuprozessen aber in beliebige Richtungen er-
folgt und ja nur die mittlere Driftgeschwindigkeit parallel zu B ist, können wir die gleiche
54
Plausibilitätsbetrachtung wie beim transversalen Magnetwiderstand machen und damit eine
effektive Verkürzung von ℓ und somit endlichen positiven Magnetwiderstand ableiten.
Für das detaillierte Verständnis des longitudinalen Magnetwiderstands benötigen wir die
Kenntnis der E(k)-Abhängigkeiten von Elektronen unter dem Einfluss des periodischen
7.3 Transporteigenschaften 299
Gitterpotenzials. Wir werden in Kapitel 8 sehen, dass die Flächen konstanter Energie für
solche Elektronen eine komplizierte Form annehmen können. Einen longitudinalen Ma-
gnetwiderstand erwarten wir nur dann, wenn die Flächen konstanter Energie nicht mehr
wie für freie Elektronen kugelsymmetrisch sind. Generell ist die Abhängigkeit des Magnet-
widerstands einer einkristallinen Probe eine komplizierte Funktion der Richtung von Strom
und Magnetfeld relativ zu den Kristallachsen. Diesen komplexen Zusammenhang wollen
wir hier nicht diskutieren.
Lange bekannt ist der „anisotrope magnetoresistive Effekt“ (AMR), der bereits 1857 durch
Thomson entdeckt wurde und in ferromagnetischen Materialien auftritt. Deren spezifischer
Widerstand ist parallel zur Magnetisierung einige Prozent größer als senkrecht dazu. Der
AMR ist allerdings erst über 100 Jahre nach seiner Entdeckung in die erste technische
Anwendung eingeflossen. Dabei handelte es sich um die Leseeinheit in Bubblespeichern
Ende der 1960er Jahre. Um 1980 wurde mit der Entwicklung der ersten AMR-Sensoren
begonnen. In dünnen Schichten aus weichen ferromagnetischen Materialien ist die Magne-
tisierung leicht drehbar, so dass mit Hilfe des AMR Magnetfeldsensoren realisiert werden
können.
Eine rasante Entwicklung der Untersuchung und auch der technischen Nutzung magnetore-
sistiver Effekte setzte Ende der 1980er Jahre ein, als Peter Grünberg und Albert Fert fast zeit-
gleich entdeckten, dass der elektrische Strom in Schichtsystemen, die aus ferromagnetischen
und nicht-magnetischen, metallischen Schichten bestehen, stark von der relativen Orientie-
rung der Magnetisierung in den ferromagnetischen Schichten abhängt.33 , 34 , 35 Es wurde fest-
gestellt, dass der elektrische Widerstand der Vielschichtsysteme groß bzw. klein ist, wenn
in benachbarten ferromagnetischen Schichten die Magnetisierungsrichtungen antiparallel
32
siehe z. B. Spinelektronik, R. Gross und A. Marx, Vorlesungsskript, Technische Universität Mün-
chen (2004).
33
P. Grünberg, R. Schreiber, Y. Pang, M. B. Brodsky, H. Sower, Layered Magnetic Structures: Evidence
for Antiferromagnetic Coupling of Fe Layers across Cr Interlayers, Phys. Rev. Lett. 57, 2442 (1986).
34
G. Binasch, P. Grünberg, F. Saurenbach, W. Zinn, Enhanced magnetoresistance in layered magnetic
structures with antiferromagnetic interlayer exchange, Phys. Rev. B 39, 4828 (1989).
35
M. N. Baibich, J. M. Broto, A. Fert, Van Dau Nguyen, F. Petroff, P. Etienne, G. Creuset, A. Friedrich,
J. Chazelas, Giant Magnetoresistance of (001)Fe/(001)Cr Magnetic Superlattices, Phys. Rev. Lett. 61,
2472 (1988).
300 7 Das freie Elektronengas
bzw. parallel ausgerichtet sind (siehe Abb. 7.20). Der damit verbundene, sehr große magne-
toresistive Effekt (typischerweise einige 10%) wurde Giant MagnetoResistance (GMR) Effekt
genannt. Ein solcher Effekt ist genau das, was gebraucht wird, um die Daten aus Festplatten
auszulesen, wobei magnetisch gespeicherte Information in einen elektrischen Strom umge-
wandelt werden muss. Daher gingen sehr schnell Wissenschaftler und Techniker daran, den
GMR-Effekt für einen Lesekopf auszunützen. Bereits 1997, also nur etwa 10 Jahre nach der
7.3 Transporteigenschaften 301
Fe Fe
1.1 Cr Cr
Fe Fe
Cr Cr
Fe Fe
1.0
Aufhängung
0.9 GMR Kopf
(Fe 30Å/Cr 18Å)30
0.8
R / R(0)
0.7
(Fe 30Å/Cr 12Å)35 Verdrahtung 1 mm
0.6
-4 -3 -2 -1 0 1 2 3 4
0H (T)
Abb. 7.20: Magnetwiderstand von Fe/Cr-Schichtstrukturen bei 4.2 K. Es wird ein maximaler Magnet-
widerstand bei einer Cr-Schichtdicke von 0.9 nm beobachtet. Für diese Schichtdicke liegt im feld-
freien Fall eine antiparallele Kopplung der Magnetisierungsrichtungen der Fe-Schichten vor (nach
M. N. Baibich et al., Phys. Rev. Lett. 61, 2472 (1988)). Rechts ist ein GMR-Lesekopf gezeigt (Quelle:
IBM Deutschland).
Entdeckung des GMR-Effekts, wurde der erste auf diesem Effekt beruhende Lesekopf von
der Firma IBM vorgestellt. Diese Konstruktion wurde sehr schnell Stand der Technik und
auch viele andere Entwicklungen bauen auf den GMR. Die Entdeckung des GMR-Effekts
hat also in kurzer Zeit zu einem großen wirtschaftlichen Erfolg geführt.36 Für die Entde-
ckung des Riesenmagnetowiderstands wurde der Nobelpreis für Physik im Jahr 2007 an den
Deutschen Peter Grünberg und den Franzosen Albert Fert verliehen.
Weitere magnetoresistive Effekte wie der Colossal MagnetoResistance (CMR) Effekt37 , 38 , 39
oder der Tunneling MagnetoResistance (TMR) Effekt40 , 41 werden heute intensiv erforscht.
Der TMR kommt bereits heute bei der Realisierung von so genannten Magnetic Random
Access Memories (MRAM) zum Einsatz. Hierbei handelt es sich um nichtflüchtige Spei-
cherelemente mit Zugriffszeiten im ns-Bereich.42 , 43
36
P. Grünberg, Magnetfeldsensor mit ferromagnetischer dünner Schicht, Patent-Nr.: P 3820475 (1988).
37
R. von Helmholt, J. Wecker, B. Holzapfel, L. Schultz, and K. Samwer, Giant negative magnetoresist-
ance in perovskite like La2⇑3 Ba1⇑3 MnOx ferromagnetic films, Phys. Rev. Lett. 71, 2331 (1993).
38
J. M. D. Coey, M. Viret, S. von Molnar, Mixed-valence manganites, Adv. Phys. 48, 167 (1999).
39
Y. Tokura (Ed.), Colossal Magnetoresistive Oxides, Gordon and Breach Science Publishers, London
(1999).
40
J. S. Moodera, L. R. Kinder, T. M. Wong, R. Meservey, Large Magnetoresistance at Room Tempera-
ture in Ferromagnetic Thin Film Tunnel Junctions, Phys. Rev. Lett. 74, 3273 (1995).
41
T. Miyazaki et al., Spin polarized tunneling in ferromagnet/insulator/ferromagnet junctions, J. Magn.
Magn. Mat. 151, 403 (1995).
42
Spin Electronics, M. Ziese and M. J. Thornton eds., Springer Berlin (2001).
43
Magnetische Schichtsysteme, 30. Ferienkurs des Instituts für Festkörperforschung, FZ-Jülich
GmbH, Schriften des Forschungszentrums Jülich (1999).
302 7 Das freie Elektronengas
2L
λn = , n = 1, 2, 3, . . . , (7.4.1)
n
2π π
k z,n = = n, n = 1, 2, 3, . . . . (7.4.2)
λn L
Die zugehörigen Energieeigenwerte lauten
ħ 2 k z,n
2
ħ2 π2 2
єn = = n . (7.4.3)
2m 2m L 2
Wir sehen, dass wir im Vergleich zum Fall ohne Einschränkung in z-Richtung eine Erhöhung
ħ 2 k z,1
2
ħ2 π2
∆E = = (7.4.4)
2m 2m L 2
der Grundzustandsenergie erhalten. Wir nennen diese Energieerhöhung Confinement-
Energie. Sie wächst proportional zu 1⇑L 2 an und ist eine direkte Folge der Einschränkung
der Wellenfunktion auf den Bereich ∆z ≤ L. Diese Einschränkung im Ortsraum erhöht die
Impulsunschärfe auf ∆p z ≥ ħ⇑L. Die damit verbundene Energieerhöhung ist durch (7.4.4)
gegeben.
7.4 Niedrigdimensionale Elektronengassysteme 303
ħ2 2
⌊︀− ∇ + V (z)}︀ Ψ(r) = E Ψ(r) (7.4.5)
2m
mit
)︀
⌉︀
⌉︀0 für − 2 ≤ z ≤ + 2
⌉︀
L L
V (z) = ⌋︀ . (7.4.6)
⌉︀
⌉︀
⌉︀ ∞ ⋃︀z⋃︀ > L
]︀ für 2
ħ2 ∂2 ∂2
⌊︀− ( 2 + 2 )}︀ e ık∥ ⋅r = E∥ e ık∥ ⋅r (7.4.8)
2m ∂x ∂y
ħ2 ∂2
⌊︀− + V (z)}︀ ϕ n (z) = є n ϕ n (z) . (7.4.9)
2m ∂z 2
Für die x y-Richtung erhalten wir ebene Wellen mit den bekannten Energieeigenwerten
ħ 2 k∥2
E∥ = . (7.4.10)
2m
Für die z-Richtung erhalten wir die Lösung
)︀
⌉︀
⌉︀
⌉︀ ⌋︂ e
1 ı k z,n z
für − L2 ≤ z ≤ + L2
ϕ n (z) = ⌋︀ L . (7.4.11)
⌉︀
⌉︀
⌉︀ für ⋃︀z⋃︀ > L
]︀0 2
mit den Energieeigenwerten (7.4.3). Für die Gesamtenergie erhalten wir somit
ħ 2 k∥2 ħ2 π2 2
E n = E∥ + є n = + n . (7.4.12)
2m 2m L 2
Wir erhalten also für die Eigenenergien Parabeln entlang von k x und k y (siehe Abb. 7.21b).
Wir bezeichnen diese Parabeln, die für k∥ = 0 die Werte є n besitzen, als 2D-Subbänder. Falls
L sehr klein wird, wird der Abstand der Subbänder wegen є n ∝ 1⇑L 2 sehr groß. Die 2D-Sub-
bänder besitzen eine konstante Zustandsdichte (vergleiche (7.1.20) und Abb. 7.2)
)︀
⌉︀
⌉︀ 2 = const für E ≥ є n
A 2m
(2D)
D n (E) = ⌋︀ 2π ħ . (7.4.13)
⌉︀
⌉︀
]︀0 sonst
304 7 Das freie Elektronengas
zweidimensionales Elektronengas
𝜺𝟐
𝜺𝟐 𝜺𝟐
𝜺𝟏
𝜺𝟏 𝜺𝟏
−𝑳/𝟐 𝟎 𝑳/𝟐 𝒛 𝟎 𝒌║ 0 1 2 3 4
𝑫 / (𝑨 𝒎/𝝅ℏ𝟐 )
67
Die gesamte Zustandsdichte in allen Subbändern ist gegeben durch
D(E) = ∑ D(2D)
n (E) . (7.4.14)
n
Sie ist eine Überlagerung von konstanten Beiträgen, was in der in Abb. 7.21c gezeigten Stu-
fenfunktion resultiert.
Wir möchten darauf hinweisen, dass für die Bestimmung der Eigenenergien є n die exak-
te Form des Potenzials V (z) notwendig ist. Bei Halbleitern muss dabei die Existenz von
Raumladungen berücksichtigt werden. Das bedeutet, dass V (z) von der Dichte der freien
Elektronen und der ionisierten Dotieratome abhängt und deshalb die Wahrscheinlichkeits-
dichte ⋃︀ϕ n (z)⋃︀2 in das Potenzial über die Elektronendichte eingeht. Man muss deshalb (7.4.9)
selbstkonsistent lösen. In einfachster Näherung können wir jedoch V (z) durch ein Recht-
eckpotenzial oder, wie wir später in Abschnitt 10.4.1 für den Fall von modulationsdotierten
Heterostrukturen sehen werden, durch ein Dreieckspotenzial annähern. Ferner ist die An-
nahme unendlich hoher Potenzialwälle nur eine grobe Näherung. Bei endlicher Höhe V0 des
Potenzialwalls erhalten wir Lösungen
)︀
⌉︀
⌉︀
⌉︀a e
κz
für z < − L2
ϕ n (z) = ⌋︀ , (7.4.15)
⌉︀
⌉︀
⌉︀ −κz
für z > + L2
]︀a e
wobei die charakteristische Abklinglänge 1⇑κ gegeben ist durch:
2m
κ2 = (E − E∥ + V0 ) . (7.4.16)
ħ2
Die Lösung Ψ = ϕ n (z)e ık∥ ⋅r beschreibt eine Welle, die sich parallel zum Potenzialwall frei
ausbreitet und senkrecht dazu exponentiell abklingt. Solche Wellen, deren Wellenvektor in
z-Richtung rein imaginär ist, werden als evaneszente Wellen bezeichnet.
7.4 Niedrigdimensionale Elektronengassysteme 305
ħ 2 k x2 ħ 2 k x2 ħ2 π2 2 ħ2 π2 2
E n 1 ,n 2 = + є n 1 ,n 2 = + n + n , (7.4.18)
2m 2m 2m L 2z 1 2m L 2y 2
wobei die beiden Quantenzahlen n 1 und n 2 die Eigenzustände in der yz-Ebene charakteri-
sieren. Wir erhalten also parabelförmige 1D-Subbänder, die wir durch die beiden Quanten-
zahlen n 1 und n 2 klassifizieren können. Für die Zustandsdichte gilt jetzt
D(E) = ∑ D(1D)
n 1 ,n 2 (E) (7.4.19)
n 1 ,n 2
mit
)︀
⌉︀
⌉︀ π ( ħ 2 ) (E − є n 1 ,n 2 )−1⇑2
L 2m 1⇑2
für E ≥ є n 1 ,n 2
n 1 ,n 2 (E)
D(1D) = ⌋︀ . (7.4.20)
⌉︀
⌉︀
]︀0 sonst
Der Verlauf der 1D-Subbänder und der zugehörigen Zustandsdichte ist in Abb. 7.22 gezeigt.
Wir sehen, dass die Zustandsdichte Singularitäten aufweist, wo die Ableitung der Disper-
sionskurven E(k x ) verschwindet
eindimensionales Elektronengas
(vergleiche hierzu auch (5.3.25) in Abschnitt 5.3.3).
𝜺𝟏,𝟐
𝜺𝟏,𝟐
𝜺𝟏,𝟏
𝜺𝟏,𝟏
𝟎 𝒌𝒙 𝟎 𝟏 𝟐 𝟑 𝟒
𝑫/ 𝟐𝑳𝟐 𝒎/𝝅𝟐 ℏ𝟐
Abb. 7.22: Quantisierung der Energiezustände eines eindimensionalen Elektronengases. (a) Energie-
parabeln der 1D-Subbänder. ⌈︂
(b) Zustandsdichte des eindimensionalen Elektronengases. Die Zustands-
dichte ist die Summe der 1⇑ E − E n 1 ,n 2 -Zustandsdichten der einzelnen Subbänder. Die gestrichelte
⌋︂
Kurve gibt den Verlauf D(E) ∝ E eines dreidimensionalen Elektronengases wieder.
68
306 7 Das freie Elektronengas
Hierbei sind k l und k r die Wellenvektoren der nach links und rechts laufenden Elektro-
nen. Für µ 1 = µ 2 ergibt die Summe exakt null und wir erhalten keinen Nettostrom. Die
Summation über den Spin-Freiheitsgrad ergibt einen Faktor 2 und wir ersetzen ∑k durch
∫ Z
(1D)
(k) dk. Mit Z (1D) = L⇑2π erhalten wir
∞
2e ħk l
Iq = − ∫ )︀ f (k) − f r (k)⌈︀ dk . (7.5.2)
2π m
0
Hierbei haben wir die Differenz k l − k r durch die Differenz der Besetzungzahlen ausge-
drückt. Wir ersetzen nun dk durch dE⇑ħv k und erhalten
∞
2e
Iq = − ∫ ( f (E − µ 1 ) − f (E − µ 2 )) dE . (7.5.3)
2πħ
0
𝑧
𝑦
𝑥 1D-Kanal
𝝁𝟏 𝝁𝟐
𝑬
𝑬
𝜺𝟐
𝝁𝟏 𝑬 Abb. 7.23: Eindimensionaler
𝒆𝑼 Transportkanal zwischen zwei
𝝁𝟐 Ladungsträgerreservoiren mit
chemischen Potenzialen µ 1
𝜺𝟏 und µ 2 . In den dreidimensio-
𝒌
𝒌𝒙 nalen Reservoiren liegt eine pa-
𝒌 rabelförmige Dispersion vor. In
𝑬 𝒌𝒍 Zustände (Quasi-Fermi-Niveau) dem eindimensionalen Kanal lie-
𝝁𝟏 Mittelwert der gen aufgrund der Einschnürung
Quasi-Fermi-Niveaus in y- und z-Richtung Subbänder
𝒌𝒓 Zustände
𝝁𝟐 vor, von denen im gezeigten Fall
𝒙 nur das unterste beitragen kann.
70
308 7 Das freie Elektronengas
Ug Gate-Elektrode
Isolator
10
Jx
8
2D-Elektronengas
Abb. 7.24: Leitwertquantisierung
G (2e /h)
6
in einem ballistischen-Quanten-
2
Punktkontakt bei T = 0.6 K. Der
Quanten-Punkt-Kontakt wurde in 4
einem zweidimensionalen Elektro-
nengas in einer GaAs/AlGaAs-He- 2
terostruktur erzeugt (nach B. J. van
Wees, H. van Houten, C. W. J. Beenak-
ker, J. G. Williamson, L. P. Kouwen- 0
-2.0 -1.8 -1.6 -1.4 -1.2 -1.0
hoven, D. van der Marel, C. T. Foxon,
Phys. Rev. Lett. 60, 848–850 (1988)). Ug (V)
herausfällt. Dies ist völlig analog zum thermischen Transport (vergleiche (6.4.30)), bei dem
die Gruppengeschwindigkeit der Phononen herausfällt. Das Integral über die Differenz der
Fermi-Funktionen ergibt gerade ∆µ = µ 1 − µ 2 = (−e)U und wir erhalten
e2 1 h
Iq = 2 U bzw. R= . (7.5.4)
h 2 e2
N
Abb. 7.25: Äquivalenter Schaltkreis für die Un-
tersuchung des Ladungstransports über eine
C kleine metallische Insel. Die Insel ist über die
Steuerelektrode Widerstände R an die Quelle S und Senke D und
G kapazitiv an eine Steuerelektrode G angekoppelt.
+𝑼𝑺𝑫 /𝟐 Die Spannung U zwischen Quelle und Senke
SD
𝑼𝑮 ist symmetrisch angelegt. Mit der Steuerspan-
−𝑼𝑺𝑫 /𝟐
nung U G kann die potenzielle Energie der Insel
verschoben werden.
E el = − QU G = − NeU G . (7.5.7)
2C 2C
310 7 Das freie Elektronengas
1.5
1.0
Eel / EC
Abb. 7.26: Elektrostatische Energie
einer kapazitiv an eine Steuerelektro-
de gekoppelten metallischen Insel als
0.5
Funktion der Steuerspannung U G EC EC EC
und der Elektronenzahl N auf N=-2 N=+2
der Insel. Zwei benachbarte Para-
beln E el (N + 1) und E el (N) schnei- N=-1 N=0 N=1
den sich bei U G = (N + 1⇑2)e⇑C. 0.0
Bei U G = Ne⇑C beträgt der -1.5 -1.0 -0.5 0.0 0.5 1.0 1.5
energetische Abstand E C .
CUG / e
Hierbei ist N eine ganze Zahl und Q = Ne die bezüglich des ladungsneutralen Zustands
fehlende oder überschüssige Ladung auf der Insel. Wichtig ist, dass aufgrund der diskreten
Natur der Elementarladung die Ladung Q auf der Insel nur diskrete Werte annehmen kann.
Der erste Term in (7.5.7) gibt die kapazitive Ladungsenergie an und der zweite die potenzi-
elle Energie durch die Steuerspannung U G . Wir nehmen der Einfachheit halber an, dass die
gesamte kapazitive Kopplung der Insel an die Umgebung durch die Kapazität C der Steuer-
elektrode erfolgt. Wir können Gleichung (7.5.7) durch Ausklammern von e 2 ⇑2C umformen
und erhalten
e2 CU G 2 CU G 2
E el = ⌊︀(N − ) −( ) }︀ . (7.5.8)
2C e e
Lassen wir den letzten Term, der unabhängig von N ist weg, so erhalten wir die elektrosta-
tische Energie
CU G 2
E el (N) = E C (N − ) (7.5.9)
e
mit der charakteristischen Energie E C = e 2 ⇑2C, die gerade der Ladungsenergie einer Ele-
mentarladung auf der Kapazität C entspricht. Tragen wir E el (N) gegen CU G ⇑e auf, so
erhalten wir, wie in Abb. 7.26 gezeigt ist, für jedes N eine Parabel. Wir sehen, dass sich
benachbarte Parabeln E el (N) und E el (N + 1) bei U G = (N + 1⇑2)e⇑C schneiden. Bei die-
ser Steuerspannung kann folglich die Ladung der Insel ohne Energieaufwand um eine
Elementarladung geändert werden. Dagegen müssen wir bei der Spannung U G = Ne⇑C
die Energie E C aufbringen, um die Inselladung um eine Elementarladung zu ändern.
Für eU SD ≪ E C wird deshalb kein Ladungsfluss über die Insel möglich sein, da die hohe
Coulomb-Energie Änderungen des Ladungszustandes unterdrückt. Wir nennen diesen
Effekt Coulomb-Blockade. Den Energieunterschied benachbarter Parabeln können wir
aus (7.5.9) zu
1 CU G
E el (N ± 1) − E el (N) = 2 (±N + ∓ ) EC (7.5.10)
2 e
7.5 Transporteigenschaften von niederdimensionalen Elektronengasen 311
berechnen.
Um den Coulomb-Blockade-Effekt beobachten zu können, müssen wir sicherstellen, dass
Änderungen des Ladungszustandes nicht durch thermische oder Quantenfluktuationen er-
möglicht werden. Thermische Fluktuationen spielen dann keine Rolle, wenn k B T ≪ E C ist.
Dies ist gleichbedeutend mit
e2 e2
T≪ oder C≪ . (7.5.11)
2k B C 2k B T
Setzen wir Zahlen ein, so sehen wir, dass C = 1 fF einer Temperatur von 1 K entspricht. Selbst
wenn wir extrem kleine Kapazitäten verwenden, müssen wir die Probe also noch auf tiefe
Temperaturen abkühlen. Wenn es uns aber gelingt, Kapazitäten im aF-Bereich zu realisieren,
können wir den Coulomb-Blockade-Effekt auch bei Raumtemperatur beobachten. Um eine
obere Grenze für die Größe der in Abb. 7.25 gezeigten Insel abzuschätzen, können wir die po-
tenzielle Energie ausrechnen, die wir aufbringen müssen, um eine Elementarladung aus dem
Unendlichen auf eine Kugel mit Radius R zu bringen. Diese Energie beträgt e 2 ⇑є 0 R, die äqui-
valente Kapazität C = є 0 R⇑2. Damit diese Energie groß gegen k B T wird, muss R ≪ e 2 ⇑є 0 k B T
sein. Für T = 1 K erhalten wir R ≪ 100 µm. In der Praxis müssen allerdings metallische In-
seln üblicherweise Abmessungen im 100 nm-Bereich haben, um C = 1 fF zu erreichen. Da
die Fermi-Wellenlänge von Metallen im Å-Bereich liegt, stellt eine metallische Insel mit
diesen Abmessungen aber immer noch ein dreidimensionales Elektronensystem dar. Der
Niveauabstand ∆E ∼ E F ⇑n el V der Elektronenzustände liegt aufgrund der hohen Elektro-
nendichte n el in Metallen bei einem würfelförmigen Volumen mit Kantenlänge 100 nm im
µeV-Bereich und ist somit wesentlich kleiner als E C ∼ 0.1–1 meV oder k B T ∼ 100 µV bei 1 K.
Wir können deshalb in guter Näherung von einem kontinuierlichen Energiespektrum aus-
gehen. Das zeigt uns, dass der hier betrachtete Coulomb-Blockade-Effekt nichts mit Quan-
tum-Confinement zu tun hat und ein rein klassischer Effekt aufgrund des diskreten Werts
der Elementarladung ist.
Selbst bei T = 0 führt die Tatsache, dass die Ladung im Mittel nur eine Zeit ∆t = R g C⇑2π
auf der Insel bleibt, zu einer Energieunschärfe Γ = h⇑R g C der Ladungsenergie. Hierbei ist
R g = R⇑2 der gesamte Widerstand, mit dem die Insel an die Umgebung gekoppelt ist. Diese
Unschärfe muss klein gegen E C sein, was gleichbedeutend mit
h
Rg ≫ = RQ (7.5.12)
e2
ist. Der Widerstand R g muss also groß gegenüber dem Quantenwiderstand R Q sein, um zu
vermeiden, dass Quantenfluktuationen die Beobachtbarkeit des Coulomb-Blockade-Effekts
verhindern.
Wir wollen nun im Detail diskutieren, was bei einer Variation der Steuerspannung U G = 0
passiert. Variieren wir die Steuerspannung beginnend von U G = 0 in positive oder negative
Richtung, so wandern wir zunächst auf der N = 0 Parabel nach oben, bis wir den Schnitt-
punkt mit der N = +1 oder N = −1 Parabel erreichen. Die Ladung auf der Insel ändert sich
dann sprunghaft um ±e und wir wandern auf der N = +1 bzw. N = −1 Parabel wieder nach
unten. Bei einer Variation von U G folgen wir also der in Abb. 7.26 rot gestrichelten Kurve,
312 7 Das freie Elektronengas
𝒆𝑼𝑮 = 𝟎 -1 ↔ -2
-1 ↔ -2 𝒆𝑼𝑮
-2 ↔ -3
(c) 3 (d)
2
0
𝑻 > 𝟎 74
-1
𝑻 = 𝟎
-2
-3
-2 -1 0 1 2 -2 -1 0 1 2
CUG / e CUG / e
Abb. 7.27: Plausibilitätsbetrachtung zum Ladungstransport über eine metallische Insel für (a) U G = 0
und (b) U G = e⇑2C. Die blauen Linien im Bereich der Insel markieren die Änderung der potenzi-
ellen Energie bei der durch die Zahlen bezeichneten Änderung der Ladungszahl. Durch Variation
von U G werden diese Linien entsprechend (7.5.10) nach oben oder unten verschoben. Die gestrichelten
75
Pfeile markieren verbotene, die durchgezogenen erlaubte Transportprozesse. In (c) ist die Änderung
der Ladungszahl N auf der Insel bei Variation der Steuerspannung U G gezeigt. In (d) ist der Leit-
wert G SD = I SD ⇑U SD als Funktion der Steuerspannung U G bei einer konstanten Spannung U SD ≪ E C ⇑e
aufgetragen.
die den Grundzustand des Systems darstellt. Die Ladung auf der Insel ändert sich dabei je-
weils bei U G = (N + 1⇑2)e⇑C sprunghaft um ±e und bleibt dazwischen konstant. Dies ist
in Abb. 7.27(c) gezeigt. Aufgrund von thermischen und Quantenfluktuationen sind die im
Experiment beobachteten Sprünge immer mehr oder weniger stark verrundet.
Wir müssen jetzt noch den Ladungstransport zwischen Quelle und Senke diskutieren. Hier-
bei wollen wir annehmen, dass eU SD ≪ E C . Bei T = 0 kann Ladungstransport nur dann
stattfinden, wenn beim Transport auf die Insel und von der Insel keine Energie benötigt wird.
In Abb. 7.27(a) ist die Situation für U G = 0 gezeigt. Die Insel befindet sich im ladungsneu-
tralen Zustand (N = 0). Die Änderung dieses Ladungszustandes nach N = +1 oder N = −1
verschiebt die potenzielle Energie der Insel gemäß (7.5.10) um +E C bzw. −E C . Die entspre-
chenden Niveaus sind in Abb. 7.27(a) und (b) durch die waagrechten blauen Linien markiert.
Literatur 313
Alle durch die gestrichelten Pfeile angedeuteten Transportprozesse auf die oder von der Insel
kosten Energie und sind energetisch nicht möglich. Es findet kein Ladungstransport statt,
wir befinden uns also im Bereich der Coulomb-Blockade. Ladungstransport würde erst dann
∗
einsetzen, wenn wir die Spannung U SD auf den Schwellwert U SD = 2E C ⇑e = e⇑C erhöhen
würden. Nehmen wir eine I SD (U SD )-Kennlinie für U G = 0 auf, so findet im gesamten Be-
∗ ∗
reich zwischen −U SD und +U SD kein Ladungstransport statt. Dieser Spannungsbereich stellt
den Blockade-Bereich dar.
In Abb. 7.27(b) ist die Situation für U G = e⇑2C gezeigt. Für diese Steuerspannung be-
wirkt gemäß (7.5.10) die Änderung des Ladungszustandes von N = 0 nach N = −1 keine
Verschiebung der potenziellen Energie. Das entsprechende Niveau liegt deshalb bei der
Fermi-Energie. Wie Abb. 7.27(b) zeigt, können in diesem Fall Elektronen für beliebig kleine
U SD von der Insel in die Senke wandern und von links aus der Quelle wieder nachgefüllt
werden (durchgezogene rote Pfeile). Das heißt, für diese Steuerspannung verschwindet
der Blockade-Bereich vollkommen und wir erwarten ein scharfes Maximum für den Leit-
wert G SD = I SD ⇑U SD . Äquivalente Maxima erhalten wir für U G = (N + 1⇑2)e⇑C. Dies ist
in Abb. 7.27(d) gezeigt. Das Auftreten der äquidistanten Leitwertmaxima können wir uns
anschaulich so erklären, dass wir mit der Steuerspannung die in Abb. 7.27(b) eingezeich-
neten Energieniveaus vertikal verschieben können. Einen Leitwertpeak erhalten wir immer
dann, wenn ein Niveau zwischen den chemischen Potenzialen von Quelle und Senke zu
liegen kommt. Es sei noch angemerkt, dass durch die endlichen Energien k B T, eU SD und Γ
die scharfen Maxima je nach experimentellen Begebenheiten mehr oder weniger stark
verrundet werden.
Wir müssen uns jetzt noch fragen, was passiert, wenn wir die Insel so klein machen, dass
wir aufgrund von Quanten-Confinement einen Übergang zu einem quasi-nulldimensiona-
len Elektronensystem mit einem diskreten Energiespektrum erhalten. Der Niveauabstand
der Elektronenzustände kommt dann bei genügend kleinen Systemen in den Bereich der
Ladungsenergie E C und wir können bei der Diskussion der Ladungseffekte nicht mehr von
einem kontinuierlichen Energiespektrum ausgehen. Dies manifestiert sich darin, dass die
Maxima in der gemessenen I SD (U SD )-Kennlinie nicht mehr äquidistant sind. Sie zeigen viel-
mehr für jede Probe charakteristische Abstände, die das Niveauschema der untersuchten
Probe widerspiegeln. Weitere interessante Effekte kommen durch den Spin der Elektronen
und angelegte Magnetfelder zustande, die wir aber hier nicht diskutieren wollen.
Literatur
N. W. Ashcroft, N. D. Mermin, Festkörperphysik, Oldenbourg Verlag, München (2012).
M. N. Baibich, J. M. Broto, A. Fert, Van Dau Nguyen, F. Petroff, P. Etienne, G. Creuset,
A. Friedrich, J. Chazelas, Giant Magnetoresistance of (001)Fe/(001)Cr Magnetic Super-
lattices, Phys. Rev. Lett. 61, 2472 (1988).
G. Binasch, P. Grünberg, F. Saurenbach, W. Zinn, Enhanced magnetoresistance in layered
magnetic structures with antiferromagnetic interlayer exchange, Phys. Rev. B 39, 4828
(1989).
314 7 Das freie Elektronengas
J. M. D. Coey, M. Viret, S. von Molnar, Mixed-valence manganites, Adv. Phys. 48, 167 (1999).
P. Drude, Zur Elektronentheorie der Metalle, I. Teil, II. Teil, und Berichtigung, Annalen der
Physik 1, 556–613 (1900); ibid 3, 369–402 (1900); ibid 7, 687–692 (1902).
E. Fawcett, High-field galvanomagnetic properties of metals, Advances in Physics 13, 139
(1964).
F. R. Fickett, Transverse magnetoresistance of oxygen-free copper, IEEE Trans. Magn. 24, 1156
(1988).
Z. Fisk, H. R. Ott, T. M. Rice, J. L. Smith, Heavy-elctron metals, Nature 20, 124–129 (1986).
R. Gross, A. Marx, Spinelektronik, Vorlesungsskript, Technische Universität München
(2004).
P. Grünberg, Magnetfeldsensor mit ferromagnetischer dünner Schicht, Patent-Nr.: P 3820475
(1988).
P. Grünberg, R. Schreiber, Y. Pang, M. B. Brodsky, H. Sower, Layered Magnetic Structures:
Evidence for Antiferromagnetic Coupling of Fe Layers across Cr Interlayers, Phys. Rev.
Lett. 57, 2442 (1986).
M. Kohler, Theorie der magnetischen Widerstandseffekte in Metallen, Annalen der Physik 32,
211 (1938).
Magnetische Schichtsysteme, 30. Ferienkurs des Instituts für Festkörperforschung, FZ-Jülich
GmbH, Schriften des Forschungszentrums Jülich (1999).
M. B. Maple, Novel Types of Superconductivity in f-Electron Systems, Phys. Today 39(3), 72
(1986).
T. Miyazaki et al., Spin polarized tunneling in ferromagnet/insulator/ferromagnet junctions,
J. Magn. Magn. Mat. 151, 403 (1995).
J. S. Moodera, L. R. Kinder, T. M. Wong, R. Meservey, Large Magnetoresistance at Room Tem-
perature in Ferromagnetic Thin Film Tunnel Junctions, Phys. Rev. Lett. 74, 3273 (1995).
G. E. R. Schulze, Metallphysik , Springer-Verlag, Berlin (2012).
Th. J. Seebeck, Magnetische Polarisation der Metalle und Erze durch Temperaturdifferenz
(1822–23), in Ostwald’s Klassiker der Exakten Wissenschaften Nr. 70, Verlag von
Wilhelm Engelmann, Leipzig (1895).
F. Steglich, Schwere-Fermionen-Supraleitung, Physik Journal, Nr. 8/9 (2004).
Y. Tokura (Ed.), Colossal Magnetoresistive Oxides, Gordon and Breach Science Publishers,
London (1999).
R. von Helmholt, J. Wecker, B. Holzapfel, L. Schultz, K. Samwer, Giant negative magnetore-
sistance in perovskite like La2⇑3 Ba1⇑3 MnOx ferromagnetic films, Phys. Rev. Lett. 71, 2331
(1993).
M. Ziese, M. J. Thornton eds., Spin Electronics, Springer Berlin (2001).
J. M. Ziman, Electrons and Phonons, Clarendon Press (1963).
8 Energiebänder
Das bisher betrachtete Modell des freien Elektronengases
konnte, wie wir in Kapitel 7 gesehen haben, einige Fest-
körpereigenschaften wie die spezifische Wärme oder die
Transporteigenschaften von einfachen Metallen ganz gut
beschreiben. Wir haben aber bereits an einigen Stellen dar-
auf hingewiesen, dass Abweichungen zwischen Modellvor-
hersagen und Experiment wohl auf die stark vereinfachen-
den Annahmen dieses Modells zurückzuführen sind. Es
gibt aber auch Festkörpereigenschaften, die im Rahmen des
freien Elektronengasmodells völlig unverstanden bleiben.
Insbesondere bleiben folgende Fragen offen:
Um diese Eigenschaften erklären zu können, müssen wir das bisherige Modell erweitern, in-
dem wir das periodische Kristallpotenzial V (r) der positiven Atomrümpfe berücksichtigen.
Von den beiden in Kapitel 7 gemachten Annahmen
lassen wir also die erste fallen. An der zweiten Annahme, dass die Elektronen nicht mitein-
ander korreliert sein sollen, halten wir aber nach wie vor fest. Wir beschreiben den Fest-
körper als ein Gitter von starren positiven Atomrümpfen, durch das sich die Elektronen
völlig unkorreliert (quasi wie Skifahrer in einer Buckelpiste) bewegen können. Greifen wir
316 8 Energiebänder
uns ein Elektron heraus, so bewegt sich dieses in einem zeitlich konstanten und räumlich
periodischen Potenzial V (r), das von allen anderen Elektronen und den Atomkernen her-
vorgerufen wird. Der Vorteil dieser Einelektron-Näherung ist, dass wir das Verhalten von
nur einem Elektron untersuchen müssen. Die quantenmechanische Behandlung dieses Pro-
blems wurde sehr bald nach der Entwicklung der Quantenmechanik angegangen. Wichtige
Beiträge kamen von Felix Bloch1 in seiner Doktorarbeit (1928), sowie von Arnold Sommer-
feld2 und Hans Bethe3 (um 1930) und N. F. Mott4 . In der quantenmechanischen Behandlung
müssen wir für ein Elektron die Schrödinger-Gleichung lösen. Den N-Elektronenzustand
erhalten wir dann durch Auffüllen der Einelektronenzustände unter Berücksichtigung des
Pauli-Prinzips.
Um das beschriebene Problem zu lösen, werden wir zwei Betrachtungsweisen heranziehen:
Beide Näherungen werden uns qualitativ zum gleichen Ergebnis führen: Im Festkörper ent-
stehen so genannte Energiebänder, die durch verbotene Bereiche, so genannte Energielücken
voneinander getrennt sind. Schließlich werden wir Grenzen der Einelektron-Näherung dis-
kutieren und uns mit wechselwirkenden Vielelektronensystemen beschäftigen.
1
siehe Kasten auf Seite 318.
2
siehe Kasten auf Seite 262.
3
Hans Albrecht Bethe, geboren am 2. Juli 1906 in Straßburg, gestorben am 6. März 2005 in Ithaca,
New York. Er erhielt den Nobelpreis für Physik 1967 für „seine Beiträge zur Theorie der Kernre-
aktionen, insbesondere seine Entdeckungen bezüglich der Energieerzeugung in Sternen“.
4
Sir Nevill Francis Mott, geboren am 30. September 1905 in Leeds, gestorben am 08. August 1996
in Milton Keynes, Buckinghamshire, war britischer Physiker. Er erhielt den Nobelpreis für Physik
1977 für „die grundlegenden theoretischen Leistungen zur Elektronenstruktur in magnetischen
und ungeordneten Systemen“ (gemeinsam mit Philip Warren Anderson und John Hasbrouck van
Vleck).
8.1 Bloch-Elektronen 317
8.1 Bloch-Elektronen
Wir wissen, dass ein idealer Festkörper eine streng periodische Anordnung von Atomen
darstellt. Es stellt sich dann die Frage, wie sich Elektronen in diesem Festkörper bewegen
können, ohne dass sie dabei von den positiven Atomrümpfen beeinträchtigt werden. Diese
Frage wurde von Felix Bloch in seiner Doktorarbeit (1928) beantwortet.5 Die Elektronenwel-
len unterscheiden sich von ebenen Wellen durch eine gitterperiodische Modulation. Diese
nach Felix Bloch benannten Bloch-Wellen werden in einem perfekt periodischen Festkörper
nicht gestreut. Nur Abweichungen von der strengen Periodizität führen zu Streuprozessen.
Wir wollen in diesem Abschnitt die Lösungen der zeitunabhängigen Schrödinger-Gleichung
ħ2 2
ℋΨ(r) = ⌊︀− ∇ + V (r)}︀ Ψ(r) = EΨ(r) (8.1.1)
2m
V (r) = V (r + R) (8.1.2)
betrachten, wobei
R = n 1 a1 + n 2 a2 + n 3 a3 n 1 , n 2 , n 3 = ganzzahlig (8.1.3)
sein. Die Koeffizienten VG der Fourier-Reihe nehmen für ein Coulomb-Potenzial mit 1⇑G 2
ab, weshalb in der Reihenentwicklung meist nach wenigen Termen abgebrochen werden
kann. Der allgemeinste Lösungsansatz für die gesuchte Wellenfunktion Ψ(r) ist durch ei-
ne Linearkombination ebener Wellen
5
Felix Bloch, Über die Quantenmechanik der Elektronen in Kristallgittern, Doktorarbeit, Universität
Leipzig (1928).
318 8 Energiebänder
gegeben, wobei die Wellenvektoren k die Randbedingungen erfüllen müssen, die aus
den endlichen Probenabmessungen L x , L y , L z resultieren (vergleiche hierzu (7.1.8) in
8.1 Bloch-Elektronen 319
ħ2 k 2
∑ C k e ık⋅r + ∑ C k VG e ı(k+G)⋅r = E ∑ C k e ık⋅r . (8.1.8)
k 2m k,G k
Die Umbenennung des Summationsindex ist erlaubt, da wir ja über alle Werte der Wellen-
vektoren k und alle reziproken Gittervektoren aufsummieren. Die Umbenennung ändert
deshalb nicht den Wert der Summationsglieder, sondern nur ihre Reihenfolge. Da (8.1.9)
für jeden Ortsvektor r erfüllt sein muss, muss der Ausdruck in den rechteckigen Klammern,
der unabhängig von r ist, für jeden Wellenvektor k separat verschwinden. Das heißt,
ħ2 k 2
( − E) C k + ∑ VG C k−G = 0 . (8.1.10)
2m G
Dieser Satz von algebraischen Gleichungen ist nichts anderes als eine Darstellung der
Schrödinger-Gleichung im reziproken Raum. Sie liefern für jedes k eine Lösung Ψk mit
zugehörigem Eigenwert E k . Auf den ersten Blick erscheint der Satz von algebraischen
Gleichungen unhandlich zu sein, da wir im Prinzip unendlich viele Koeffizienten C k−G
bestimmen müssen. In der Praxis stellt sich allerdings heraus, dass bereits eine kleine Zahl
ausreichend ist, um die Situation richtig zu beschreiben.
Wir sehen, dass die Gleichungen (8.1.10) nur diejenigen Entwicklungskoeffizienten C k
von Ψk (r) koppeln, deren k-Werte sich um einen reziproken Gittervektor G unterscheiden.
Das heißt, es werden die Koeffizienten
gekoppelt, wobei k in der 1. Brillouin-Zone liegt (siehe Abb. 8.1). Damit zerfällt das Glei-
chungssystem (8.1.10) in N unabhängige Gleichungssysteme, und zwar jeweils eines für je-
den erlaubten k-Vektor aus der 1. Brillouin-Zone. Die Anzahl N der möglichen Wellenvekto-
ren in der 1. Brillouin-Zone wird durch die Randbedingungen gegeben. Für den in Abb. 8.1
gezeigten eindimensionalen Fall gilt
VBZ 2π⇑a Lx
N= = = , (8.1.12)
2π⇑L x 2π⇑L x a
das heißt, N entspricht der Anzahl von Einheitszellen des betrachteten Festkörpers.
320 8 Energiebänder
𝒌−𝑮 𝒌 2𝜋 𝒌+𝑮
𝐿𝑥
2𝜋 𝜋 𝟎 𝜋 2𝜋 𝒌𝒙
− − + +
𝑎 𝑎 𝑎 𝑎
𝑮
1. Brillouin-Zone
Abb. 8.1: Überlagerung von k-Werten zur Konstruktion einer Bloch-Welle. Die Punkte stellen die auf-
grund der Randbedingungen erlaubten k-Zustände im eindimensionalen k-Raum dar.
Wir sehen, dass jedes der N Gleichungssysteme eine Lösung liefert, die eine Superposition
von ebenen Wellen mit Wellenvektoren k darstellt, die sich nur um reziproke Gittervekto-
ren G unterscheiden. Das bedeutet, dass sich auch die Wellenfunktion Ψk (r) in unserem
Ansatz (8.1.6) nur aus Wellenvektoren zusammensetzt, die sich um reziproke Gittervekto-
ren unterscheiden. Wir können deshalb die Summe über alle k in (8.1.6) durch eine Summe
über alle reziproken Gittervektoren G ersetzen und erhalten
Ψk (r) = ∑ C k−G e ı(k−G)⋅r , (8.1.13)
G
wobei jetzt k ein Wellenvektor aus der 1. Brillouin-Zone ist. Wir können deshalb Folgendes8
festhalten:
oder
Ψk (r) = ∑ C k−G e−ıG⋅r ⋅ e ık⋅r = u k (r)e ık⋅r . (8.1.16)
G
Dies ist eine von insgesamt N Lösungen der Schrödinger-Gleichung. In Abb. 8.1 ist gezeigt,
welche Wellenvektoren zu dieser Lösung überlagert werden. Die Funktion u k (r), die wir
8.1 Bloch-Elektronen 321
in (8.1.16) eingeführt haben, ist eine Fourier-Reihe über reziproke Gittervektoren G und
besitzt damit die Periodizität des Gitters.
Wir haben also gezeigt, dass die Lösung der Einelektronen-Schrödinger-Gleichung für ein
periodisches Potenzial als eine gitterperiodisch modulierte ebene Welle
Die Eigenfunktionen der Schrödinger-Gleichung für ein periodisches Potenzial sind durch
das Produkt von ebenen Wellen e ık⋅r mit einer gitterperiodischen Funktion u k (r) = u k (r +
R) gegeben.
Die Wellenfunktionen (8.1.17) werden als Bloch-Wellen bezeichnet. Die Konstruktion einer
Bloch-Welle aus einer ebenen Welle, die durch eine gitterperiodische Funktion moduliert
wird, ist in Abb. 8.2 gezeigt.
𝒖𝒌 𝒙
𝒙
𝐑𝐞 𝐞𝒊𝒌𝒙
𝒙
𝐑𝐞 𝚿 𝒙
Anstatt die Bloch-Welle als eine Funktion im Ortsraum aufzufassen, können wir sie wegen
ihrer Abhängigkeit vom Wellenvektor k auch als eine Funktion im Impulsraum ansehen.
Sie ist dann allerdings nur innerhalb der ersten Brillouin-Zone definiert. Analog zu (8.1.15)
können wir die Bloch-Welle als eine Fourier-Reihe
1
Ψ(k, r) = ⌋︂ ∑ c R (r)e ıR⋅k (8.1.18)
N R
schreiben, wobei die Summation jetzt über alle Gittervektoren R erfolgt und der Faktor ⌋︂1N
zur Normierung dient. Für die Fourier-Koeffizienten c R gilt wegen des diskreten Charakters
der erlaubten k Werte
1
c R (r) = ⌋︂ ∑ Ψ(k, r)e−ık⋅R (8.1.19)
N k
322 8 Energiebänder
Wir sehen, dass die Koeffizienten c R von der relativen Lage (r − R) der Elektronen zu den
einzelnen Gitteratomen abhängen. Man bezeichnet die Funktionen
1
w(r − R) = c R (r) = ⌋︂ ∑ u k (r)e ık⋅(r−R) (8.1.21)
N k
1
Ψ(k, r) = ⌋︂ ∑ e ık⋅R w(r − R) . (8.1.22)
N R
′ ′′
Ψk+G (r) = ∑ C k+G−G′ e−ıG ⋅r e ı(k+G)⋅r = (∑ C k−G′′ e−ıG ⋅r ) e ık⋅r = Ψk (r) . (8.1.23)
G′ G′′
k = k′ + G (8.1.25)
8.1 Bloch-Elektronen 323
in der 1. Brillouin-Zone liegt. Die zugehörigen Bloch-Wellen sind nach (8.1.24) identisch. Es
ist allerdings zu beachten, dass durch die Reduktion der Wellenvektoren auf die 1. Brillouin-
Zone einem bestimmten k-Wert mehrere Energiewerte zugeordnet werden (siehe hierzu
Abb. 8.4 und 8.5).
Um den Unterschied zwischen freien Elektronen, die wir mit ebenen Wellen beschreiben
können, und Kristallelektronen, die wir mit Bloch-Wellen beschreiben, zu verdeutlichen,
lassen wir den Impulsoperator ⧹︂
p = ħı ∇ auf beide Wellenfunktionen wirken. Für freie Elek-
tronen erhalten wir
ħ
⧹︂
pΨ = ∇ (e ık⋅r ) = ħke ık⋅r = ħkΨ . (8.1.26)
ı
Wir sehen also, dass p = ħk der Eigenwert des Impulsoperators ist, die ebenen Wellen sind
also Impulseigenzustände.
Für Bloch-Elektronen erhalten wir
ħ ħ
⧹︂
pΨ = ∇ (u k (r)e ık⋅r ) = ħkΨk + e ık⋅r ∇u k (r) ≠ const ⋅ Ψk . (8.1.27)
ı ı
Die Bloch-Wellen sind also keine Eigenzustände des Impulsoperators.
Wir müssen also den Wellenvektor k als Kristallimpuls, also einen verallgemeinerten Im-
puls im periodischen Medium auffassen, ähnlich wie wir es bei den Phononen getan haben
(vergleiche Abschnitt 5.4.3). Dies trägt der Tatsache Rechnung, dass der Kristall keine allge-
meine, sondern nur eine diskrete Translationsinvarianz besitzt. Der Impuls ist deshalb nicht
streng, sondern nur bis auf einen reziproken Gittervektor erhalten. Mit dem Kristallimpuls
können wir die Gruppengeschwindigkeit einer Welle Ψn,k angeben. Während diese für freie
Elektronen durch vk = ħkm
gegeben war, erhalten wir für die Kristallelektronen
1 ∂E n (k) ∂ω n (k)
vn,k = = . (8.1.28)
ħ ∂k ∂k
Die Geschwindigkeit der Bloch-Elektronen wird also durch die k-Abhängigkeit der Energie-
eigenwerte E n (Dispersionsrelation) bestimmt, deren Eigenschaften wir im Folgenden näher
diskutieren.
𝑬𝟑 𝒌 𝒏=𝟑
3. Band
Bandlücke
Abb. 8.3: Qualitatives Bild der Ener- 𝑬𝟐 𝒌
2. Band 𝒏=𝟐
giebänder E n (k) für eine bestimmte
Kristallrichtung. Die Energiebänder sind Bandlücke
durch Energielücken getrennt (Hinweis:
Das Auftreten von Minima oder Maxi- 1. Band 𝑬 𝒌 𝒏=𝟏
𝟏
ma an Stellen k ≠ 0 oder k ≠ π⇑a ist im
eindimensionalen Fall nicht möglich). −𝝅/𝒂 𝟎 +𝝅/𝒂 𝒌𝒙
Ohne Beweis wollen wir zwei weitere Eigenschaften von E n (k) angeben (siehe hierzu An-
hang E):
6
Es kann aber auch ein Überlapp der Energiebänder auftreten: E n (k) = E n+1 (k′ ), k ≠ k′ .
8.1 Bloch-Elektronen 325
n (k)
Hieraus folgt sofort ∂E∂k ⨄︀ = 0 falls E n (k) bei k = 0 differenzierbar ist. Wir erhalten
k=0
also für jede Richtung von k ein Minimum oder Maximum.
∎ Für ein allgemeines Potenzial gilt
Dies ist die so genannte Kramers-Entartung. Sie folgt aus der Zeitumkehrinvarianz des
Hamilton-Operators (ohne Magnetfeld).7
Wir sehen, dass wir durch die Berücksichtigung eines periodischen Gitterpotenzials Ener-
giebänder erhalten. Der genaue funktionale Verlauf der Dispersion E n (k) in diesen Bändern
bestimmt zusammen mit der Phononen-Dispersion und der Elektron-Phononwechselwir-
kung maßgeblich die physikalischen Eigenschaften von Festkörpern. Ähnlich zur Spektro-
skopie der Energieniveaus einzelner Atome kann man die elektronische Bandstruktur von
Festkörpern mit Hilfe von spektroskopischen Methoden bestimmen. Die theoretische Be-
rechnung und experimentelle Bestimmung der Bandstruktur nimmt in der modernen Fest-
körperphysik breiten Raum ein.
ħ2 k 2 ħ2
E n (k) = = E(k + Gn ) = ⋃︀k + Gn ⋃︀2 . (8.1.35)
2m 2m
Für den eindimensionalen Fall, für den Gn = G = h ⋅ 2π a
(h = ganze Zahl) gilt, ist dieser Sach-
verhalt in Abb. 8.4a dargestellt. Da E n (k) periodisch im k-Raum ist, ist es ausreichend, diese
Abhängigkeit in der ersten Brillouin-Zone darzustellen. Dies können wir einfach dadurch er-
halten, indem wir die interessierende Parabel um ein geeignetes Vielfaches von 2π a
verschie-
ben. Wir gelangen auf diese Weise zum reduzierten Zonenschema, das in Abb. 8.4b gezeigt
ist. In Abb. 8.4b erhalten wir den Kurventeil 3, indem wir 3′ um G 3 = +2π⇑a verschieben.
Den Kurventeil 2 erhalten wir, indem wir 2′ um G 2 = −2π⇑a verschieben.
7
Zeitumkehrtransformation: t → −t, p → −p, ↑→↓, siehe Anhang E.2.
326 8 Energiebänder
(a) 𝑬
𝑬
(b)
𝑮𝟑 𝑮𝟐
Abb. 8.4: (a) Parabolische
Energiebänder für ein freies 𝟑′ → 𝟑
Elektron in einer Dimen- 𝟑′ 𝟐 𝟑 𝟐′
sion. Die Gitterperiode im 𝟐′ → 𝟐
realen Raum ist a. (b) Re-
duziertes Zonenschema. 𝑬𝟐 𝒌 𝑬𝟏 𝒌 𝑬𝟑 𝒌
Die 1. Brillouin-Zone 𝟏
ist blau hinterlegt. −𝟐𝝅/𝒂 −𝝅/𝒂 𝟎 +𝝅/𝒂 +𝟐𝝅/𝒂 𝒌𝒙
14
Es ist wichtig festzuhalten, dass bei Elektronenwellen im Festkörper kein Grund dafür be-
steht, den Wellenvektor auf die 1. Brillouin-Zone zu beschränken. Im Gegensatz zu den Git-
terschwingungen, bei denen wir die Bewegung diskreter Gitterpunkte beschrieben haben
und deshalb Wellenvektoren außerhalb der ersten Brillouin-Zone physikalisch nicht sinnvoll
waren, sind Elektronenwellen überall im Festkörper definiert. Trotzdem ist es oft zweckmä-
ßig, auch bei Elektronenwellen für die Wellenvektoren nur Werte aus der 1. Brillouin-Zone
zu verwenden, da wir ja zu einem k′ außerhalb der 1. Brillouin-Zone immer einen rezipro-
ken Gittervektor G finden können, so dass k = k′ + Gn wieder in der 1. Brillouin-Zone liegt
und Ψ(k′ ) = Ψ(k) gilt.
Wir wollen nun noch den dreidimensionalen Fall für ein einfach kubisches Gitter mit Git-
terkonstante a betrachten. Für die reziproken Gittervektoren schreiben wir:
2π 2π 2π
Gn = h ⧹︂
x + k ⧹︂y + ℓ ⧹︂z, (8.1.36)
a a a
wobei h, k, ℓ die Millerschen Indizes sind. Für die Dispersion ergibt sich
ħ2 ħ2 2π 2 2π 2 2π 2
E n (k) = ⋃︀k + Gn ⋃︀ = ⌊︀(k x + h ) + (k y + k ) + (k z + ℓ ) }︀ ,
2
2m 2m a a a
(8.1.37)
wobei k + Gn innerhalb der 1. Brillouin-Zone liegen muss. Wir berechnen nun E(k) in
ħ2
[100]-Richtung in Einheiten von 2m . Das Ergebnis ist in Tabelle 8.1 dargestellt.
Tragen wir die Dispersion E n (k x , 0, 0) auf, so erhalten wir das in Abb. 8.5 gezeigte redu-
zierte Zonenschema. In drei Dimensionen sind die E n (k) Bänder bereits komplexer als in
einer Dimension. Dies liegt daran, dass wir jetzt reziproke Gittervektoren Gn in alle drei
Koordinatenrichtungen berücksichtigen müssen.
8.1 Bloch-Elektronen 327
2 ⋅ ( 2π ) k x2 + 2 ⋅ ( 2π )
2 2
16,17,18,19 011, 011, 011, 011 a a
𝑬 16,17,18,19
8,9,10,11 12,13,14,15
4,5,6,7
2 3
In Abb. 8.6 sind die verschiedenen Darstellungen der Dispersion E n (k) nochmals neben-
einander gezeigt. Wir unterscheiden zwischen dem ausgedehnten Zonenschema, dem redu-
zierten Zonenschema und dem periodischen Zonenschema.
16
𝟐𝝅 𝝅 𝟎 + 𝝅 + 𝟐𝝅 𝝅 𝟎 + 𝝅 − 𝟑𝝅 𝝅 𝟎 +𝝅 𝟑𝝅
− − − − +
𝒂 𝒂 𝒂 𝒂 𝒂 𝒂 𝒂 𝒂 𝒂 𝒂
𝒌𝒙 𝒌𝒙 𝒌𝒙
17
328 8 Energiebänder
Falls also C k= 12 g ein wichtiger Koeffizient in der Reihenentwicklung (8.1.15) ist, so ist es
auch C k−g = C k=− 12 g . Die Beschreibung der Elektronenzustände als Summe von ebenen Wel-
len ist dann notwendigerweise mindestens eine Überlagerung von zwei ebenen Wellen mit
diesen beiden k-Werten:
Gleichung (8.1.10) impliziert natürlich, dass wir auch G-Werte größer als g = 2π⇑a berück-
2 2
sichtigen müssen. Teilen wir allerdings (8.1.10) durch ( ħ2mk − E), so erhalten wir
∑G VG C k−G
Ck = − . (8.2.4)
( ħ2mk − E)
2 2
Wir sehen also, dass der Koeffizient C k besonders groß wird, wenn E k und E k−G in etwa
gleich ħ 2 k 2 ⇑2m sind, d. h. wenn
ħ2 k 2 ħ2
= (k − G)2 oder k 2 = (k − G)2 (8.2.5)
2m 2m
8.2 Die Näherung fast freier Elektronen 329
gilt. Dies entspricht aber genau der in Kapitel 2 abgeleiteten Laueschen Beugungsbedin-
gung,8 die für alle Elektronenwellen mit Wellenvektoren k auf dem Rand der Brillouin-Zone
erfüllt ist. Der Koeffizient C k−G hat dann etwa die gleiche Größe wie C k . Für k = g⇑2 = π⇑a
entspricht dies dann aber genau dem Fall (8.2.2) und (8.2.3) von zwei ebenen Wellen mit
Wellenvektoren auf dem Rand der 1. Brillouin-Zone. Für Wellenvektoren weit weg vom
Rand der Brillouin-Zonen werden die Entwicklungskoeffizienten C k vernachlässigbar klein.
Physikalisch bedeutet dies, dass für k = ±G⇑2 die von benachbarten Atomen reflektierten
Elektronenwellen konstruktiv interferieren. Wir erhalten dadurch eine in positive x-Rich-
tung laufende Elektronenwelle und eine in negative x-Richtung laufende Bragg-reflektierte
Welle.
Beschränken wir uns wieder auf den kürzesten reziproken Gittervektor G1 = g, so erhal-
ten wir durch symmetrische und antisymmetrische Überlagerung der beiden Wellen (8.2.2)
und (8.2.3) in erster Näherung stehende Wellen
x
Ψ s ∝ (e ı gx⇑2 + e−ı gx⇑2 ) ∝ cos (π ) (8.2.6)
a
−ı gx⇑2 x
Ψ ∝ (e
a ı gx⇑2
−e ) ∝ sin (π ) (8.2.7)
a
mit Nullstellen an bestimmten Raumpositionen. Die zu den stehenden Wellen gehörenden
Wahrscheinlichkeitsdichten sind
x
⋃︀Ψ s ⋃︀2 ∝ cos2 (π ) (8.2.8)
a
x
⋃︀Ψ ⋃︀ ∝ sin (π ) .
a 2 2
(8.2.9)
a
Diese Wahrscheinlichkeitsdichten, die die Elektronendichte im Festkörper angeben, sind in
Abb. 8.7 zusammen mit dem qualitativen Verlauf des Gitterpotenzials dargestellt. Wir sehen,
dass ⋃︀Ψ s ⋃︀2 ein Maximum am Ort der positiven Atomrümpfe besitzt, während ⋃︀Ψ a ⋃︀2 dort gera-
de minimal ist. Im Gegensatz zu einer ebenen Welle, die einer homogenen Elektronendichte
(a) 𝚿𝐬 𝟐
𝒙
(b) 𝚿𝐚 𝟐
8
Wir haben in Abschnitt 2.2.3 allgemein hergeleitet, dass jeder Wellenvektor vom Zentrum zum
Rand einer Brillouin-Zone die Beugungsbedingung erfüllt.19 Wir können unsere qualitative Diskus-
sion deshalb auch auf den Rand höherer Brillouin-Zonen ausdehnen.
330 8 Energiebänder
(a) 𝑬 (b) 𝑬
2. Band
freie
Elektronen
Bandlücke
Band-
Elektronen 1. Band
Abb. 8.8: Zur Entstehung der Energielücke am Rand der Brillouin-Zone durch stehende Elektronen-
wellen. Die erste Brillouin-Zone ist farbig hinterlegt. (a) ausgedehntes Zonenschema, (b) reduziertes
Zonenschema. Die E(k)-Beziehung für freie Elektronen ist gestrichelt eingezeichnet.
entspricht, besitzt somit Ψ s eine niedrigere potenzielle Energie, da die bevorzugte Aufent-
20
ħ2
(E − ⋃︀k − G⋃︀2 ) C k−G = ∑ VG′ C k−G−G′ = ∑ VG′′ −G C k−G′′ , (8.2.10)
2m G′ G′′
wobei wir k′ = k − G benutzt haben und die Umbenennung G′′ = G′ + G vorgenommen ha-
ben. Falls das Gitterpotenzial verschwindet, erhalten wir daraus
ħ2
(E − ⋃︀k − G⋃︀2 ) C k−G = 0 . (8.2.11)
2m
8.2 Die Näherung fast freier Elektronen 331
Das heißt, es muss entweder die Klammer null sein, was nur für ein bestimmtes G mög-
lich ist, oder es müssten alle C k−G = 0 sein. Aus (8.1.15) erhalten wir dann Ψk−G (r) =
C k−G e ı(k−G)⋅r , also wie erwartet eine ebene Welle.
Wir wollen hier keine ausführliche Analyse von Gleichung (8.2.10) vornehmen.9 Wir wollen
zunächst einen Teil des Gleichungssystems (8.2.10) explizit für ein eindimensionales System
ausschreiben. Wir können hier die reziproken Gittervektoren als ein Vielfaches eines kür-
ħ2
zesten Vektors g schreiben. Mit der Abkürzung λ k−g = 2m ⋃︀k − g⋃︀2 erhalten wir dann
ħ2
( ⋃︀k − g⋃︀2 − E) C k−g + V0 C k−g + V−g C k = 0 . (8.2.15)
2m
ħ2 k 2
Aus (8.2.15) folgt mit E ≃ V0 + 2m
V−g C k
C k−g = . (8.2.16)
ħ2
2m
(k 2 − ⋃︀k − g⋃︀2 )
9
siehe hierzu z. B. Festkörperphysik, N. W. Ashcroft, N. D. Mermin, Oldenbourg Verlag, München
(2012).
332 8 Energiebänder
3 3
2 G2
3 k G1 3
2 -G1 2
1 G3
Abb. 8.9: Zur Konstruktion der ersten
3 k-G1 3
drei Brillouin-Zonen eines quadrati-
schen Gitters im zweidimensionalen k- 2
Raum. Die gestrichelten Vektoren verdeut- 3 3
lichen die Beugungsbedingung (8.2.18).
Wir sehen, dass C k−g nur dann große Werte annimmt, wenn der Nenner in (8.2.16) sehr
klein wird, das heißt für
Wie oben bereits erwähnt, ist diese Bedingung identisch zur Bragg-Bedingung. Wir erhalten
also die stärkste Störung der Flächen konstanter Energie (Kugeln im k-Raum für freie Elek-
tronen) durch das gitterperiodische Potenzial an den Stellen, an denen die Bragg-Bedingung
erfüllt ist. Wie wir bereits in Abschnitt 2.2.3 diskutiert haben, ist dies genau für k-Vektoren
vom Zentrum zum Rand der Brillouin-Zonen der Fall, die zum Vektor −Gn gehören. Dies
ist in Abb. 8.9 für ein quadratisches zweidimensionales Gitter veranschaulicht. Bei der Kon-
struktion der Brillouin-Zonen wird jedem Vektor des reziproken Gitters eine Ebene zuge-
ordnet, die in der Mitte des betreffenden Vektors senkrecht auf ihm steht und eine Begren-
zungsfläche einer Brillouin-Zone bildet. Sämtliche Brillouin-Zonen haben das gleiche Vo-
lumen. Durch eine einfache Umformung erhalten wir aus (8.2.17) für die 1. Brillouin-Zone
(G1 = g)
g g 2
k⋅ = ⋀︀ ⋀︀ . (8.2.18)
2 2
Wir sehen also, dass nur für k-Werte auf dem Rand der 1. Brillouin-Zone und ihrer un-
mittelbaren Umgebung außer dem Koeffizienten C k noch ein weiterer Koeffizient C k−g hin-
reichend groß wird. Für alle anderen k-Werte können wir dagegen sämtliche Koeffizien-
ten C k−G n für Gn ≠ 0 vernachlässigen.
Das Gleichungssystem (8.2.14) und (8.2.15) besitzt genau dann Lösungen, wenn die Deter-
minante
∫︀∫︀∫︀ ħ 2 2 ∫︀∫︀∫︀
∫︀∫︀∫︀( 2m k + V0 − E) Vg ∫︀∫︀∫︀
∫︀∫︀∫︀ ∫︀∫︀ = 0 (8.2.19)
∫︀∫︀∫︀ ( 2m ⋃︀k − g⋃︀ + V0 − E)∫︀∫︀∫︀∫︀
2
ħ 2
V−g
∫︀ ∫︀
8.2 Die Näherung fast freier Elektronen 333
2.0
2. Band
1.5 𝑬𝒂
1. Brillouin-Zone
1.0 Abb. 8.10: Verlauf der Dispersion am
𝟐 𝑽𝒈
E
2
ħ2
verschwindet. Mit der Energie E k0 = V0 + 2m
ħ
k 2 und E k−g
0
= V0 + 2m
⋃︀k − g⋃︀2 der freien Elek-
tronen können wir die beiden Lösungen wie folgt ausdrücken:10
}︂
1 0 1 0 2
E = (E k−g + E k ) ±
a,s 0
(E − E k0 ) + ⋃︀Vg ⋃︀2 . (8.2.20)
2 4 k−g
Jede der beiden Wurzeln beschreibt ein Energieband. Dies ist analog zum bindenden und
anti-bindenden Orbital bei der kovalenten Bindung. Die beiden Bänder sind in Abb. 8.10
2 2
geplottet. Am Rand der ersten Brillouin-Zone, wo E k−g 0
= E k0 = ħ2mk + V0 und der Beitrag
der beiden Wellen mit C k und C k−g gleich ist, erhalten wir die Energielücke
E g = E a − E s = 2⋃︀Vg ⋃︀ . (8.2.21)
Die Energielücke ist also durch das Zweifache der Fourier-Komponente Vg des Gitterpoten-
zials gegeben.
Wir wollen jetzt noch überlegen, wie die Wellenfunktion Ψ = C k e ık⋅r + C k−g e ı(k−g)⋅r in der
Nähe des Zonenrandes aussieht. Hierzu setzen wir die beiden Energieeigenwerte E ± in Glei-
chung (8.2.14) und (8.2.15) ein, um die Koeffizienten C k und C k−g zu bestimmen. Auf dem
Rand der 1. Brillouin-Zone, also für k = 12 g, erhalten wir
C k−g E 0 ± ⋃︀Vg ⋃︀ − E k0
⋀︀ = k = ±1 , (8.2.22)
C k k=g⇑2 Vg
so dass die Fourier-Entwicklung von Ψ(x) durch
Ψ a,s (x) = (e ı gx⇑2 ± e−ı gx⇑2 ) (8.2.23)
gegeben ist, was identisch zu (8.2.6) und (8.2.7) ist. Am Rand der Brillouin-Zone ist die
Wellenfunktion also eine symmetrische oder antisymmetrische Überlagerung der ungekop-
pelten Wellenfunktionen. Welche Überlagerung die niedrigere Energie hat, hängt vom Vor-
zeichen von Vg ab. Ist Vg negativ (attraktive Wechselwirkung zwischen Elektronen und po-
sitiven Atomrümpfen), so ist C k−g ⇑C k für das unten liegende Band mit dem Eigenwert E s
10
Da das Potenzial V (r) reell ist, muss für die Fourier-Koeffizienten V−g = Vg∗ gelten und wir erhal-
ten Vg V−g = Vg Vg∗ = ⋃︀Vg ⋃︀2 .
334 8 Energiebänder
𝑬
4. Band
freie
1. Brillouin Bandlücke
Elektronen
Zone
3. Band
positiv. Das heißt, die Wellenfunktion zu diesem Eigenwert ist die symmetrische Überlage-
rung (wir haben diesem Energieeigenwert deshalb den Index s gegeben). Wir wollen noch
darauf hinweisen, dass C k−g ⇑C k = ±1 nur auf dem Zonenrand gilt. Nur hier tragen beide
ungekoppelten Wellenfunktionen mit gleichem Gewicht zur Wellenfunktion bei. Entfernen
wir uns vom Zonenrand, so ändert sich das Verhältnis rasch. Ein Entwicklungskoeffizient
nimmt auf eins zu, der andere auf null ab. Im benachbarten Band ist das Verhalten der Ent-
wicklungskoeffizienten genau gegenläufig.
Wir können die Energie E a,s nach dem Wellenvektor Q = k − 12 g entwickeln, der die Diffe-
renz des Wellenvektors k von der Zonengrenze angibt. Wir erhalten
⟨
⧸︂ ħ 2 ( 1 g)2 2 2
ħ 2
1 2
⧸︂
⟩ ħ Q
E (Q) =
a,s
(( g) + Q ) ±
2
4 2
+ ⋃︀Vg ⋃︀2
2m 2 2m 2m
⎨ 2 ⎬
ħ2 1 2 ⎝ ħ 2 ( 12 g) ħ 2 Q 2 ⎠
≃ (( g) + Q 2 ) ± ⋃︀Vg ⋃︀ ⎝⎝1 + 2 ⎠
2m⋃︀Vg ⋃︀2 2m ⎠⎠
(8.2.24)
2m 2 ⎝
⎪ ⎮
für den Bereich, in dem ħ 2 gQ⇑2m ≪ ⋃︀Vg ⋃︀. Bezeichnen wir die beiden Energiewerte
ħ2 2
2m
( 12 g) ± ⋃︀Vg ⋃︀ für Q = 0, also am Zonenrand, mit E 0a,s , so können wir schreiben
ħ ( 2 g) ⎞
ħ2 Q 2 ⎛
2 1 2
2 2m
E (Q) =
a,s
E 0a,s + ⎜1 ± ⎟. (8.2.25)
2m ⎝ ⋃︀Vg ⋃︀ ⎠
Wir sehen, dass die Energien E a,s (Q) quadratisch von Q abhängen. Die Ableitung ∂E⇑∂Q
verschwindet am Zonenrand (Q = 0), das heißt, wir erhalten am Zonenrand stehende Wellen
in Übereinstimmung mit unserer qualitativen Diskussion.
In Abb. 8.11 ist die Bandstruktur für ein eindimensionales Gitter im periodischen Zonen-
schema gezeigt. Wir sehen, dass durch das periodische Potenzial für Wellenvektoren, die
Vielfachen von π⇑a entsprechen, Energielücken entstehen. In den Bereichen dazwischen
verläuft die Dispersionskurve nahe an derjenigen von freien Elektronen.
8.3 Die Näherung stark gebundener Elektronen 335
Die bis jetzt diskutierte Situation fast freier Elektronen ist sehr gut für die Beschreibung von
Metallen geeignet. Ausgehend von freien Elektronen können wir eine quantitativ immer bes-
sere Beschreibung durch Berücksichtigung einer zunehmenden Zahl von Fourier-Koeffizi-
enten VG in der Entwicklung des periodischen Gitterpotenzials erzielen. Für Isolatoren, in
denen an die Atome gebundene Elektronen vorliegen, ist es allerdings nicht sinnvoll, von
freien Elektronen auszugehen. Diesen Fall werden wir im folgenden Abschnitt diskutieren.
ℋA (r − R)ϕ Ai (r − R) = E Ai ϕ Ai (r − R) . (8.3.1)
Hierbei ist ϕ Ai (r − R) die atomare Wellenfunktion des i-ten Niveaus des Atoms am Gitter-
platz R, E Ai der zugehörige Energieeigenwert und ℋA ist der Hamilton-Operator
ħ2 2
ℋA (r − R) = − ∇ + VA (r − R) , (8.3.2)
2m
wobei VA (r − R) das atomare Potenzial des Atoms am Gitterplatz R ist. Im Festkörper wer-
den durch Wechselwirkung der Atome untereinander die atomaren Energieniveaus beein-
flusst. Dies ist ähnlich zur kovalenten Bindung (vergleiche Kapitel 3.4), wo die Wechselwir-
kung von zwei atomaren Niveaus zu einer Aufspaltung in ein bindendes und anti-bindendes
Molekülorbital führte. Im Festkörper wechselwirken im Prinzip die atomaren Niveaus von
N Atomen. Diese Wechselwirkung führt zu einem Energieband mit N Zuständen. Da N
üblicherweise sehr groß ist, liegen die Zustände in dem Energieband so dicht, dass wir von
einem Kontinuum ausgehen können.
Ein adäquater Ansatz für die Kristallelektronen im Fall stark gebundener Elektronen ist eine
lineare Superposition von atomaren Eigenfunktionen
1
Ψki (r) = ⌋︂ ∑ e ık⋅R ϕ Ai (r − R) . (8.3.3)
N R
Diese Wellenfunktion entspricht (8.1.22), wobei wir die Wannier-Funktionen w(r − R) jetzt
durch die atomaren Eigenfunktionen ϕ Ai (r − R) ersetzt haben. Sie ist also eine Bloch-Welle
mit Wellenvektor k, enthält aber immer noch den lokalen Charakter der atomaren Wellen-
funktionen (siehe hierzu Abb. 8.12). Die Wellenfunktion ist aus atomaren Wellenfunktio-
nen aufgebaut. Die Aufenthaltswahrscheinlichkeit ist an jeder Atomposition die gleiche, da
die Wellenfunktion von Atomposition zu Atomposition nur um einen Phasenfaktor e ık⋅R
336 8 Energiebänder
𝝓𝑨 𝒙 − 𝑿
𝒙
𝐑𝐞 𝐞𝒊𝒌⋅𝒙
𝒙
Abb. 8.12: Räumliche Variation des
Realteils der Wellenfunktion in der
𝐑𝐞 𝚿 𝒙
tight-binding Näherung. Die Wel-
lenfunktion ist aus atomaren Wel-
lenfunktionen (oben) und einer 𝒙
ebenen Welle (Mitte) aufgebaut.
(siehe Abb. 8.12, Mitte) variiert. Die Energiebänder E n (k), die man mit diesem Ansatz er-
26
hält, zeigen allerdings wenig Struktur. Ein besserer Ansatz ist, in (8.3.3) nicht eine atoma-
re Wellenfunktion ϕ Ai (r − R) zu benutzen, sondern eine Linearkombination aus atomaren
Wellenfunktionen (LCAO-Methode: Linear Combination of Atomic Orbitals). Die weitere
Vorgehensweise bei der Berechnung von E n (k) ist ähnlich zur Behandlung der kovalenten
Bindung in Abschnitt 3.4.
Wir berechnen nun die Energie E(k) des Kristallelektrons mit der Wellenzahl k, indem wir
den Ansatz (8.3.3) in die Schrödinger-Gleichung
ħ2 2
ℋΨk (r) = ⌊︀− ∇ + V (r)}︀ Ψk (r) = E(k)Ψk (r) (8.3.4)
2m
Hierbei ist V (r) die potenzielle Energie des Kristallelektrons. Sie ist durch die Summe über
alle atomaren Potenziale11 gegeben:
V (r) = ∑ VA (r − R) = VA (r − R) + ∑ VA (r − R′ )
R R′ ≠R
̃ (r − R) .
= VA (r − R) + V (8.3.6)
Die Bedeutung der verschiedenen Potenziale ist in Abb. 8.13 veranschaulicht. Wir haben
̃ (r − R) vorgenommen, weil wir damit den Hamilton-
die Aufspaltung in VA (r − R) und V
Operator als
̃
ℋ = ℋA + V (8.3.7)
schreiben können. Da die Elektronen ja stark an der Position der einzelnen Atome lokalisiert
sind, sehen sie im Wesentlichen nur das atomare Potenzial VA an dem Ort, an dem sie sich
11
Die atomaren Potenziale sind natürlich keine reinen 1⇑r Potenziale wie bei freien Atomen, sondern
abgeschirmte Potenziale.
8.3 Die Näherung stark gebundener Elektronen 337
0
𝑽𝑨 𝒓
𝑽𝑨 𝒓 , 𝑽 𝒓
𝑽 𝒓
-3 -2 -1 0 1 2 3
0
෩ 𝒓
෩ 𝒓
𝑽 Abb. 8.13: Verlauf der potenziellen Ener-
𝑽
befinden. Alle anderen atomaren Potenziale können wir in V ̃ zusammenfassen und können
dieses als Störpotenzial auffassen. Der Vorteil dieser Vorgehensweise besteht darin, dass wir
unser Problem auf ein Einelektronen-Problem reduzieren. Man spricht deshalb auch von
der Einelektronen-Näherung.
̃ (r − R) setzen und unter Be-
Wir können nun in Gleichung (8.3.5) V (r) = VA (r − R) + V
nutzung von (8.3.1) und (8.3.2) umformen. Wir erhalten
ħ2 2
⌊︀− ∇ + VA (r − R) − E Ai }︀ ∑ e ık⋅R ϕ Ai (r − R)
2m R
Die linke Seite ist nach (8.3.1) gleich null und es ergibt sich somit
̃ (r − R)ϕ Ai (r − R) .
)︀E(k) − E Ai ⌈︀ ∑ e ık⋅R ϕ Ai (r − R) = ∑ e ık⋅R V (8.3.9)
R R
′ ∗
̃ (r − R)ϕ Ai (r − R) .
= ∑ ∑ e ık⋅(R−R ) ∫ dV ϕ Ai (r − R′ )V (8.3.11)
R R′
∗
Die Funktionen ϕ Ai (r − R) und ϕ Ai (r − R′ ) überlappen sich nun selbst für unmittelbar be-
nachbarte Atome nur sehr wenig. Deshalb können wir in erster Näherung auf der linken
Seite von (8.3.11) alle Glieder mit R ≠ R′ vernachlässigen. Die Summe auf der linken Sei-
te ist dann gleich der Anzahl N der Gitterzellen in dem betrachteten Festkörper. Auf der
338 8 Energiebänder
rechten Seite von (8.3.11) dürfen wir diese Näherung allerdings nicht machen, da das Stör-
̃ (r − R) am Ort des Gitteratoms R′ wesentlich größere Werte besitzt als am Ort
potenzial V
∗
des Atoms R (siehe Abb. 8.13). Wegen des raschen Abfalls von ϕ Ai (r − R) und ϕ Ai (r − R′ )
′
brauchen wir für R ≠ R in der Doppelsumme auf der rechten Seite von (8.3.11) nur diejeni-
gen Terme berücksichtigen, die unmittelbar benachbarten Gitteratomen entsprechen. Damit
erhalten wir aus (8.3.11)
∗
̃ (r − R)ϕ Ai (r − R)
N )︀E(k) − E Ai ⌈︀ = N ∫ dV ϕ Ai (r − R)V
′ ∗
̃ (r − R)ϕ Ai (r − R) ,
+ N ∑ e ık⋅(R−R ) ∫ dV ϕ Ai (r − R′ )V
NN
(8.3.12)
wobei ∑ N N die Summe über die nächsten Nachbarn des Atoms am Ort R bedeutet.
Wir nehmen nun zusätzlich an, dass die betrachtete Eigenfunktion ein s-Zustand und somit
kugelsymmetrisch ist. Damit erhalten wir
′
E(k) = E Ai − α i − β i ∑ e ık⋅(R−R ) (8.3.13)
NN
Das Coulomb-Integral α i ist wegen V ̃ < 0 positiv und führt in (8.3.14) zu einer Energieab-
senkung. Dies können wir leicht verstehen: das Elektron am Ort R sieht zu einem gewissen
Anteil die attraktiven Coulomb-Potenziale der Nachbaratome und wird dadurch im Mittel
energetisch abgesenkt. Das Transfer-Integral β i kann sowohl positiv als auch negativ sein.
Das Transfer-Integral führt in (8.3.15) offensichtlich zu einer k-Abhängigkeit der Eigenener-
gie des Kristallelektrons und damit zu einer endlichen Dispersion und Ausbildung eines
Bandes. Das heißt, durch den endlichen Überlapp der fast gebundenen Elektronen kommt
es zur Ausbildung eines Bandes, dessen Breite von der Stärke des Überlapps abhängt.
Zusammenfassend können wir festhalten, dass im Vergleich zum Energieniveau E Ai eines
freien Atoms der Zusammenbau der Atome zu einem Kristallgitter zu einer Absenkung der
Energie um α und einer Aufspaltung des Niveaus entsprechend der Mannigfaltigkeit des
Wellenvektors k führt.
8.3 Die Näherung stark gebundener Elektronen 339
1.0
0.5
ky (π/a)
0.0
2 1
(β)
0
E -α
-0.5
E- A
-2
/a)
0
y π
k (
-4 1
-1.0
0 -1.0 -0.5 0.0 0.5 1.0
k (π
/a) kx (π/a)
-1 -1
x
Abb. 8.14: Energiespektrum von stark gebundenen Elektronen auf einem einfachen zweidimensiona-
len quadratischen Gitter mit Gitterkonstante a. Rechts sind die Höhenlinien konstanter Energie ge-
zeigt. Die rote Linie markiert die Bandmitte.
R1,2,3,4 = (± a2 , ± a2 , 0) R5,6,7,8 = (± a2 , 0, ± a2 )
(8.3.24)
R9,10,11,12 = (0, ± a2 , ± a2 ) .
Für kleine k-Werte können wir die Kosinus-Funktion entwickeln, so dass wir in der Nähe
des Γ-Punktes (Zentrum der 1. Brillouin-Zone) für ein einfach kubisches Gitter folgende
Dispersion erhalten:
E(k) = E A − α − 6β + βa 2 k 2 = E u + βa 2 k 2 . (8.3.26)
Wir sehen, dass die Energie E(k) bezogen auf die Bandunterkante E u = E A − α − 6β propor-
tional zu k 2 ist, wie es auch für freie Elektronen der Fall ist. Wir können deshalb die Kristall-
elektronen als freie Teilchen auffassen, wenn wir ihnen eine effektive Masse m∗ (verglei-
che hierzu Abschnitt 9.2.3) zuordnen. Durch Vergleich der Dispersion ħ 2 k 2 ⇑2m der freien
8.3 Die Näherung stark gebundener Elektronen 341
𝑬, 𝑽 𝑬 𝑬
r
𝑬𝟐𝑨
𝜶𝟐 𝟏𝟐𝜷𝟐
𝑽𝑨 𝒓
𝑬𝟏𝑨 𝜶𝟏
𝟏𝟐𝜷𝟏
Abb. 8.15: Schematische Darstellung der Aufspaltung von atomaren Niveaus E Ai in Energiebänder für
ein einfach kubisches Gitter. Links: Lage der atomaren Energieniveaus E Ai . Mitte: Änderung der Band-
breite durch Variation des Transfer-Integrals mit sich änderndem Abstand der Atome im Gitter. Rechts:
Abhängigkeit der Energie E eines Kristallelektrons vom Wellenvektor k in [111] Richtung.
36
ħ2
m∗ = . (8.3.27)
2βa 2
Die effektive Masse kann also positive und negative Werte annehmen, je nachdem ob der
Beitrag durch das Transfer-Integral positiv oder negativ ist. Die physikalische Bedeutung
der effektiven Masse werden wir später noch ausführlich diskutieren.
Für k-Werte um die Eckpunkte der 1. Brillouin-Zone bei k x = k y = k z = π
a
erhalten wir für
ein einfach kubisches Gitter
E(k) = E A − α + 6β − βa 2 Q 2 = E o − βa 2 Q 2 , (8.3.28)
ħ2
m∗ = − . (8.3.29)
2βa 2
In Abb. 8.15 ist die Aufspaltung der atomaren Niveaus in Energiebänder durch den end-
lichen Überlapp der atomaren Wellenfunktionen nochmals schematisch gezeigt. Wir kön-
nen anhand von Abb. 8.15 Folgendes festhalten: Sind die Atome weit voneinander entfernt,
so ist der Überlapp der atomaren Wellenfunktionen vernachlässigbar klein und in jedem
Atom liegt ein Ensemble von atomaren Zuständen (z. B. 1s, 2s, 2p, etc.) vor. Im gesamten
Ensemble von N Atomen sind dies N-fach entartete Zustände für die einzelnen Elektronen.
Verringern wir den Abstand benachbarter Atome, so resultiert ein endlicher Überlapp der
atomaren Wellenfunktionen. Aus jedem atomaren Niveau entsteht dadurch ein Band mit
N Zuständen, das wir entsprechend der ursprünglichen atomaren Zustände als 1s-, 2s-, 2p-,
etc. Band bezeichnen können. Mit geringer werdendem Abstand der Atome, d. h. mit wach-
sendem Überlapp der Wellenfunktionen wächst die Bandbreite des resultierenden Bandes.
Die Bandbreite nimmt auch mit wachsender Zahl von nächsten Nachbarn zu. In vielen Fäl-
342 8 Energiebänder
len werden die einzelnen Bänder so breit, dass sie sich überlappen. Dies trifft vor allem für
die s- und p-Bänder, weniger für die d- und f -Bänder zu, da für letztere der Überlapp der
Wellenfunktionen auch bei kleinen Atomabständen immer noch gering ist. Im Falle einer
Überlappung können wir nicht mehr von wohldefinierten s- oder p-Bändern sprechen. Wie
oben bereits erwähnt wurde, ist es dann sinnvoller, in dem Ansatz (8.3.3) nicht mehr von
atomaren Wellenfunktionen auszugehen, sondern bereits eine Linearkombination der ato-
maren Wellenfunktionen zu benutzen (LCAO-Methode). Als Beispiel ist in Abb. 8.19 die
Ausbildung von sp3 -Bändern in Diamant gezeigt.
8.3.2.1 Pseudopotenziale
Bei vielen Verfahren zur Bandstrukturberechnung spielt die Verwendung von Pseudopo-
tenzialen eine wichtige Rolle. Hierbei wird das Coulomb-Potenzial in Kernnähe durch ein
effektives Potenzial angenähert. Die Grundidee dieser Methode können wir uns anhand von
Abb. 8.16 am Beispiel von Al klar machen. Die radiale Aufenthaltwahrscheinlichkeit r 2 R 3s
2
des 3s-Valenzelektrons (vergleiche Abb. 3.3) variiert stark im Rumpfbereich, da hier wegen
E = E kin + E pot = const und des stark anziehenden Kernpotenzials die kinetische Energie
hoch ist. Dabei hat die 3s-Wellenfunktion zwei Knoten, da sie zur 2s- und 1s-Wellenfunktion
orthogonal sein muss. Wir können nun die 3s-Wellenfunktion im kernnahen Bereich, der
kaum zur chemischen Bindung beiträgt, durch eine möglichst glatte Pseudowellenfunkti-
on ersetzen, ohne sie im äußeren Bereich, der für die chemische Bindung maßgebend ist,
12
J. Callaway, Orthogonalized Plane Wave Method, Phys. Rev. 97, 933-936 (1955).
13
J. Korringa, On the calculation of the energy of a Bloch wave in a metal, Physica XIII, 392-400 (1947)
14
W. Kohn, N. Rostoker, Solution of the Schrödinger Equation in Periodic Lattices with an Application
to Metallic Lithium, Phys. Rev. 94, 1111-1120 (1954).
15
H. L. Skriver, The LMTO Method, Springer, Ser. Solid State Science, Vol. 41, Springer Heidelberg,
Berlin (1984).
16
W. A. Harrison, Pseudopotenzials in the Theory of Metals, Benjamin, New York (1966).
17
J. Callaway, Energy Band Theory, Academic, New York (1964).
8.3 Die Näherung stark gebundener Elektronen 343
0.10
𝜓pseudo
r2R3s2
0.05
𝜓3𝑠
0.00 Abb. 8.16: Vergleich der radialen Aufent-
0 haltswahrscheinlichkeit r 2 R 3s einer 3s-
Epot (bel. Einh.)
zu verändern. Die kinetische Energie wird dadurch im Rumpfbereich minimal und das ent-
sprechende Pseudopotenzial ist im kernnahen Bereich stark abgeschwächt (siehe Abb. 8.16).
Für einfache Metalle sind die Pseudopotenziale so schwach, dass sie störungstheoretisch be-
handelt werden können. Insbesondere konvergieren dann wegen der relativen Glattheit der
Psudowellenfunktion Entwicklungen nach ebenen Wellen sehr schnell. Da für Al der Durch-
messer der K-Schale nur a B ⇑Z ≃ 0.025 Å beträgt, müsste man bei einem Gitterabstand von
etwa 4 Å bei der Entwicklung der wirklichen Wellenfunktion etwa (102 )3 ebene Wellen be-
rücksichtigen. Durch geschickte Wahl eines empirischen Pseudopotenzials lässt sich deshalb
der Aufwand zum Lösen der Schrödinger-Gleichung massiv reduzieren.
18
H. Kramers, Proc. Acad. Sci. Amsterdam 33, 959 (1930).
Spin-Bahn-Kopplung
344 8 Energiebänder
𝟎 𝒌 𝟎 𝒌 𝟎 𝒌
Abb. 8.17: Einfluss der Spin-Bahn-Kopplung auf p-Typ Bandniveaus in der Nähe des Zentrums der
Brillouin-Zone. (a) Sechs entartete Niveaus bei k = 0, (b) Spin-Bahn-Aufspaltung in ein vierfach und
ein zweifach entartetes Niveau bei k = 0 in einem Kristall mit Inversionssymmetrie, (c) Aufhebung der
Kramers-Entartung in einem Kristall ohne Inversionssymmetrie.
Für Kristalle, die ein Inversionszentrum besitzen, trennt die Spin-Bahn-Kopplung ansons-
ten nichtentartete Zustände Ψk (r) mit entgegengesetzter Spin-Richtung nicht. Die Spin-
Umkehr im Zustand Ψk (r) ist mit der Betrachtung des Zustands Ψk (−r) gleichbedeutend,
der bei Vorliegen eines Inversionszentrums aber die gleiche Energie besitzt. Die Kramers-
38
Entartung bleibt also hier erhalten.
Die Spin-Bahn-Kopplung kann aber einen wesentlichen Effekt an bestimmten Punkten
der Brillouin-Zone haben, an denen entartete Zustände Ψk (r) vorliegen. Um dies zu
veranschaulichen, betrachten wir einen Punkt mit kubischer Symmetrie im Zentrum der
Brillouin-Zone. Im Rahmen des Tight-Binding-Modells können wir z. B. ein p-Band aus
den p-Zuständen der Atome aufbauen. Da die p-Zustände dreifach entartet sind, erhalten
wir im Kristall drei Bänder, die den Zuständen p x , p y und p z des Atoms entsprechen.
Diese drei Bänder sind bei k = 0 entartet. Sie können ja durch die kubische Symmetrie
des betrachteten Punkts leicht ineinander transformiert werden. Jeder Bandzustand kann
zusätzlich mit Elektronen entgegengesetzten Spins besetzt werden, so dass wir insgesamt
eine sechsfache Entartung bei k = 0 erhalten (siehe Abb. 8.17a). Berücksichtigen wir jetzt
die Spin-Bahn-Kopplung, so erhalten wir eine Aufspaltung in ein vierfach und ein zweifach
entartetes Niveau. Wir müssen nämlich jetzt unsere Bänder aus den vierfach entarteten
atomaren p 3⇑2 - und den zweifach entarteten p 1⇑2 -Zuständen aufbauen.
Bewegen wir uns vom Zentrum der Brillouin-Zone weg, dann bleibt jedes Niveau zweifach
entartet, falls Inversionssymmetrie vorliegt. Das vierfach entartete Band mit j = 3⇑2 spaltet in
zwei zweifach entartete Bänder m j = ±3⇑2 und m j = ±1⇑2 auf (siehe Abb. 8.17b). Liegt keine
Inversionssymmetrie vor, so spalten für k ≠ 0 auch noch die zweifach entarteten Bänder auf
(siehe Abb. 8.17c). Das in Abb. 8.17 gezeigte Verhalten liegt in vielen Halbleitern an der
Oberkante des Valenzbandes vor (vergleiche hierzu Abschnitt 10.1), das aus atomaren p-
Zuständen aufgebaut ist. Für Ge trifft die in Abb. 8.17b, für InSb die in Abb. 8.17c gezeigte
Situation zu.
8.4 Metalle, Halbmetalle, Halbleiter, Isolatoren 345
1. Beim Besetzen der Einelektronenzustände füllen wir einige Bänder vollständig, alle üb-
rigen sind vollkommen leer. Zwischen dem obersten besetzten und dem untersten unbe-
setzten Zustand existiert somit für alle k-Vektoren eine Energielücke. Die Fermi-Energie
liegt dabei für T = 0 etwa in der Mitte zwischen dem obersten besetzten und dem un-
tersten leeren Band. Der Kristall ist dadurch ein Isolator bzw. ein Halbleiter. Legen wir
z. B. ein elektrisches Feld an, so kann dieses keinen mittleren Zusatzimpuls δk erzeu-
gen, da ja alle Zustände im Band besetzt sind und dadurch keine Impulsänderung er-
zielt werden kann. Um einen endlichen Stromfluss zu erzielen, müssten Ladungsträger
ins nächste Band angeregt werden. Hierzu sind allerdings Energien im eV-Bereich not-
wendig, die durch elektrische Felder in der üblichen Größenordnung nicht aufgebracht
werden können.
2. Beim Besetzen der Einelektronenzustände füllen wir das oberste Band nicht vollständig
auf. Die Fermi-Energie liegt nun innerhalb eines Bandes. Wie beim freien Elektronengas
bezeichnen wir die Fläche konstanter Energie E = E F , die bei T = 0 die besetzten von den
unbesetzten Zuständen trennt, als Fermi-Fläche. Wie wir in Abschnitt 8.6 sehen werden,
ist die Fermi-Fläche jetzt aber nicht mehr wie bei freien Elektronen eine einfache Kugel.
Legen wir ein elektrisches Feld an, so kann dieses jetzt, da im Band ja freie Zustände
vorhanden sind, zu einem Zusatzimpuls δk führen und wir erhalten einen metallischen
Leiter.
In Abb. 8.18 ist die Lage des Fermi-Niveaus und die Besetzung der verschiedenen Bänder
schematisch dargestellt. Bei Isolatoren oder Halbleitern liegt das Fermi-Niveau innerhalb
der Bandlücke. Das oberste besetzte Band nennen wir das Valenzband, das unterste unbe-
setzte Band das Leitungsband. Bei Metallen liegt das Fermi-Niveau dagegen innerhalb eines
Bandes. In Abb. 8.18 ist auch die Situation für Halbmetalle gezeigt. Hier liegt eine Bandüber-
lappung vor, die dazu führt, dass das Fermi-Niveau ebenfalls in einem nicht vollständig ge-
füllten Band liegt. Ist der Überlapp allerdings gering, so ist die elektrische Leitfähigkeit klein,
weshalb man von Halbmetallen spricht. Die Bandüberlappung resultiert üblicherweise aus
einem unterschiedlichen Verlauf der E(k)-Kurven in unterschiedliche Kristallrichtungen.
Dies können wir uns anhand von Abb. 8.14 klarmachen, welche das Energiespektrum für
ein zweidimensionales quadratisches Gitter zeigt. Ist die Bandlücke zwischen dem gezeig-
ten Band und dem darüber liegenden Band in der Mitte der Seitenlinie der quadratischen
Brillouin-Zone geringer als die Energiedifferenz zwischen diesem Punkt und der Ecke, so
346 8 Energiebänder
𝑬𝐅
EF 𝑬𝐅
𝝅 𝝅 [100] 𝒌
𝟎 𝒌𝟎 𝒌 [110] 𝟎
𝒂 𝒂
Leitungsband
Leitungsband 𝑬𝐅
Leitungsband
Abb. 8.18: Lage des Fermi- 𝑬𝐅
𝑬𝐅
Niveaus im Bänderschema Valenzband Valenzband Valenzband
für (a) Isolatoren, (b) Me-
talle und (c) Halbmetalle. Isolator Metall Halbmetall
40
kommt es zu einer Bandüberschneidung. Das Minimum des nächst höheren Bandes liegt
dann nämlich unterhalb des Maximums des betrachteten Bandes.
Zwischen Halbleitern und Isolatoren besteht kein prinzipieller Unterschied. Bei Halbleitern
liegt allerdings im Allgemeinen eine kleinere Bandlücke vor, so dass bei Raumtemperatur
einige Ladungsträger in das unbesetzte Leitungsband thermisch angeregt werden können.
Dadurch resultiert eine kleine elektrische Leitfähigkeit und man spricht von Halbleitern. Bei
Isolatoren ist die Bandlücke wesentlich größer, so dass dieser Prozess sehr unwahrscheinlich
ist. Der Übergang zwischen Halbleitern und Isolatoren ist allerdings fließend.19 Halbmetalle
haben wie Halbleiter nur eine geringe elektrische Leitfähigkeit. Während für Halbleiter die
elektrische Leitfähigkeit für T → 0 verschwindet, bleibt sie aber bei Halbmetallen endlich.
∎ Kristalle mit einer ungeraden Zahl von Elektronen pro Einheitszelle sind Metalle. In das
oberste Band müssen N Elektronen in die 2N verfügbaren Zustände eingefüllt werden,
so dass dieses nur halb gefüllt ist.
∎ Kristalle mit einer geraden Zahl von Elektronen pro Einheitszelle sind Isolatoren bzw.
Halbleiter, falls eine Bandlücke zwischen dem obersten gefüllten und untersten nicht ge-
füllten Band existiert, oder Halbmetalle, falls in diesem Bereich eine Bandüberlappung
existiert.
Wir betrachten als Beispiel Natrium mit der atomaren Elektronenkonfiguration 1s 2 , 2s 2 , 2p6 ,
3s 1 . Während die 1s, 2s und 2p Niveaus jeweils voll besetzte Bänder generieren, resultiert
aus dem nur mit einem Elektron besetzten 3s-Niveau ein halbgefülltes Band. Natrium sollte
deshalb (selbst wenn wir den 3s-3p-Überlapp vernachlässigen) ein Metall sein. In ähnlicher
Weise erwarten wir für alle Elemente der 1. Hauptgruppe metallisches Verhalten (Alkali-
Metalle). Ähnlich verhalten sich auch Cu (4s 1 ), Ag (5s 1 ) oder Au (6s 1 ), deren Eigenschaften
aber wegen der besetzten d-Zustände komplizierter sind.
Kohlenstoff hat dagegen die Elektronenkonfiguration 1s 2 , 2s 2 , 2p2 und wir würden naiv er-
warten, dass wegen der überlappenden 2p-Bänder (diese können insgesamt mit 6N Elek-
tronen besetzt werden) ein teilweise gefülltes Band und damit ein Metall resultiert. Diamant
ist aber bekanntermaßen ein Isolator. Die Situation ist hier etwas komplizierter, da eine sp3 -
Hybridisierung (vergleiche Abschnitt 3.4.3) vorliegt, die in einem in zwei Teile aufgespalte-
nen sp3 -Band resultiert. Beide sp3 -Hybridbänder können jeweils 4 Elektronen aufnehmen.
Die 4 Elektronen des 2s- und des 2p-Niveaus besetzten das untere sp3 -Band, so dass ein
vollbesetztes Band und damit in der Tat ein Isolator resultiert. Dies ist in Abb. 8.19 skizziert.
Verringern wir den Atomabstand kontinuierlich, so spalten zunächst die atomaren 2p- und
2s-Niveaus in Bänder auf, die mit insgesamt 6N bzw. 2N Elektronen besetzt werden könnten.
Bei einem Atomabstand von etwa 8 Å würden wir deshalb ein teilweise besetztes 2p-Band
und damit metallisches Verhalten erwarten. Bei noch kleineren Atomabständen führt aber
die Hybridisierung der 2p- und 2s-Niveaus zu zwei sp3 -Bändern, die mit jeweils 4N Elektro-
nen besetzt werden können. Wir erhalten deshalb beim Gleichgewichtsabstand R 0 = 3.57 Å
ein vollkommen gefülltes unteres und ein vollkommen leeres oberes sp3 -Band, die durch
eine Energielücke E g = 5.5 eV getrennt sind.
348 8 Energiebänder
Verlauf der Energiebänder in Diamant als Funktion von Atomabstand
0
Leitungsband
-2 𝟐𝒑𝟔
E (will. Einheiten)
𝑬𝒈
𝟐𝒔𝟐
-4
Valenzband
Abb. 8.19: Verlauf der Energiebän-
der in Diamant als Funktion des -6
Gleichgewichtsabstands der Ato- 𝑹𝟎
me. Beim Gleichgewichtsabstand
R 0 = 3.57 Å stellt sich in Diamant 0 4 8 12 16
eine Energielücke E g = 5.5 eV ein. Abstand (Å) 43
8.4.2 Halbmetalle
Wie Abb. 8.18 schematisch zeigt, liegt bei Halbmetallen eine geringe Überlappung des Va-
lenzbandes und des Leitungsbandes vor. Dadurch liegt auch bei gerader Elektronenzahl kei-
ne komplette Bandfüllung vor. Das Valenzband enthält eine kleine Konzentration n h von
Löchern und das Leitungsband eine geringe Elektronenkonzentration n e . Drei der in Tabel-
le 8.2 aufgelisteten Halbmetalle sind Elemente der V. Hauptgruppe des Periodensystems. Die
Gitterzellen dieser Elemente enthalten zwei Atome mit jeweils 5 Elektronen, so dass 10 Elek-
tronen pro Einheitszelle vorliegen. Demnach müsste ein Isolator oder Halbleiter vorliegen.
Aufgrund der Bandüberlappung erhalten wir aber Halbmetalle. Wie Abb. 8.18(c) zeigt, führt
die Bandüberlappung zu einer Dichte n h von Löchern im unteren und einer Dichte n e von
Elektronen im überlappenden oberen Band. Für den Fall dass die Gesamtzahl der Elek-
tronen ohne Bandüberlappung gerade zu einem vollständig gefüllten Band führen würde,
gilt n h ≃ n e . Wir sprechen dann von einem kompensierten Metall.
8.4.3 Isolatoren
Wir haben in Abschnitt 8.4.1 gesehen, dass wir Isolatoren immer dann erhalten, wenn das
chemische Potenzial in der Energielücke zwischen einem vollständig gefüllten und einem
vollkommen leeren Band liegt. Solche Isolatoren werden als Band-Isolatoren bezeichnet.
Wir erhalten sie immer dann, wenn eine gerade Anzahl von Ladungsträgern pro Einheitszel-
le und keine Bandüberlappung vorliegt. Es gibt aber auch noch andere Typen von Isolatoren,
die wir hier kurz erwähnen wollen.
8.4 Metalle, Halbmetalle, Halbleiter, Isolatoren 349
1. Anderson-Isolatoren:
In einem metallischen System werden die Elektronenwellen an Verunreinigungen ge-
streut. Die Überlagerung von fortlaufenden und rückgetreuten Wellen führt zu einer
nach Philip Warren Anderson benannten Lokalisierung der Ladungsträger, welche de-
ren Diffusion unterdrückt.20 Falls der Grad der Unordnung eine bestimmte Schwelle
überschreitet, verschwindet am absoluten Temperaturnullpunkt die elektrische Leitfä-
higkeit und alle anderen mit der Diffusivität zusammenhängenden Größen. Wir spre-
chen dann von einem Andersonschen Metall-Isolator-Übergang.
2. Mott-Isolatoren:
Als Mott-Isolatoren bezeichnen wir solche Materialien, die nach dem Bändermodell ei-
gentlich metallisch leitend sein sollten, aufgrund von starken Korrelationseffekten aber
isolierend sind. Die Bezeichnung geht auf den britischen Physiker Sir Nevill F. Mott zu-
rück, der 1974 vorhersagte, dass die Coulomb-Wechselwirkung zwischen den Ladungs-
trägern zu einem isolierenden Zustand in Metallen führen kann.21 Anschaulich können
wir dies so verstehen, dass ein Elektron beim Hüpfen auf einen bereits mit einem Elektron
besetzten Nachbarplatz aufgrund der Coulomb-Wechselwirkung eine hohe Energie U
aufbringen muss. Falls diese wesentlich größer als die verfügbare kinetische Energie t des
Elektrons ist, wird das Hüpfen stark unterdrückt. Es resultiert dann ein Zustand mit loka-
lisierten Elektronen, der elektrisch isolierend ist. Im umgekehrten Fall, t ≫ U, erhalten
wir einen metallisch leitenden Zustand. Eine einfache Beschreibung dieses Sachverhalts
kann mit dem Hubbard-Modell erfolgen [vergleiche hierzu (8.7.7) und Abschnitt 8.7.3]
3. Peierls-Isolatoren:
Peierls-Isolatoren treten in niedrigdimensionalen Metallen auf, die eine Instabilität ge-
genüber der Ausbildung von so genannten Ladungsdichtewellen besitzen.22 Die Peierls-
Instabilität können wir am einfachsten durch die Betrachtung eines eindimensionalen
Metalls mit einem Elektron pro Gitterplatz verstehen. Da wir in diesem Fall halbe Band-
füllung vorliegen haben, erwarten wir einen metallischen Zustand. Gehen wir von ei-
nem Zustand mit konstantem Gitterabstand a der Atome zu einem Zustand über, bei
dem der Abstand abwechselnd um δa verkleinert und vergrößert ist, so entspricht dies
einer räumlichen Modulation der Ladungsdichte. Da die betrachtete Verzerrung insge-
samt zu einer Energieabsenkung führt, ist das betrachtete System instabil gegenüber der
Ausbildung einer Ladungsdichtewelle (Peierls-Instabilität). Diese Modulation resultiert
im Realraum in einer Verdopplung der Gitterkonstante auf 2a und entsprechend im re-
ziproken Raum einer Halbierung des Durchmessers der Brillouin-Zone auf π⇑a. Da jetzt
bei halber Füllung der Fermi-Wellenvektor k F = π⇑2a genau mit dem Rand ±π⇑2a der
Brillouin-Zone zusammenfällt, entsteht eine Bandlücke 2∆ bei der Fermi-Energie. Wir
erhalten somit einen Metall-Isolator-Übergang. In zwei- und dreidimensionalen Syste-
men ist die Peierls-Instabilität allerdings meist stark unterdrückt.
20
P. W. Anderson, Absence of Diffusion in Certain Random Lattices, Phys. Rev. 109, 1492 (1958).
21
N. F. Mott, Metal-Insulator Transitions, Taylor & Francis, London (1974).
22
R. E. Peierls, Quantum Theory of Solids, Oxford University Press, Oxford (1955).
350 8 Energiebänder
4. Topologische Isolatoren:
Die erst vor wenigen Jahren entdeckte Materialklasse der topologischen Isolatoren23 , 24
zeichnet sich dadurch aus, dass sie im Innern elektrisch isolierend sind, an ihren Ober-
flächen jedoch eine ultradünne, weniger als einen Nanometer dicke Schicht ausbilden,
die den elektrischen Strom besonders gut leitet. Die Ursache für diese außerordentliche
Leitfähigkeit sind elektronische Oberflächenzustände. Solche Zustände gibt es bei den
meisten Materialien und sind deshalb nichts Ungewöhnliches. Das Besondere an den to-
pologischen Isolatoren ist, dass die leitenden Oberflächenzustände durch die fundamen-
tale Symmetrie (Topologie) der Bandstruktur im Innern des Materials aufgezwungen
werden. Diese Eigenschaft macht die metallischen Oberflächenzustände quasi immun
(topologisch geschützt) gegen Verunreinigungen oder Störungen. Im Zusammenspiel
mit der Spin-Bahn-Kopplung führt dies dazu, dass die sich an der Oberfläche bewe-
genden Elektronen nicht zurückgestreut werden können und sich somit dissipations-
los bewegen. Diese Eigenschaft hat viel Aufsehen erregt, da dadurch u.U. elektronische
Bauelemente mit geringerem Leistungsbedarf realisiert werden können. Zu der Klasse
der Topologischen Isolatoren werden heute auch Quanten-Hall-Systeme gerechnet (sie-
he Abschnitt 10.5). Eine weitergehende Diskussion von topologischen Isolatoren folgt in
Kapitel 14.
8.5.1 Zustandsdichte
In Analogie zur Zustandsdichte der Phononen, die wir bei der Behandlung der thermi-
schen Eigenschaften des Gitters eingeführt haben (vergleiche Abschnitt 5.3), führen wir
die Zustandsdichte D(E) der elektronischen Zustände ein. Wir erweitern dabei die in Ab-
schnitt 7.1.1 für das freie Elektronengas geführte Diskussion auf Systeme mit einer kompli-
zierteren Form der Flächen konstanter Energie E(k) = const. Sobald diese Energieflächen
bekannt sind, können wir in völliger Analogie zu Abschnitt 5.3 die Zustandsdichte D(E)
23
Ch. L. Kane, E. J. Mele, A New Spin on the Insulating State, Science 314, 1692-1693 (2006).
24
B. A. Bernevig, T. L. Hughes, Shou-Cheng Zhang, Quantum Spin Hall Effect and Topological Phase
Transition in HgTe Quantum Wells, Science 314, 1757-1761 (2006).
8.5 Zustandsdichte und Bandstrukturen 351
ermitteln. Die Zustandsdichte im Energieraum erhalten wir mit [vergleiche hierzu (7.1.16)]
k(E+∆E) k(E+∆E) E(k)+∆E
V
∫ Z(k)d k = 2 3
∫ d k=3
∫ D(E)dE ≃ D(E)∆E (8.5.1)
(2π)3
k(E) k(E) E(k)
V dS E
D(E) = 2 ∫ . (8.5.2)
(2π)3 ⋃︀∇k E(k)⋃︀
E(k)=const
Hierbei ist dS E ein Flächenelement der Fläche konstanter Energie E(k) = E und ∇k E(k) =
dE(k)⇑dk⊥ , wobei dk⊥ senkrecht auf dS E steht. Wir können in (8.5.2) noch durch das Vo-
lumen teilen, um die Zahl der Zustände pro Volumen und Energie zu erhalten.
Für freie Elektronen sind die Flächen konstanter Energie Kugeloberflächen und die Disper-
sion ist durch E(k) ∝ k 2 gegeben, so dass wir das Ergebnis (7.1.18) erhalten (vergleiche
Abschnitt 7.1.1). Für Kristallelektronen können die Flächen konstanter Energie (siehe Ab-
schnitt 8.6) wesentlich komplizierter aussehen. Die Zustandsdichte D(E) erhält insbeson-
dere durch diejenigen k-Raumpunkte, für die ⋃︀∇k E(k)⋃︀ = 0, d. h. für welche die Dispersi-
onskurve E(k) flach verläuft, eine reichhaltige Struktur. Diese Punkte nennen wir kritische
Punkte, sie resultieren in so genannten van Hove Singularitäten in der Zustandsdichte. Für
dreidimensionale Systeme wird D(E) in der Nähe der kritischen Punkte allerdings nicht sin-
gulär, da eine Entwicklung von E(k) um diese kritischen Punkte immer E(k) ∝ k 2 liefert
(siehe z. B. Abschnitt 8.3.1). Dies impliziert, dass ⋃︀∇k E(k)⋃︀−1 eine 1⇑k Singularität besitzt
und deshalb das Integral über die Fläche E(k) = const eine lineare k-Abhängigkeit besitzt.
Die Form von D(E) in der Nähe eines kritischen Punktes ist in Abb. 8.20 skizziert. In der
Nähe des kritischen Punkts können wir die Dispersion wie folgt schreiben:
3
E(k) = E c + ∑ c i (k i − k c i )2 . (8.5.3)
i=1
0 Ec E 0 Ec E 0 Ec E 0 Ec E
c1, c2, c3 > 0 c1, c2 > 0; c3 < 0 c1 > 0; c2, c3 < 0 c1, c2, c3 < 0
Dispersion
Abb. 8.20: in der Nähe
Qualitativer des kritischen
Verlauf Punktes:
der Zustandsdichte D(E) in der Nähe von kritischen Punkten. Die
Energie am kritischen Punkt ist E c .
352 8 Energiebänder
Hierbei ist E c die Energie am kritischen Punkt und c i sind Konstanten, die je nach Art des
kritischen Punktes (Minimum, Maximum, Sattelpunkte) unterschiedliches Vorzeichen ha-
ben. Wir erhalten
⌈︂
D(E) = D 0 + C E − E c , c 1 , c 2 , c 3 > 0, Minimum (8.5.4)
⌈︂
D(E) = D 0 − C E c − E, c 1 , c 2 > 0, c 3 < 0, Sattelpunkt I (8.5.5)
⌈︂
D(E) = D 0 − C E − E c , c 1 > 0, c 2 , c 3 < 0, Sattelpunt II (8.5.6)
⌈︂
D(E) = D 0 + C E c − E, c 1 , c 2 , c 3 < 0, Maximum (8.5.7)
L
16 U 16
G
S
y
X Z W K
x
12 12
EF EF
Energie (eV)
8 8
4 Al 4
0 0
G X W L G K X 0.0 0.4 0.8
Wellenvektor DOS (1/eV)
Abb. 8.21: Bandstruktur von Aluminium entlang von Richtungen hoher Symmetrie (links). Der Γ-
Punkt ist das Zentrum der 1. Brillouin-Zone (siehe Inset). Die Bandlücken an der Zonengrenzen sind
klein und der Bandverlauf kann in weiten Teilen durch parabelförmige Kurven angenähert werden.
Rechts ist die Zustandsdichte D(E) gezeigt (nach B. Segal, Phys. Rev. 124, 1797 (1961)).
8.5 Zustandsdichte und Bandstrukturen 353
8.5.2.2 3d-Übergangsmetalle
Im Vergleich zu den einfachen Metallen sind die Bandstrukturen der 3d-Übergangsmetalle
viel komplizierter. Dies liegt an den relativ stark gebundenen 3d-Elektronen. Im Vergleich
zu den äußeren s-Elektronen, die einen großen s-s-Überlapp haben und dadurch in breiten
Bändern resultieren, ist der d-d-Überlapp sehr klein. Dadurch erhalten wir im Vergleich zu
den breiten s-Bändern sehr schmale d-Bänder. Dies ist in Abb. 8.22 am Beispiel von Kupfer
(Elektronenkonfiguration: [Ar]3d 10 4s 1 ) verdeutlicht. Die s-Elektronen resultieren in einem
sehr breiten Band, das bei etwa −9.5 eV beginnt (Minimum am Γ-Punkt) und unterhalb von
etwa −5 eV einen fast parabolischen Verlauf hat. Dies zeigt, dass die s-Elektronen als quasi-
freie Elektronen betrachtet werden können. Die schmalen d-Bänder liegen zwischen etwa
−6 und −2 eV. Am Fermi-Niveau dominiert dagegen wiederum das parabolische s-Band.
Dies erklärt, warum wir die Eigenschaften von Cu recht gut im Rahmen des freien Elek-
tronengasmodells beschreiben können. Dies ist völlig anders für Fe, Ni oder Co. Für diese
3d-Übergangsmetalle liegt das Fermi-Niveau im Bereich der d-Bänder, die für diese Ele-
mente nur teilweise gefüllt sind. Die Eigenschaften von Fe, Ni und Co können deshalb nur
schlecht mit einem freien Elektronengasmodell beschrieben werden.
Der flache Verlauf der d-Bänder spiegelt sich in einer reichhaltigen Struktur der Zustands-
dichte D(E) wider. Dies wird durch ein Verschwinden von ⋃︀∇k E(k)⋃︀ verursacht. Ferner ist
die Zustandsdichte im Bereich der d-Bänder sehr hoch, da in den schmalen d-Bändern viele
Zustände innerhalb eines kleinen Energieintervalls untergebracht werden können. Im Ge-
gensatz dazu liefert das breite s-Band eine kleine Zustandsdichte.
s Cu
0 EF EF 0
-2 -2
Energie (eV)
Energie (eV)
-4 -4
d
-6 -6
-8 s -8
-10 -10
8 6 4 2 0L G X K G
DOS (bel. Einh.) Wellenvektor
Abb. 8.22: Bandstruktur E(k) von Kupfer entlang der Richtungen hoher Symmetrie. Links ist die re-
sultierende Zustandsdichte gezeigt (die Symbole entsprechen experimentellen Daten aus R. Courths
und S. Hüfner, Phys. Rep. 112, 55 (1984)).
354 8 Energiebänder
8.5.2.3 Halbleiter
Falls die Bandstruktur eine absolute Energielücke besitzt, das heißt, wenn für alle k-Rich-
tungen in einem bestimmten Energiebereich keine Zustände verfügbar sind, erhalten wir
einen Isolator oder Halbleiter. Als Beispiel ist in Abb. 8.23 die Bandstruktur und Zustands-
dichte von Germanium (Elektronenkonfiguration: [Ar]3d 10 4s 2 4p2 ) gezeigt. Wie Diamant
und Silizium kristallisiert Germanium in einer Diamantstruktur. In diesen Elementen liegt
eine ausgeprägte sp3 -Hybridisierung vor, was in einer für die Diamantstruktur charakteristi-
schen tetragonalen Bindungsstruktur resultiert. Die Bildung von sp3 -Hybridorbitalen führt
zur Ausbildung von zwei energetisch getrennten sp3 -Subbändern. Das untere dieser Bänder
ist vollständig gefüllt, das obere vollkommen leer. Die Fermi-Energie liegt bei T = 0 etwa
in der Mitte der Bandlücke. Die kleinste Lücke von E g = 0.75 eV liegt zwischen dem Γ- und
dem L-Punkt vor. Die direkte Bandlücke am Γ-Punkt ist mit E g = 1.1 eV etwas größer. Wir
sprechen deshalb von einem indirekten Halbleiter.
8 Ge 8
Leitungsbänder
L3
4 4
L1 G2´
Energie (eV)
0 Energielücke Energielücke 0
L3´ G25´ X4
-4 -4
Valenzbänder
-8 L1 -8
-12 -12
1.5 1.0 0.5 0L G X G
DOS (1/eV) Wellenvektor
Abb. 8.23: Berechnete Bandstruktur E(k) von Germanium entlang der Richtungen hoher Symmetrie.
Links ist die resultierende Zustandsdichte gezeigt. Eingezeichnet sind auch einige kritische Punkte
(nach F. Hermann, R. L. Kortum, C. D. Kuglin, J. L. Shay, in Semiconducting Compounds, D. G. Thomas
ed., Benjamin, New York (1967)).
2. Effektive Masse:
∎ Messung der Temperaturabhängigkeit der spezifischen Wärme des Elektronensys-
tems
3. Zustandsdichte am Fermi-Niveau:
∎ Messung der Temperaturabhängigkeit der spezifischen Wärme des Elektronensys-
tems
4. Fermi-Fläche:
∎ Messung des de Haas–van Alphen25 , 26 oder Shubnikov–de Haas27 , 28 Effekts (siehe
hierzu Abschnitt 9.11.1 und 9.11.2)
∎ Analyse der Magnetotransporteigenschaften
Wir werden die Methoden zur Bestimmung der Fermi-Fläche in Abschnitt 9.11 näher er-
läutern, nachdem wir uns mit der Dynamik der Kristallelektronen beschäftigt haben.
Eine der wichtigsten Methoden zur Bestimmung der kompletten Bandstruktur stellt die Pho-
toelektronenspektroskopie (PES) dar, auf die wir im Folgenden näher eingehen wollen. In-
formationen über die k-Abhängigkeit erhält man dabei durch winkelaufgelöste Experimen-
te: ARPES (angle resolved photo electron spectroscopy).29 , 30 , 31 , 32 Es gibt ferner noch einige
Methoden, die sich nur zur Untersuchung der Fermi-Flächen von Metallen, nicht aber zur
Bestimmung der gesamten Bandstruktur eignen. Auf diese Methoden werden wir später in
Abschnitt 9.11 eingehen.
Die prinzipielle Funktionsweise der PES ist in Abb. 8.24 dargestellt. Der zu untersuchende
Festkörper wird mit Photonen der Energie ħω bestrahlt. Dadurch werden Elektronen von
besetzten Bändern in unbesetzte Zustände des Quasikontinuums oberhalb des Vakuumni-
veaus E vac angeregt. Falls diese Elektronen genügend Energie haben, um die Austrittsarbeit
Φ A des Materials zu überwinden, können sie aus dem Festkörper entkommen. Die Energie-
bilanz lautet dabei (vergleiche Abb. 8.24)
ħω = Φ A + E kin + E b , (8.5.8)
wobei E kin die kinetische Energie der ausgetretenen Elektronen ist und E b die Bindungs-
energie der Elektronen im Festkörper (Abstand vom Fermi-Niveau). Wenn E kin gemessen
25
W. J. de Haas and P. M. van Alphen, Proc. Netherlands Roy. Acad. Sci. 33, 1106 (1930); Leiden
Commun. 208d, 212a (1930).
26
Wander Johannes de Haas, holländischer Physiker und Mathematiker, geboren am 2. März 1878
in Lisse, gestorben am 26. April 1960 in Bilthoven.
27
L. W. Shubnikov, W. J. de Haas, Proceedings of the Royal Netherlands Academy of Arts and
Science 33, 130 (1930), ibid. S. 163.
28
Lev Vasilyevich Shubnikov, russischer Physiker, geboren am 9. September 1901 in St. Petersburg,
gestorben am 10. November 1937.
29
M. Cardona, L. Ley, eds, Photoemission in Solids I, II, Topics Appl. Phys. Vol. 26, 27, Springer,
Berlin, Heidelberg (1979).
30
B. Feuerbach, B. Fitton, R. F. Willis eds., Photoemission and Electronic Properties of Surfaces, Wiley,
New York (1978).
31
H. Lüth, Surfaces and Interfaces of Solids, Springer, Berlin, Heidelberg (1993).
32
R. Courths und S. Hüfner, Photoemission experiments on copper, Phys. Rep. 112, 55 (1984).
356 8 Energiebänder
Photonenquelle Analysator
ℏ𝝎 𝜶 𝒆−
Probe Detektor
𝑫 𝑬 ℏ𝝎
𝑬𝐅 𝑬𝐯𝐚𝐜
𝟎 tiefliegendes 𝑬𝒃 𝚽𝐀 𝑬𝐤𝐢𝐧 𝑬max
kin 𝑬
Band
ℏ𝝎
Abb. 8.24: Oben: Prinzipieller Aufbau eines Photoemissionsexperiments mit Photonenquelle, Pro-
be, Analysator und Detektor. Unten: Schematische Darstellung der Bandstruktur (über 63 alle k gemit-
telt) und der relevanten Energien bei der Photoemissionsspektroskopie. Die Austrittsarbeit ist ϕ A =
E vac − E F . Die Elektronen werden aus den besetzten Bändern in das Quasikontinuum der unbesetzten
Zustände angeregt.
wird und Φ A sowie ħω bekannt sind, so kann im Experiment E b bestimmt werden. Die An-
zahl N(E kin ) der im Experiment gemessenen Elektronen mit einer bestimmten Energie E kin
gibt Auskunft über die Verteilung der im Festkörper besetzten elektronischen Zustände. Die
max
maximale kinetische Energie der Photoelektronen ist E kin = ħω − Φ A . Sie entspricht einer
Bindungsenergie E b = 0, also Elektronen am Fermi-Niveau. Da die Zustände oberhalb von
E F nicht besetzt sind (abgesehen von der Verschmierung durch die Fermi-Funktion), wer-
den keine Photoelektronen mit größeren kinetischen Energien gemessen.
Um die komplette Bandstruktur E n (k) zu bestimmen, nutzt man zusätzlich zur Energie-
erhaltung auch die Erhaltung des Kristallimpulses aus. Man führt hierzu winkelaufgelöste
Messungen durch, mit denen man mit gewissem Aufwand die komplette Bandstruk-
tur E n (k) bestimmen kann.33
Bezüglich der experimentellen Techniken wollen wir noch Folgendes anmerken:
∎ Da die Elektronen stark mit den Gitteratomen wechselwirken, besitzen sie nur eine ge-
ringe Austrittstiefe in der Größenordnung von 5 Å bei einer Energie zwischen etwa 10
und 100 eV. Deshalb ist die PES eine oberflächensensitive Methode. Dies hat Nachtei-
le, da eine Verschmutzung der Oberfläche verhindert werden muss (Ultrahochvakuum)
und in vielen Fällen eine Rekonstruktion der oberflächennahen Schichten eine Untersu-
chung von Bulk-Eigenschaften von Festkörpern schwierig macht. Andererseits können
mit der PES aber Oberflächenphänomene sehr gut untersucht werden.
33
Da beim Austritt der Photoelektronen nur der Impuls parallel zur Oberfläche erhalten bleibt, derje-
nige senkrecht dazu aber nicht, ist die komplette Bestimmung der k-Abhängigkeit allerdings nicht
ganz einfach.
8.5 Zustandsdichte und Bandstrukturen 357
Elektronenenergie (eV)
𝒌 + 𝑮𝟏𝟎𝟎 23
Photonen-
25 energie (eV)
20 40
28
ℏ𝝎 = 𝟐𝟔 eV 46
10 29 48
𝒌 − 𝑮𝟏𝟎𝟎 54
35 68
75
0 𝑬𝑭
Abb. 8.25: Rechts: Photoemissionsspektren einer Na (110) Oberfläche (Γ-N Richtung), die für senk-
rechte Emission mit unterschiedlichen Photonenenergien erhalten wurden. In senkrechter Richtung
ist die gemessene Photoelektronenintensität in willkürlichen Einheiten aufgetragen. Links ist der Ver-
lauf der relevanten Bänder gezeigt. Der Pfeil gibt den erwarteten Übergang für eine Photonenenergie
von 26 eV an. Der schattierte Bereich deutet die erwartete Breite der Spektren aufgrund einer end-
lichen freien Weglänge der Photoelektronen im Festkörper an (Daten aus E. Jensen, E. W. Plummer,
Phys. Rev. Lett. 55, 1912 (1985)).
Als Beispiel sind in Abb. 8.25 PES-Spektren von einer Na (110) Oberfläche gezeigt, die für
senkrechte Emission (α = 0○ ) mit unterschiedlichen Photonenenergien erhalten wurden.
Aufgetragen ist die gemessene Intensität der Photoelektronen gegen die Energie E b des An-
fangszustands. Der Pfeil in Abb 8.25 gibt den erwarteten Übergang für eine Photonenener-
gie von 26 eV an. Der schattierte Bereich deutet die erwartete Energieverschmierung der
Spektren aufgrund einer endlichen freien Weglänge der Photoelektronen im Festkörper an.
Aufgrund dieser Energieverschmierung resultiert auch eine Verschmierung im k-Raum, die
durch die beiden gestrichelten Pfeile angedeutet ist.
Abschließend wollen wir noch darauf hinweisen, dass die Photoelektronenspektroskopie
auch spinaufgelöst durchgeführt werden kann.34 , 35 Dabei werden die emittierten Photoelek-
tronen nicht nur bezüglich ihres Emissionswinkels und ihrer Energie, sondern auch hin-
34
J. Osterwalder, Spin-Polarized Photoemission, Lect. Notes Phys. 697, 95–120 (2006).
35
S. Suga, A. Sekiyama, Photoelectron Spectroscopy: Bulk and Surface Electronic Structures, Springer
Series in Optical Sciences, Vol. 176 (2014).
358 8 Energiebänder
sichtlich ihres Spinzustandes analysiert. Zum Beispiel sind Elektronen, die aus einem fer-
romagnetischen Metall emittiert werden, aufgrund der Austauschwechselwirkung spinpo-
larisiert (vergleiche hierzu Kapitel 12). Mit Hilfe von spinaufgelöster PES können die Spin-
zustände in Ferromagneten untersucht werden. Diese Technik kann auch zur Erzeugung
spinpolarisierter Elektronen sowie zum Studium magnetischer Phasenübergänge oder von
Oberflächenmagnetismus verwendet werden.
𝑬 reduziertes Zonenschema
𝒌𝒚 1. BZ
Fermi-
Fläche A 3
M
𝒌𝒚 2. BZ
Fermi- 2 1 X
Fläche B G 𝒌𝒙
𝝅 0 𝝅 𝒌𝒙 3. BZ
− 1. BZ
𝒂 𝝅 𝒂 ausgedehntes
− Zonenschema
𝒂
A B
A B
1. BZ 2. BZ 3. BZ 1. BZ
periodisches Zonenschema
Abb. 8.26: Fermi-Fläche eines quadratischen Gitters mit freien Elektronen. Oben links ist der parabo-
lische Verlauf der Dispersionskurve zusammen mit zwei möglichen Fermi-Kreisen A und B 72 bei un-
terschiedlicher Elektronenzahl pro Gitterplatz gezeigt. Oben in der Mitte und rechts sind die ersten
drei Brillouin-Zonen im ausgedehnten und reduzierten Zonenschema, unten im periodischen Zonen-
schema gezeigt. Für die beiden Fermi-Energien sind die Füllung der Brillouin-Zonen und die daraus
resultierenden Fermi-Flächen gezeigt. Die 4. Brillouin-Zone ist nicht mehr gezeigt.
Kreises und ist somit vollständig gefüllt. Die 2. Brillouin-Zone liegt dagegen nur teilweise
innerhalb des Fermi-Kreises und ist deshalb nicht vollständig gefüllt. Da sich der Fermi-
Kreis bis in die 3. Brillouin-Zone erstreckt, ist auch diese teilweise gefüllt. Im reduzierten
und periodischen Zonenschema erkennen wir, dass die 2. Brillouin-Zone fast vollständig
gefüllt ist. Die Fermi-Fläche in der zweiten Brillouin-Zone kann deshalb als Umrandung ei-
nes „Lochs“ um das Zonenzentrum aufgefasst werden. Die 3. Brillouin-Zone hat die Form
von Rosetten, die um die Eckpunkte der 1. Brillouin-Zone angeordnet sind.
2. BZ Fermi-Fläche 2. BZ
freie Elektronen Kristallelektronen
3. BZ
2. BZ
3. BZ 3. BZ
1. BZ
ausgedehntes Zonenschema
freie Elektronen Kristallelektronen
Abb. 8.27: Qualitativer Verlauf der Fermi-Flächen von freien Elektronen (links) und Kristallelektro-
nen (rechts) für ein quadratisches Gitter. In der Mitte sind die ersten drei Brillouin-Zonen im ausge-
dehnten Zonenschema gezeigt. Eingezeichnet ist hier der Verlauf der Fermi-Fläche von freien Elek-
tronen (Kreis, gestrichelt, orange) und der von Kristallelektronen (durchgezogene Linie, blau). Die
4. Brillouin-Zone ist nicht mehr gezeigt.
Berücksichtigen wir diese Tatsachen, so erhalten wir die in Abb. 8.27 gezeigten Fermi-
Flächen. Wir sehen, dass der Fermi-Kreis, den wir für den Fall freier Elektronen erhalten,
an den Zonenrändern verformt werden muss, so dass er die Ränder der verschiedenen
Brillouin-Zonen senkrecht schneidet. Dies entspricht dem veränderten Verlauf der Disper-
sionskurve E(k) am Rand der Brillouin-Zonen beim Übergang von vollkommen freien
zu Kristallelektronen. Die Fermi-Linie zeigt auf den Rändern der Brillouin-Zonen Un-
stetigkeitsstellen, die eine Konsequenz der endlichen Energielücke an den Zonenrändern
sind. Wir erkennen, dass durch die Verbiegung der Fermi-Linie jetzt mehr Elektronen in
die 2. Brillouin-Zone eingebaut werden können. Da die Elektronen hier eine geringere
Energie als in der nächst höheren Brillouin-Zone besitzen, führt das zu einer Energieab-
senkung. Die insgesamt von der gestrichelten (freie Elektronen) und der durchgezogenen
Linie (Kristallelektronen) umschlossene Fläche muss gleich sein, da die Fläche ja durch die
Gesamtzahl der Elektronen gegeben ist und wir diese als konstant angenommen haben.
Schließlich zeigt Abb. 8.27, dass die scharfen Strukturen, welche die Fermi-Fläche von
freien Elektronen zeigt, da sie die Zonengrenze nicht senkrecht schneiden, für den Fall der
Kristallelektronen abgerundet werden. Der auf diese einfache Weise erhaltene schematische
Verlauf der Fermi-Fläche ist für die Anschauung sehr nützlich.
Wir wollen abschließend noch einige numerisch berechnete Fermi-Flächen zeigen. Wir be-
ginnen mit einfachen Metallen wie Cu, Ag, Au oder den Alkalimetallen. Die Alkalimetalle
8.6 Fermi-Flächen von Metallen 361
Li Na K Rb
Cs Cu Ag Au
Abb. 8.28: Fermi-Flächen von einfachen Metallen. Die Alkali-Metalle kristallisieren in einem bcc-
Gitter, Cu, Ag und Au in einem fcc-Gitter (Quelle: T.-S. Choy, J. Naset, J. Chen, S. Hershfield, C. Stanton,
A database of fermi surface in virtual reality modeling language (vrml), Bull. Am. Phys. Soc. 45, L36 42
(2000)). Die Linien deuten die 1. Brillouin-Zone an, die für ein bcc-Gitter ein rhombisches Dodekaeder
und für ein fcc-Gitter ein abgestumpfter Oktaeder mit 8 Sechsecken und 6 Quadraten ist (vergleiche
Abb. 2.4).
besitzen eine bcc-Struktur und alle jeweils nur ein Valenzelektron pro Atom. Cu, Ag und
Au kristallisieren in der fcc-Struktur und haben ebenfalls nur ein Elektron in der 4s-, 5s-
bzw. 6s-Schale. Im Gegensatz zu den Alkalimetallen sind aber die 3d-, 4d- bzw. 5d-Bänder
hier vollständig gefüllt. In jedem Fall ist die Zahl der Elektronen im obersten besetzten Band
gerade gleich der Zahl N der Gitteratome. Das im k-Raum beanspruchte Volumen beträgt
gerade die Hälfte des Volumens der Brillouin-Zone, also
1 (2π)3
VN = , (8.6.1)
2 V
wobei der Faktor 12 aus der Spin-Entartung resultiert. Bei völlig freien Elektronen würde der
Radius der Fermi-Kugel gerade
N 1⇑3
k F = (3π 2 ) (8.6.2)
V
betragen. Für ein kubisch flächenzentriertes Gitter gilt ferner
N 4
= 3, (8.6.3)
V a
wobei a die Gitterkonstante ist. Setzen wir diesen Wert in (8.6.2) ein, so erhalten wir
1⇑3
12π 2 4.91
kF = ( ) ≃ . (8.6.4)
a3 a
⌋︂
Der kürzeste Abstand des Zentrums der 1. Brillouin-Zone zum Zonenrand beträgt für die
1. Brillouin-Zone eines fcc-Gitters gerade 12 2π
a
3 ≃ 5.44
a
. Wir sehen, dass dieser Wert größer
362 8 Energiebänder
Ca Sr Zn Cd
Al Ni Ni↑ Ni↓
Abb. 8.29: Fermi-Flächen von komplexeren Metallen. Die Erdalkali-Metalle Ca und Sr kristallisieren
in einem fcc-Gitter. Zn und Cd kristallisieren eigentlich in der hcp-Struktur, gezeigt ist allerdings die
Fermi-Fläche für eine fcc-Struktur, um einen Vergleich zu Ca und Sr zu ermöglichen. Gezeigt sind fer-
ner die Fermi-Flächen von Al (fcc-Struktur) und Ni (fcc-Struktur) gemittelt über beide Spin-Richtun-
gen und für jede Spin-Richtung getrennt (Quelle: T.-S. Choy, J. Naset, J. Chen, S. Hershfield, C. Stanton,
A database of fermi surface in virtual reality modeling language (vrml), Bull. Am. Phys. Soc. 45, L36 42
(2000)).
http://www.phys.ufl.edu/fermisurface
ist als k F . Das heißt, die Fermi-Kugel der völlig freien Elektronen berührt den Zonenrand
der 1. Brillouin-Zone nicht. Dadurch sollte die Fermi-Fläche der Kristallelektronen derje-
nigen der freien Elektronen sehr ähnlich sein, da ja große Abweichungen nur in der Nä-
he des Zonenrandes auftreten. Da wir allerdings durch das periodische Gitterpotenzial ein
Absenkung der Bandenergie am Rand der 1. Brillouin-Zone erhalten, kommt es zu einer
Aufwölbung der Fermi-Fläche an den Stellen, an denen die Fermi-Kugel der freien Elektro-
nen dem Zonenrand nahe kommt. An diesen Stellen kann die Fermi-Fläche dann auch den
Zonenrand berühren, wobei an den Berührungsstellen die Flächen E(k) = const den Zo-
nenrand senkrecht schneiden. Dies ist, wie Abb. 8.28 zeigt, für Cu, Ag und Au, aber auch für
Cs der Fall. Für die anderen Alkalimetalle ist der Abstand der Fermi-Kugel zum Zonenrand
so groß, dass eine Berührung nicht auftritt. Im periodischen Zonenschema müssen wir die
in Abb. 8.28 gezeigten Fermi-Flächen periodisch fortsetzen. Dabei tritt bei Cs, Cu, Ag und
Au eine Verbindung der verschiedenen Zonen durch schmale „Hälse“ auf.
Die Situation wird schwieriger, wenn wir von den Alkali- zu den Erdalkali-Metallen über-
gehen. In Abb. 8.29 sind die Fermi-Flächen von Ca ([Ar]4s 2 ) und Sr ([Kr]5s 2 ) gezeigt, die
beide in einer fcc-Struktur kristallisieren. Beide Elemente haben zwei s-Elektronen und soll-
ten deshalb Isolatoren sein. Aufgrund einer Bandüberlappung ist das erste Band, das in
Abb. 8.29 gezeigt ist, nur teilweise gefüllt und einige Elektronen besetzen das zweite Band. Zn
([Ar]3d 10 4s 2 ) und Cd ([Kr]4d 10 5s 2 )haben genauso wie Ca und Sr jeweils zwei s-Elektronen,
mit dem Unterschied, dass bei diesen Elementen jetzt die d-Schale komplett gefüllt ist. Die
d-Elektronen liegen allerdings unterhalb des Fermi-Niveaus und spielen für die Form der
Fermi-Fläche eine untergeordnete Rolle. Die Fermi-Flächen von Ca und Sr einerseits und
Zn und Cd andererseits sind deshalb sehr ähnlich.
8.7 Wechselwirkende Elektronensysteme 363
wobei wir die Orte der Elektronen mit kleinen und diejenigen der Kerne mit großen Buch-
staben bezeichnet haben. In abgekürzter Form können wir den Hamilton-Operator als
ℋ=𝒯 +𝒱 +𝒰 (8.7.2)
schreiben, wobei 𝒯 und 𝒱 die kinetische und potenzielle Energie des nichtwechselwirken-
den Elektronensystems sind. Die Größe 𝒰 trägt der paarweisen Wechselwirkung der Elektro-
nen untereinander Rechnung und führt zu einer beträchtlichen Komplexität bei der Lösung
der Schrödinger-Gleichung.
364 8 Energiebänder
1 ψ (x ) ψ 2 (x 1 )
ψ(x 1 , x 2 ) = ⌋︂ ⋁︀ 1 1 ⋁︀ . (8.7.3)
2 ψ 1 (x 2 ) ψ 2 (x 2 )
Diese Vorgehensweise hat John C. Slater auf N Elektronen erweitert.
8.7.1 Hartree-Fock-Methode
Die Hartree-Fock-Methode37 basiert auf der Annahme, dass die exakte N-Elektronen-
Wellenfunktion näherungsweise durch eine Slater-Determinante von Einteilchen-Wellen-
funktionen beschrieben werden kann. Ferner wird die adiabatische (Born-Oppenheimer)
Näherung verwendet und relativistische Effekte (die zur Spin-Bahn-Wechselwirkung füh-
ren) vernachlässigt. Wir können dann eine Variationsrechnung durchführen, indem wir
eine Linearkombination einer endlichen Zahl von Basisfunktionen bilden und die Koeffizi-
enten durch Minimierung der Energie bestimmen. Auf diese Weise können wir die mittlere
Coulomb-Wechselwirkung eines Elektrons mit allen anderen Elektronen und den Kernen
bestimmen, die nach Douglas R. Hartree auch Hartree-Energie genannt wird:
9 ħ2 aB
E Hartree = − Z 5⇑3 ( ) (8.7.4)
5 2ma B2 r A
Hierbei ist ħ 2 ⇑2ma B2 = 13.6 eV die Rydberg-Energie. Diesen Ausdruck haben wir für Z = 1
bereits in Abschnitt 3.5.1 angegeben [vergleiche (3.5.4)].
Die Austauschenergie eines Gases von Leitungselektronen wurde zuerst von Wladimir
A. Fock berechnet und wird deshalb auch als Fock-Energie bezeichnet. Sie kommt in Ana-
logie zur kovalenten Bindung durch den Überlapp der Wellenfunktionen der delokalisierten
Elektronen zustande und beträgt pro Elektron [vergleiche (3.5.7)]
3k F e 2 ħ2 aB
E Fock = − = −0.916 ( ), (8.7.5)
(4π) є 0
2 2ma B2 r A
wobei wir k F = (3π 2 n)1⇑3 und n = ( 43 πr 3A )−1 benutzt haben. Die relativ große negative
Austauschenergie ist für die metallische Bindung entscheidend. Eine Energieerniedri-
gung kommt dadurch zustande, dass Elektronen mit gleichem Spin voneinander entfernt
gehalten werden und so die Coulomb-Abstoßung minimiert wird. In der Hartree-Fock-
Näherung setzt sich die Gesamtenergie des Elektronengases aus der kinetischen Energie
sowie der Hartree- und Fock-Energie zusammen. Die mit der Hartree-Fock-Methode
errechnete Energie erreicht allerdings nie den exakten Wert. Der Grund dafür ist, dass
37
A. Szabo, N. S. Ostlund, Modern Quantum Chemistry, Dover Publishing, New York (1996).
8.7 Wechselwirkende Elektronensysteme 365
durch die Verwendung eines gemittelten Potenzials Korrelationen unter den Elektronen
nicht vollständig erfasst werden. Streng genommen beinhaltet die Bezeichnung „Korrela-
tionen“sowohl Coulomb-Korrelationen als auch Fermi-Korrelationen. Letztere basieren auf
dem Elektronenaustausch, der von der Hatree-Fock-Methode bereits voll berücksichtigt
wird.
8.7.2 Dichtefunktionaltheorie
Eine andere sehr bedeutende Methode ist die Dichtefunktionaltheorie (DFT)38 . Die DFT
ist ein Verfahren zur Bestimmung des quantenmechanischen Grundzustandes eines Viel-
elektronensystems, das auf der ortsabhängigen Elektronendichte n(r) beruht. Vereinfacht
ausgedrückt bildet die DFT ein wechselwirkendes Elektronensystem mit endlicher Elektron-
Elektron-Wechselwirkung 𝒰 auf ein System nichtwechselwirkender Elektronen ab, die sich
in einem effektiven Potenzial bewegen, das in den gleichen Grundzustandseigenschaften re-
sultiert. Mit ihr können dann näherungsweise sowohl die Austauschenergie als auch die Kor-
relationsenergie berechnet werden. Ihre große Bedeutung liegt darin, dass es mit ihr nicht
notwendig ist, die vollständige Schrödinger-Gleichung für ein Vielelektronensystem zu lö-
sen, wodurch der Aufwand an Rechenleistung stark sinkt. Die Grundlage der DFT sind die
Hohenberg-Kohn-Theoreme.39 , 40 Das erste besagt, dass der Grundzustand eines Systems aus
N Elektronen eine eindeutige ortsabhängige Elektronendichte n(r) besitzt und die Gesamt-
energie des Systems ein eindeutiges Funktional dieser Dichte ist. Das zweite Theorem besagt,
dass das Funktional nur dann die Grundzustandsenergie des Systems liefert, wenn die Dichte
n(r) der Grundzustandsdichte n 0 (r) entspricht. In der DFT wird die Grundzustandsdichte
n 0 (r) bestimmt, woraus dann im Prinzip alle weiteren Eigenschaften des Grundzustandes
bestimmt werden können. Diese Eigenschaften, z. B. die Wellenfunktion Ψ0 = Ψ0 (n 0 (r))
und Gesamtenergie E 0 = E 0 (n 0 (r)) = ∐︀Ψ0 ⋃︀𝒯 + 𝒱 + 𝒰⋃︀Ψ0 ̃︀ sind eindeutige Funktionale der
Elektronendichte. Bei der DFT besteht das Problem nun darin, das korrekte Dichtefunktio-
nal zu bestimmen. Auf die hierzu verwendeten Methoden wollen wir hier nicht eingehen.
Die von verschiedenen Autoren für die Korrelationsenergie E K berechneten Ausdrücke un-
terscheiden sich leicht. Nozières und Pines erhalten41
ħ2 rA
EK = − ]︀1.565 − 0.423 ln ( ){︀ . (8.7.6)
2ma B2 aB
8.7.3 Hubbard-Modell
Lange Zeit wurden für die Modellierung wechselwirkender Elektronensysteme zwei ge-
trennte Ansätze verfolgt. Auf der einen Seite stehen die Dichtefunktionaltheorie (DFT)
und ihre lokale Dichtenäherung (LDA), die ab initio Ansätze darstellen und somit keine
38
R. M. Dreizler, E. K. U. Gross, Density Functional Theory, Springer Verlag, Berlin (1990).
39
P. Hohenberg, W. Kohn, Inhomogeneous Electron Gas, Phys. Rev. B 136 864–871 (1964).
40
W. Kohn, L. J. Sham, Self-Consistent Equation Including Exchange and Correlation Effects, Phys. Rev.
A140 1133–1138 (1965).
41
P. Nozières, D. Pines, Correlation Energy of a Free Electron Gas, Phys. Rev. 111 442-454 (1958).
366 8 Energiebänder
empirischen Parameter als Eingangsgrößen benötigen. Mit Hilfe der DFT/LDA können
deshalb prinzipiell die elektronischen Eigenschaften von Festkörpern vorhergesagt wer-
den, diese Methode besitzt aber doch große Einschränkungen bei der Modellierung von
stark korrelierten Systemen. Auf der anderen Seite stehen Ansätze, die Modell-Hamilton-
Operatoren in Verbindung mit Vielteilchenmethoden benutzen. Obwohl sich die hierzu
notwendigen Techniken stark weiterentwickelt haben, besteht nach wie vor das Problem,
dass empirische Parameter als Eingangsgrößen benötigt werden. Zusammen mit der Kom-
plexität der Modellierung des Vielteilchenproblems verhindert dies bis heute, dass die auf
Modell-Hamilton-Operatoren basierenden Ansätze erfolgreich für die Modellierung realer
Materialien verwendet werden können.
Bei den Ansätzen, die auf Modell-Hamilton-Operatoren in Verbindung mit Vielteilchenme-
thoden basieren, ist das einfachste Modell das Einband-Hubbard-Modell, das unabhängig
voneinander von Gutzwiller,42 Hubbard43 und Kanamori44 eingeführt wurde. Das Hubbard-
Modell beschreibt das Verhalten der Elektronen in einem als starr angenommenen Kristall-
gitter. Dabei wird die abstoßenden Coulomb-Wechselwirkung nur für diejenigen Elektronen
berücksichtigt, die sich am gleichen Gitterplatz aufhalten, d.h. die Wechselwirkung zwischen
den Elektronen wird als lokal angenommen. Der Anteil der kinetischen Energie der Elek-
tronen wird durch ein Überlappintegral t modelliert, das aus dem Tight-Binding-Modell
kommt. Der Hamilton-Operator besteht aus der kinetischen Energie und der Wechselwir-
kungsenergie
wobei t i j die Hüpfamplitude zwischen Gitterplatz R i und R j und U die lokale Hubbard-
Wechselwirkung ist. Die Operatoren c †i,σ (c i,σ ) erzeugen (vernichten) ein Elektron mit Spin σ
am Gitterplatz R i . Der Operator n i,σ = c †i,σ c i,σ ist der Teilchenzahloperator, der die Beset-
zung auf Platz i angibt. Offensichtlich beschreibt der erste Term in (8.7.7) das Hüpfen der
Elektronen zwischen den Gitterplätzen und der zweite Term die lokale Wechselwirkung von
Elektronen mit entgegengesetztem Spin auf dem gleichen Gitterplatz. Obwohl das Hubbard-
Modell sehr einfach aussieht, führt der Wettstreit zwischen kinetischer und potenzieller
Energie zu einem komplexen Vielteilchenproblem, das bis heute analytisch nur für eindi-
mensionale Systeme gelöst wurde. Die auf Modell-Hamilton-Operatoren in Verbindung mit
Vielteilchenmethoden basierenden Ansätze wurden kontinuierlich weiterentwickelt und ha-
ben zur Formulierung der Dynamical Mean Field Theory (DMFT) geführt45 , 46 , die heute
erfolgreich zur Modellierung stark korrelierter Elektronensysteme benutzt wird.
42
M. C. Gutzwiller, Effect of Correlation on the Ferromagnetism of Transition Metals, Phys. Rev. Lett.
10, 159–162 (1963).
43
J. Hubbard, Electronic Correlations in Narrow Energy Bands, Proc. Roy. Soc. London A 276, 238–
257 (1963).
44
J. Kanamori, Electron Correlations and Ferromagnetism of Transition Metals, Prog. Theor. Phys. 30,
275–289 (1963).
45
A. Georges et al., Dynamical mean-field theory of strongly correlated fermion systems and the limit
of infinite dimensions, Rev. Mod. Phys. 68, 13 (1996).
46
G. Kotilar, D. Vollhardt, Strongly correlated materials: insights form dynamical mean-field theory,
Physics Today 3, 53 (2004).
Literatur 367
Abschließend wollen wir darauf hinweisen, dass die Dichtefunktionaltheorie und die An-
sätze, die auf Modell-Hamilton-Operatoren basieren, weitgehend komplementär sind. Des-
halb ist eine Kombination beider Herangehensweisen unter Ausnutzung der jeweiligen Stär-
ken der einzelnen Ansätze wünschenswert. Einer der ersten Schritte in diese Richtung war
die LDA+U-Methode,47 die erfolgreich zur Modellierung langreichweitig geordneter, iso-
lierender Zustände von Übergangsmetall- und Seltenerd-Verbindungen benutzt wurde. Die
Behandlung von paramagnetischen metallischen Phasen benötigt allerdings eine Behand-
lung unter Berücksichtigung von dynamischen Effekten in Form einer frequenzabhängigen
Selbstenergie. Dies wurde mit der Entwicklung der LDA+DMFT-Methode48 erreicht, bei der
elektronische Bandstrukturrechnungen in der LDA-Näherung mit Vielteilcheneffekten auf-
grund der lokalen Hubbard-Wechselwirkung und der Hundschen Kopplung zusammenge-
führt werden und dann das entsprechende Korrelationsproblem mit Hilfe der DMFT gelöst
wird.49
Literatur
N. W. Ashcroft, N. D. Mermin, Festkörperphysik, Oldenbourg Verlag, München (2012).
F. Bloch, Über die Quantenmechanik der Elektronen in Kristallgittern, Doktorarbeit, Univer-
sität Leipzig (1928).
J. Callaway, Energy Band Theory, Academic, New York (1964).
M. Cardona, L. Ley, eds, Photoemission in Solids I, II, Topics Appl. Phys. Vol. 26, 27, Springer,
Berlin, Heidelberg (1979).
R. Courths, S. Hüfner, Photoemission experiments on copper, Phys. Rep. 112, 55 (1984).
W. J. de Haas, P. M. van Alphen, Proc. Netherlands Roy. Acad. Sci. 33, 1106 (1930); Leiden
Commun. 208d, 212a (1930).
R. M. Dreizler, Eberhard K. U. Gross, Density Functional Theory, Springer Verlag, Berlin
(1990).
B. Feuerbach, B. Fitton, R. F. Willis eds., Photoemission and Electronic Properties of Surfaces,
Wiley, New York (1978).
A. Georges et al., Dynamical mean-field theory of strongly correlated fermion systems and the
limit of infinite dimensions, Rev. Mod. Phys. 68, 13 (1996).
W. A. Harrison, Pseudopotenzials in the Theory of Metals, Benjamin, New York (1966).
47
V. I. Anisimov, J. Zaanen, O. K. Andersen, Band Theory and Mott Insulators: Hubbard U instead of
Stoner I, Phys. Rev. B 44 943–954 (1991).
48
V. I. Anisimov, First Principles Calculations of the Electronic Band Structure and Spectra of Strongly
Correlated Systems: Dynamical Mean-Field Theory, J. Phys.: Condens. Matter 9 7359 (1997).
49
D. Vollhardt, Dynamical mean-field theory for correlated electrons, Ann. Phys. (Berlin) 524, 1–19
(2012).
368 8 Energiebänder
wirken. Einige Phänomene, wie zum Beispiel der Ladungs- und Wärmetransport in Festkör-
pern, sind nun aber gerade mit Situationen verknüpft, in denen äußere Kräfte wirksam sind.
Wir wollen deshalb in diesem Abschnitt die Dynamik von Kristallelektronen unter der Wir-
kung von äußeren Kräften diskutieren. Es reicht jetzt nicht mehr aus, nur die zeitunabhän-
gige Schrödinger-Gleichung zu betrachten. Zur Beschreibung von Transportphänomenen
müssen wir vielmehr zur zeitabhängigen Schrödinger-Gleichung übergehen. Dadurch wird
die Beschreibung erheblich schwieriger. Wir werden uns deshalb im Folgenden auf Situatio-
nen beschränken, in denen wir eine semiklassische Beschreibung der Dynamik von Kristal-
lelektronen verwenden können. Hierbei werden die externen Kräfte klassisch beschrieben,
während die Ableitung der Bandstruktur auf einer quantenmechanischen Analyse beruht.
Wir haben Transportphänomene in Festkörpern bereits in Abschnitt 7.3 im Rahmen des
einfachen Drude-Sommerfeld-Modells beschrieben. Wir werden die dort für freie Elektro-
nen geführte Diskussion jetzt auf den Fall von Bandelektronen erweitern. Wir werden dabei
Sommerfeld Bloch
viele Definitionen und Konzepte aus Abschnitt 7.3 übernehmen können. In der Tabelle sind
nochmals die wesentlichen Elemente des Sommerfeld-Modells der freien Elektronen und
des Blochschen Modells der Kristallelektronen gegenübergestellt.
Wir werden uns in Abschnitt 9.1 zunächst mit den Grundlagen und dem Gültigkeitsbereich
des semiklassischen Modells beschäftigen. Anschließend werden wir in Abschnitt 9.2 die
Bewegung von Kristallelektronen unter der Wirkung von äußeren Kräften betrachten, wo-
bei wir Streuprozesse der Elektronen zunächst völlig vernachlässigen werden. Diese werden
erst in Abschnitt 9.3 eingeführt. In Abschnitt 9.5 werden wir die Boltzmann-Transportglei-
chung anwenden, um einige Transportkoeffizienten abzuleiten. Insbesondere werden wir
hier die thermoelektrischen und thermomagnetischen Effekte behandeln. Da die mit dem
Spin-Freiheitsgrad verbundenen Transportphänomene in den letzten Jahren stark an Bedeu-
tung gewonnen haben, diskutieren wir in Abschnitt 9.6 den Spin-Transport und stellen in
Abschnitt 9.7 Transportphänomene vor, bei denen die Spin-Bahn-Kopplung und die Topolo-
gie der Spin-Textur eine zentrale Rolle spielen. In Abschnitt 9.8 erläutern wir die Auswirkung
von Quanteninterferenzeffekten auf den Ladungstransport bevor wir uns in den Abschnit-
ten 9.9 und 9.10 dann mit dem Magnetwiderstand und der Quantisierung der Elektronen-
bahnen in starken Magnetfeldern beschäftigen. Abschließend werden wir in Abschnitt 9.11
experimentelle Methoden zur Bestimmung der Fermi-Flächen von Metallen diskutieren, die
auf der Untersuchung der Dynamik von Kristallelektronen basieren.
Um Verwechslungen mit dem elektrischen Feld E zu vermeiden, werden wir in diesem Ka-
pitel die Energie mit ε und nicht mit E bezeichnen.
9.1 Semiklassisches Modell 371
dr ħk p
= = (9.1.1)
dt m m
dk
ħ = F = q (E + v × B) . (9.1.2)
dt
Hierbei war die Kraft F = q (E + v × B) die auf die Ladungsträger wirkende Kraft durch elek-
trische und magnetische Felder. Wollen wir die Anwendbarkeit von (9.1.1) und (9.1.2) vom
quantenmechanischen Standpunkt aus rechtfertigen, so müssen wir von ebenen Wellen zu
Wellenpaketen übergehen, die wir einfach durch eine Überlagerung von ebenen Wellen mit
Wellenvektoren aus einem bestimmten Bereich erzeugen können.
Bei der Diskussion der Bewegung von Kristallelektronen sind wir ebenfalls mit dem Pro-
blem konfrontiert, die Bewegung von mehr oder weniger lokalisierten Teilchen beschrei-
ben zu müssen. Im vorangegangenen Kapitel haben wir überwiegend im Wellenbild (Bloch-
Wellen, Bragg-Reflexion, etc.) argumentiert. Wir haben die Elektronen mit Bloch-Wellen
beschrieben, die räumlich modulierte, aber unendlich ausgedehnte Wellen mit Wellenvek-
tor k darstellen. Für die Beschreibung von Transportphänomenen ist dagegen meist das Teil-
chenbild besser geeignet. Wir müssen also auch für Kristallelektronen von Bloch-Wellen
zu Wellenpaketen, die aus Bloch-Wellen aufgebaut sind, übergehen. Wir können dann ei-
nem Kristallelektron eine Gruppengeschwindigkeit vg zuordnen, die gleich der Gruppenge-
schwindigkeit eines Wellenpakets aus Bloch-Wellen ist. Wir drücken also den Zustand eines
Elektrons durch ein Wellenpaket aus, das heißt, als eine lineare Überlagerung von Bloch-
Wellen Ψn,k (r) mit Wellenvektoren aus einem Intervall (︀k − ∆k
2
, k + ∆k
2
⌋︀ aus:
k+ ∆k
2 ε n (k)
Ψn (r, t) = ∑ a(k) u k (r) e
ı[︀k⋅r− ħ t⌉︀
. (9.1.3)
k− ∆k
2
Hierbei ist ε n (k) die Dispersion der Kristallelektronen. Diese Beschreibung von Kristallelek-
tronen durch Wellenpakete mit wohldefiniertem Impuls wird als Semiklassisches Modell be-
zeichnet. Wohldefinierter Impuls bedeutet hierbei, dass die Impulsverschmierung des Wel-
lenpakets klein gegenüber der Ausdehnung der Brillouin-Zone ist. Wir werden hier nicht
versuchen, einen Beweis für die Gültigkeit dieses Ansatzes zu geben, da dies eine relativ
schwierige Aufgabe darstellt. Wir werden vielmehr das semiklassische Modell anwenden
und seine Gültigkeitsgrenzen diskutieren.
In Abb. 9.1 ist ein entsprechendes Wellenpaket im eindimensionalen Ortsraum gezeigt. Es
ist wohlbekannt, dass das Produkt aus Ortsunschärfe ∆x und Impulsunschärfe ∆k der Hei-
1
Wir verwenden die Größe e wiederum für die positive Einheitsladung, Elektronen haben also die
Ladung q = −e.
372 9 Dynamik von Kristallelektronen
t=0
𝒗𝒈 𝒕𝟎
𝒕 = 𝒕𝟎
Re
Abb. 9.1: Ortsraumdarstellung ei-
nes Wellenpakets, das die Bewegung
von räumlich lokalisierten Elektro-
nen zur Zeit t = 0, t = t 0 und t = 2t 0 𝒕 = 𝟐𝒕𝟎 𝟐𝒗𝒈 𝒕𝟎
beschreibt. Die durchgezogene Kurve
gibt Re Ψ, die gestrichelte ⋃︀Ψ⋃︀ wi-
der. Der Schwerpunkt des Wellen-
pakets bewegt sich mit der Grup- -2 0 2 4 6 8 10 12
pengeschwindigkeit v g = ∂ω⇑∂k. x
2
senbergschen Unschärferelation
∆p ⋅ ∆x = ħ∆k ⋅ ∆x ≥ ħ (9.1.4)
genügt. Ein wohldefinierter Impuls, also geringe Impulsunschärfe, führt also gleichzeitig zu
einer endlichen Ortsunschärfe des Wellenpakets, die wir weiter unten noch näher diskutie-
ren werden. Die Ausbreitungsgeschwindigkeit des Wellenpakets ist durch die Gruppenge-
schwindigkeit
∂ω(k)
vg = (9.1.5)
∂k
gegeben. Letztere ist durch die Schwerpunktsbewegung des Wellenpakets gegeben, die wir
von der Phasengeschwindigkeit v ph = ω⇑k einer ebenen Welle unterscheiden müssen, die an-
gibt, mit welcher Geschwindigkeit sich Punkte konstanter Phase ausbreiten. Aufgrund der
Dispersion ω = c(k)k haben Wellen mit unterschiedlichen Wellenvektoren unterschiedli-
che Phasengeschwindigkeiten. Da das Wellenpaket aus einer Überlagerung vieler Wellen
mit unterschiedlichen Wellenvektoren besteht, fließt es aufgrund der Dispersion langsam
auseinander, wie es in Abb. 9.1 angedeutet ist.
Beschreiben wir die Kristallelektronen mit Bloch-Wellenpaketen, so ist ihre Geschwindig-
keit im Rahmen einer semiklassischen Beschreibung durch die Gruppengeschwindigkeit des
Wellenpakets
∂ω n (k) 1 ∂ε n (k)
vn = = (9.1.6)
∂k ħ ∂k
gegeben. Hierbei ist ε n (k) die Dispersion des Bandes, aus dem das Elektron stammt.2 Diese
Beschreibung enthält in natürlicher Weise den Fall freier Elektronen, für die ε = ħ 2 k 2 ⇑2m
und damit v = ħk⇑m = p⇑m gilt.
2
Wir werden in diesem Kapitel die Energie mit ε und nicht mit E bezeichnen, um Verwechslungen
mit dem elektrischen Feld E zu vermeiden.
9.1 Semiklassisches Modell 373
Das semiklassische Modell gibt nur eine Antwort auf die zweite Frage. Bezüglich der ersten
Frage sei darauf hingewiesen, dass die Bloch-Wellen stationäre Zustände der Schrödinger-
n (k)
Gleichung sind. Falls vn = ħ1 ∂ε∂k ≠ 0, so bedeutet dies, dass das Bloch-Elektron für alle
Zeiten diese endliche Geschwindigkeit besitzt. Dies würde in einer unendlich großen elek-
trischen Leitfähigkeit resultieren. Einen endlichen Widerstand erhalten wir nur durch Ab-
weichungen von der perfekten Periodizität des betrachten Kristalls, wie sie z. B. durch Ver-
unreinigungen, Gitterfehler oder Phononen verursacht werden. Die daraus resultierenden
Streuprozesse werden wir aber erst später diskutieren.
Wir wollen noch abschätzen, wie breit ein Wellenpaket (9.1.3) im Ortsraum ist, dessen Im-
puls genügend gut definiert ist. Wohldefinierter Impuls bedeutet ∆k ≪ 2π⇑a, wobei 2π⇑a die
Ausdehnung der 1. Brillouin-Zone und a die Gitterkonstante ist. Mit Hilfe der Unschärfere-
lation folgt für die Ortsunschärfe des Wellenpaket ∆r ≥ 1⇑∆k ≫ a⇑2π. Wir sehen also, dass
die räumliche Ausdehnung eines Bloch-Wellenpakets mit einem einigermaßen gut definier-
ten Wellenvektor k wesentlich größer als die Ausdehnung der Einheitszelle des betrachteten
Festkörpers sein muss. Dies ist in Abb. 9.2 schematisch dargestellt. Damit wir die Bewegung
des Wellenpakets zwischen zwei Stoßprozessen quasi-klassisch beschreiben können, muss
die Ausdehnung des Wellenpakets aber auch kleiner als die mittlere freie Weglänge, also
∆r ≪ ℓ sein. Dies ist eine wesentliche Voraussetzung für die in Abschnitt 9.4 verwendeten
Boltzmann-Transportgleichungen. In typischen Metallen ist ℓ ⋙ a, so dass beide Bedin-
gungen, ∆r ≫ a⇑2π und ∆r ≪ ℓ, gut erfüllt sind.
3
Nach Heisenberg wird die Zuordnung von klassischen Observablen zu ihren Entsprechungen in
der mathematischen Formulierung der Quantenmechanik, den Operatoren auf Hilbert-Räumen,
als Korrespondenz bezeichnet. Mit Hilfe des Korrespondenzprinzips können wir dann die physi-
kalisch sinnvollen Gleichungen der Quantenmechanik finden, indem wir die algebraische Form
der klassischen Gleichungen übernehmen, wobei bestimmte klassische Observable durch die ih-
nen korrespondierenden quantenmechanischen Operatoren ersetzt werden. Beispielsweise ent-
steht durch das Ersetzen der Impulsvariable durch den entsprechenden Impulsoperator (und ent-
sprechend für die Ortsvariable) aus der klassischen Energiegleichung die Schrödinger-Gleichung.
Hinweis: Die Quantenphysik erlaubt in der Regel lediglich Wahrscheinlichkeitsangaben für den
Wert der Obervablen (z. B. Ort). Sie ist daher nicht mehr bezüglich jeder Fragestellung determinis-
tisch. Berechnet man den Erwartungswert einer Observablen, der sich als Mittelwert der entspre-
chenden Messgröße bei mehrfacher Wiederholung des Experiments ergibt, so stellt sich heraus,
dass dieser den bekannten Gleichungen der Newtonschen Physik gehorcht (Ehrenfest-Theorem).
Wenden wir die Regeln der Quantenphysik auf makroskopische mechanische Systeme an, so wird
die statistische Streuung der Messergebnisse nahezu unmessbar klein. Dabei entsprechen solche
Systeme i. A. einem statistischen Ensemble aus einer großen Zahl von so genannten reinen Quan-
tenzuständen mit großen Quantenzahlen. Damit folgt der deterministische Charakter der klassi-
schen Physik für den makroskopischen Grenzfall aus der Quantenphysik, obwohl letztere selbst
nicht deterministisch ist.
374 9 Dynamik von Kristallelektronen
Wir wollen ebenfalls diskutieren, über welche Längenskalen angelegte Felder variieren dür-
fen. Dazu müssen wir uns in Erinnerung rufen, dass wir das periodische Potenzial des Gitters
bei der Beschreibung der elektronischen Zustände quantenmechanisch behandelt haben.
Dieses variiert auf der Längenskala der Gitterkonstanten, also einer Skala, die klein gegen-
über der Ausdehnung des Wellenpakets ist. Im Rahmen des semiklassischen Modells wollen
wir nun Kräfte durch externe Felder klassisch behandeln. Deshalb dürfen die externen Fel-
der nur auf Längenskalen variieren, die groß gegenüber der Ausdehnung des Wellenpakets
sind (siehe Abb. 9.2). Letzteres müssen wir fordern, da eine klassische Behandlung keinen
Sinn macht, wenn die Wellenlänge des Feldes in den Bereich der Teilchengröße kommt.
1. Bandindex:
Der Bandindex ist eine Konstante der Bewegung, d. h. das semiklassische Modell lässt
keine Band-Band-Übergänge zu.
4
Wir werden im Folgenden der Einfachheit immer von Elektronen reden, wobei dabei natürlich
immer die Wellenpakete gemeint sind, mit denen wir die Elektronen beschreiben.
9.1 Semiklassisches Modell 375
2. Bewegungsgleichungen:
Die zeitliche Entwicklung der Ortskoordinate und des Wellenvektors eines Ladungsträ-
gers wird durch folgende Bewegungsgleichungen beschrieben:
dr 1 ∂ε n (k)
= vn (k) =
dt ħ ∂k
(9.1.7)
dk
ħ = F(r, t) = q (︀E(r, t) + vn (k) × B(r, t)⌋︀ .
dt
Gleichung (9.1.7) können wir einfach ableiten, wenn wir die Änderung δε der Energie
eines Kristallelektrons unter der Wirkung einer Kraft F betrachten. Klassisch gilt:
δε = F ⋅ v δt . (9.1.8)
Andererseits gilt
∂ε n (k)
δε = ⋅ δk = ħvn (k) ⋅ δk . (9.1.9)
∂k
Damit erhalten wir ħδk = Fδt oder
dk
ħ =F. (9.1.10)
dt
3. Effektive Masse:
Aus (9.1.7) folgt weiterhin
Diese Gleichung ist äquivalent zur klassischen Bewegungsgleichung v̇ = m−1 F, falls wir
die skalare Masse m durch einen effektiven Massetensor ersetzen:
−1 1 ∂ 2 ε n (k)
[︀(m∗ ) (k)⌉︀ = . (9.1.13)
ij ħ 2 ∂k i ∂k j
Dieser Tensor repräsentiert eine dynamische Masse der Kristallelektronen. Wir sehen,
dass der effektive Massetensor durch die Krümmung der Bandstruktur ε n (k) gegeben
ist. Da der effektive Massetensor m∗i j und auch der dazu inverse Tensor (︀(m∗ )−1 ⌋︀ i j sym-
metrisch sind, kann m∗i j auf die Hauptachsen transformiert werden. Im einfachsten Fall,
in dem die drei effektiven Massen in Hauptachsenrichtung gleich sind, ist
ħ2
m∗ (k) = . (9.1.14)
d 2 ε n (k)⇑dk 2
376 9 Dynamik von Kristallelektronen
Dies ist zum Beispiel an der Ober- und Unterkante eines Bandes der Fall, für das wir
den Bandverlauf durch einen isotropen parabolischen Verlauf annähern können (siehe
Abschnitt 8.2.2 und 8.3.1):
ħ2
ε(k) = ε 0 ± (k 2 + k 2y + k z2 ) . (9.1.15)
2m∗ x
In der Nähe eines solchen kritischen Punktes ist die Benutzung einer effektiven Masse
besonders nützlich, da diese hier konstant ist. Bewegt man sich weg von diesem Punkt,
so weicht die Bandstruktur mehr oder weniger stark von der Parabelform ab und die
effektive Masse wird dadurch k-abhängig.
Als Beispiel ist in Abb. 9.3 der Verlauf zweier eindimensionaler Bänder ε n (k) mit starker
und schwacher Krümmung an der Bandunter- und Bandoberkante gezeigt. Die effektive
Masse ist dementsprechend klein bzw. groß. Am Rand der Brillouin-Zone ist die Krüm-
mung negativ, was in einer negativen effektiven Masse resultiert. Hier bewirkt das äuße-
re Feld eine Abnahme der Geschwindigkeit des Bandelektrons aufgrund einer erhöhten
Bragg-Reflexion. Wir sehen, dass wir unter Verwendung der effektiven Masse die Bewe-
gung der Bandelektronen wie diejenige von freien Teilchen beschreiben können, wobei
die Wechselwirkung mit dem periodischen Gitterpotenzial jetzt in der effektiven, k-ab-
hängigen Masse steckt.
(a) 𝜀 𝒌 (b) 𝜀 𝒌
-1.0 -0.5 0.0 0.5 1.0 -1.0 -0.5 0.0 0.5 1.0
Abb. 9.3: Schematischer Ver- k (/a) k (/a)
4. Kristallimpuls:
Der Wellenvektor k ist nur bis auf einen reziproken Gittervektor G wohldefiniert. Wir
können deshalb zwei Elektronen am gleichen Ort und im gleichen Band, deren Wel-
lenvektoren um G differieren, nicht unterscheiden. Die semiklassischen Bewegungsglei-
chungen wahren die Äquivalenz. Alle unterscheidbaren Zustände liegen deshalb inner-
halb der 1. Brillouin-Zone. Diese Tatsache folgt direkt aus der quantenmechanischen
Bloch-Theorie und wird direkt ins semiklassische Modell übernommen.
Wir haben gesehen, dass die Bewegungsgleichungen (9.1.7) für Kristallelektronen den-
jenigen von freien Elektronen entsprechen mit der Ausnahme, dass ε n (k) anstelle der
Energie ħ 2 k 2 ⇑2m freier Elektronen auftritt. Nichtsdestotrotz ist ħk nicht der Impuls der
Bloch-Elektronen sondern nur ihr Quasi-Impuls. Die zeitliche Änderung des Impulses
wird nämlich durch die gesamte auf ein Elektron wirkende Kraft bestimmt, während die
9.1 Semiklassisches Modell 377
Änderung von ħk nur aus den äußeren Kräften resultiert und nicht aus den Kräften durch
das periodische Gitterpotenzial.
5. Fermi-Statistik:
Im thermischen Gleichgewicht ist der Beitrag von Elektronen aus dem n-ten Band mit
Wellenvektoren aus dem Volumenelement d 3 k zur elektronischen Zustandsdichte gege-
ben durch
V V d3k
2 d 3 k f )︀ε n (k), T⌈︀ = 3 (︀ε (k)−µ⌋︀⇑k T . (9.1.16)
(2π) 3 4π e n B +1
der Faktor 2 resultiert aus der Spin-Entartung. Diese Regel folgt direkt aus der Quanten-
statistik und wird direkt ins semiklassische Modell übernommen.
(︀ε g (k)⌋︀2
e⋃︀E⋃︀a ≪ (9.1.17)
εF
(︀ε g (k)⌋︀2
ħω c ≪ . (9.1.18)
εF
Hierbei ist ε g (k) die Bandlücke für einen bestimmten Wellenvektor, a die Gitterkonstante,
E das elektrische Feld und ω c = meB
c
die Zyklotronfrequenz.
5
Anschaulich können wir argumentieren, dass die Geschwindigkeitsänderung δv durch Änderun-
gen δk = Fδt⇑ħ aufgrund einer von außen für die Zeit δt wirkenden Kraft F klein gegenüber der
typischen Geschwindigkeit der Elektronen, nämlich der Fermi-Geschwindigkeit v F sein muss. Da
∂2 ε ∂2 ε
∂v
δv = ∂k δk = ħ1 ∂k 2 δk und die Bandkrümmung ∂k 2 am Zonenrand am größten ist, können wir für
unsere Abschätzung Gleichung (8.2.25) für den Bandverlauf am Zonenrand verwenden. Setzt man
die entsprechenden Ausdrücke für die Kräfte durch ein elektrisches oder magnetisches Feld ein,
so lassen sich die Abschätzungen (9.1.17) und (9.1.18) herleiten. Siehe hierzu auch Anhang J in
Festkörperphysik, N. W. Ashcroft, N. D. Mermin, Oldenbourg Verlag, München (2012).
378 9 Dynamik von Kristallelektronen
Nehmen wir eine übliche elektrische Stromdichte von J q = 100 A⇑cm2 und einen spezifi-
schen Widerstand von ρ = 100 µΩcm an, erhalten wir ein elektrisches Feld in der Größen-
ordnung von E ∼ 10−2 V⇑cm. Mit einer Gitterkonstante a ∼ 10−8 cm erhalten wir e⋃︀E⋃︀a ∼
10−10 eV. Da ε F ∼ 1 eV, müsste ε g ≲ 10−5 eV sein, damit die obige Ungleichung nicht erfüllt
ist. Dies ist in der Praxis nie der Fall außer für die kleinen k-Raumbereiche, wo sich zwei
Bänder kreuzen. Falls die Bedingung (9.1.17) verletzt wird, können Elektronen durch die
Wirkung eines elektrischen Feldes Band-Band-Übergänge machen. Wir sprechen dann von
einem elektrischen Durchbruch (siehe hierzu auch Abschnitt 9.10.4).
Die Bedingung (9.1.18) ist leichter zu verletzen. Die Energie ħω c ist für Felder von etwa 1 T
im Bereich von 10−4 eV. Das heißt, für ε F ∼ 1 eV wird Bedingung (9.1.18) bereits für ε g ∼
10−2 eV verletzt. Bei einer Verletzung von (9.1.18) sprechen wir von einem magnetischen
Durchbruch. Die Elektronen können in diesem Fall nicht mehr den Trajektorien folgen, die
wir nach dem semiklassischen Modell erwarten.
ħω ≪ ε g . (9.1.19)
In diesem Fall reicht die Energie eines einzelnen Photons nicht aus, einen Band-Band-
Übergang zu erzeugen. Außerdem haben wir oben bereits die Bedingung λ ≫ a gefordert,
da sonst die Einführung von Wellenpaketen nicht mehr sinnvoll wäre.
sche Bewegung der Kristallelektronen unter der Wirkung externer Felder die Konfiguration
eines gefüllten Bandes nicht geändert wird. Das volle Band ist inert.
1 2 3
= 3 ∫ ∇k )︀ε(k) − µ⌈︀ d k . (9.2.3)
8π ħ
1 B.Z.
In (9.2.2) und (9.2.3) integrieren wir über den Gradienten der periodischen Funktion ε(k) =
ε(k + G), was null ergibt.8 Wir können daraus die wichtige Schlussfolgerung ziehen:
Der elektrische und Wärmestrom in einem gefüllten Band verschwindet. Elektrische und
Wärmeleitung ist nur durch Elektronen in teilweise gefüllten Bändern möglich.
Anmerkung: Im Drude-Modell wurde angenommen, dass jedes Gitteratom mit einer An-
zahl von Valenzelektronen zum elektrischen und Wärmetransport beiträgt. Diese Annahme
war nur deshalb erfolgreich, weil in vielen Fällen die Bänder, die von den Valenzelektronen
bevölkert werden, nur teilweise gefüllt sind.
6
Wir verwenden die Größe e für das positive Ladungsquant. Die Ladung eines Elektrons ist so-
mit q = −e.
7
Wärme ist innere Energie minus freie Energie. Die freie Energie eines Elektrons ist gleich seinem
chemischen Potenzial µ. Die durch ein Elektron transportierte Wärme ist somit ε(k) − µ.
8
Aus Symmetriegründen gilt ε(k) = ε(−k) und damit v(−k) = ħ1 ∇−k ε(−k) = ħ1 ∇−k ε(k) = −v(k).
In einem vollen Band finden wir deshalb zu jedem v(k) ein entsprechendes −v(−k), so dass das
Integral über die gesamte Brillouin-Zone verschwindet.
380 9 Dynamik von Kristallelektronen
Im Gegensatz zu einem vollen Band ist Jq jetzt nicht mehr notwendigerweise null. Die Strom-
dichte verschwindet nur im thermischen Gleichgewicht, da wir hier wiederum für jedes v(k)
ein entsprechendes −v(−k) finden können, so dass das Integral verschwindet. Sobald wir
aber durch eine externe Störung (zum Beispiel elektrisches Feld) eine Umverteilung inner-
halb des Bandes vornehmen, verschwindet die Stromdichte nicht mehr.
Bewegung im elektrischen Feld: Ist ein Band nicht vollständig gefüllt, so bewirkt das An-
legen eines elektrischen Feldes eine Änderung der Geschwindigkeitsverteilung der Elektro-
nen. Für die zeitliche Änderung des Wellenvektors gilt:
eE
k(t) = k(0) + δk(t) = k(0) − t. (9.2.5)
ħ
Das heißt, dass sich der Wellenvektor zu jeder Zeit um den gleichen Betrag ändert. Für die
Geschwindigkeit folgt daraus
eE
v(k, t) = v (k(0) − t) . (9.2.6)
ħ
Da v(k) eine periodische Funktion im k-Raum ist, ist v(k, t) eine beschränkte Funktion
in der Zeit. Wenn das elektrische Feld E ∥ G, so ist v(k, t) eine periodische Funktion. Dies
ist in Abb. 9.4 gezeigt. Wir sehen, dass in der Nähe der Zonengrenze die Geschwindigkeit
abnimmt und am Zonenrand verschwindet. Das bedeutet, dass die Beschleunigung des Elek-
trons der äußeren Kraft entgegengerichtet ist. Dieses Verhalten ist eine Konsequenz der auf
das Elektron wirkenden Gitterkräfte, die im betrachteten semiklassischen Modell nicht ex-
plizit berücksichtigt werden.
Falls wir keine Streuprozesse hätten, würde der Wellenvektor der Elektronen unter der Wir-
kung des anliegenden elektrischen Feldes kontinuierlich anwachsen. In diesem Fall kann ein
Kristallelektron zwischen zwei Stößen im k-Raum eine Strecke größer als die Dimension
9.2 Bewegung von Kristallelektronen 381
1.0
𝜀(𝒌)
0.5
0.0
-0.5
𝑣(𝒌) Abb. 9.4: Verlauf von ε(k) und v(k) als Funkti-
on von k oder äquivalent als Funktion der Zeit,
-1.0 da k(t) ∝ t. Der Verlauf in einer Dimension
-1.0 -0.5 0.0 0.5 1.0 entspricht dem Verlauf parallel zu einem rezi-
k (/a) proken Gittervektor.
Wir sehen, dass der Strombeitrag der besetzten Elektronenzustände eines Bandes äquivalent
zu dem Strom ist, den wir erhalten, wenn wir alle diese Zustände frei lassen und die zuvor
unbesetzten Zustände mit positiv geladenen Ladungsträgern füllen würden. Das bedeutet,
dass wir, wenn es vorteilhaft ist, annehmen können, dass der Stromtransport durch fiktive,
positiv geladene Teilchen erfolgt, selbst wenn in dem betrachteten Festkörper nur negativ
geladene Elektronen vorhanden sind. Wir nennen diese fiktiven, positiv geladenen Teilchen
Löcher oder Defektelektronen. Ein anschauliches Beispiel für den Nutzen des Lochkonzepts
ist ein bis auf einen freien Platz vollkommen gefülltes Band. Anstelle die Bewegung einer
sehr großen Zahl von negativ geladenen Elektronen zu beschreiben, können wir uns auf die
Beschreibung der Bewegung eines einzigen Lochs beschränken. Das Ergebnis ist dasselbe.
Wir werden das Lochkonzept ausführlich bei der Beschreibung des Ladungstransports in
Halbleitern (vergleiche Kapitel 10), die ein fast ganz gefülltes Valenzband besitzen, benutzen.
Den Ladungstransport in diesem Band können wir einfach durch die wenigen fehlenden
Elektronen in diesem Band, also durch Löcher, beschreiben.
t
besetzt bei t = t0
1.5
1.0
𝜺 𝒌𝟎
𝝁
0.5
𝟐
𝜺 𝒌 𝜺 𝒌𝟎 − 𝒄 𝒌 − 𝒌𝟎
der Kräfte durch elektrische und magnetische Felder wird durch (vergleiche (9.1.7))
9
dk
ħ = F(r, t) = −e)︀E(r, t) + v(k) × B(r, t)⌈︀ (9.2.8)
dt
beschrieben. Ob nun die Trajektorie eines Elektrons derjenigen eines freien Teilchens mit
Ladung −e ähnlich ist, hängt davon ab, ob die Beschleunigung v̇ parallel oder anti-parallel
zu k̇ ist. Ist v̇ anti-parallel zu k̇, so würde das Kristallelektron auf das äußere Feld eher wie
ein positiv geladenes, freies Teilchen reagieren. Wir werden im Folgenden zeigen, dass dies
in der Tat für Zustände in der Nähe der Oberkante eines Bandes zutrifft.
Wir betrachten ein Band mit Maximum ε(k0 ) beim Wellenvektor k0 (siehe Abb. 9.6). Das
Fermi-Niveau liegt in der Nähe des Bandmaximums. Wir betrachten die Bewegung eines
Elektrons bei ε = ε F , das aufgrund der negativen Bandkrümmung eine negative effektive
Masse hat. Um das Bandmaximum können wir das Band durch einen parabelförmigen Ver-
lauf annähern:
Hierbei ist c eine positive Konstante. Entsprechend unserer Diskussion in Abschnitt 9.1.1
bestimmt die Konstante c die effektive Masse
ħ2 ħ2
m∗ = = − <0. (9.2.10)
d 2 ε n ⇑dk 2 2c
Wir sehen, dass m∗ negativ ist, da c ja eine positive Konstante ist. Für Wellenvektoren nahe k0
gilt
1 ∂ε 2c
v(k) = = − (k − k0 ) (9.2.11)
ħ ∂k ħ
und damit
d 2c d
v(k) = − k ∝ −k̇ . (9.2.12)
dt ħ dt
Wir sehen, dass die Beschleunigung anti-parallel zu k̇, also zur wirkenden Kraft ist. Setzen
wir (9.2.12) in die Bewegungsgleichung (9.2.8) ein, so sehen wir, dass das negativ gelade-
ne Elektron in der Nähe des Bandmaximums auf äußere Felder gerade so reagiert, als ob es
384 9 Dynamik von Kristallelektronen
eine negative effektive Masse hätte. Ändern wir einfach das Vorzeichens auf beiden Seiten
von (9.2.8), so stellen wir fest, dass die Bewegungsgleichung in gleicher Weise die Bewegung
eines positiv geladenen Teilchens mit positiver effektiver Masse beschreibt. Wir können also
sagen, dass ein Elektron mit einer negativen effektiven Masse und negativen Ladung auf äu-
ßere Felder genauso reagiert wie ein entsprechendes Teilchen mit einer positiven effektiven
Masse und positiven Ladung. Da wir oben gesehen haben, dass die Reaktion eines Lochs
derjenigen eines Elektrons entspricht, wenn dieses sich in dem unbesetzten Zustand befin-
den würde, können wir folgern, dass Löcher sich in jeglicher Hinsicht wie positiv geladene
Teilchen verhalten.
Die Bedingung, dass der unbesetzte Zustand nahe am Bandmaximum liegen muss, um die
Entwicklung (9.2.9) zu rechtfertigen, kann relaxiert werden. Im Allgemeinen sprechen wir
von lochartigem Verhalten, falls m∗ < 0, und von elektronenartigem Verhalten, falls m∗ > 0.
Falls die Geometrie des unbesetzten Gebiets im k-Raum sehr kompliziert wird, verliert das
Lochkonzept allerdings seine Nützlichkeit.
1. Wellenvektor k:
In einem vollen Band verschwindet die Summe aller Wellenvektoren: ∑ k = 0. Nehmen
wir ein Elektron mit Impuls ke heraus, so haben die verbleibenden Elektronen den Impuls
∑ k − ke = −ke . Wir können also dem fehlenden Elektron, also dem Loch, den Impuls
kh = −ke (9.2.13)
zuordnen. Dies ist in Abb. 9.7a skizziert.
2. Energie ε:
Um ein Elektron aus einem besetzten Zustand im Inneren eines Bandes in einen freien
Zustand an der Fermi-Kante zu bringen, müssen wir die Energie ∆ε = ε F − ε e (k) auf-
bringen. Um ein Loch aus dem Inneren des Bandes an die Fermi-Kante zu bringen,
müssen wir dagegen den Lochzustand mit einem Elektron von der Fermi-Kante auffül-
len (siehe Abb. 9.7b). Die damit verbundene Energieänderung ist ∆ε = −ε F + ε h (k), da
bei diesem Vorgang Energie gewonnen wird. Legen wir den Energie-Nullpunkt in das
Fermi-Niveau, so erhalten wir:
ε h (k) = −ε e (k) . (9.2.14)
Wir müssen also bei Elektronen Energie aufbringen, wenn wir sie im Band nach oben
heben, während wir bei Löchern Energie gewinnen. Wir können uns diese Tatsache da-
durch veranschaulichen, dass wir Elektronen als schwere Metallkugeln und Löcher als
Luftblasen in einer Flüssigkeit betrachten. Für die Elektronen müssen wir Energie auf-
bringen, um sie in der Flüssigkeit nach oben zu heben. Für die Löcher müssen wir dage-
gen Energie aufwenden, um sie in der Flüssigkeit nach unten zu drücken.
9.2 Bewegung von Kristallelektronen 385
(a) (b)
1.2 1.2
Bandlücke Bandlücke
0.8 0.8
E𝜀
𝜀
𝜺F 𝜺F
0.4 0.4
Loch Elektron
0.0 0.0
-1.0 -0.5 0.0 0.5 1.0 -1.0 -0.5 0.0 0.5 1.0
𝒌h k (2/a) 𝒌e k (2/a)
Abb. 9.7: (a) Durch Anregung (z. B. durch Absorption eines Photons) eines Elektrons aus dem unteren
Band (rot) in das darüberliegende Band (blau) erzeugen wir im vollen Band ein Loch. Das resultierende
Loch besitzt allerdings den Impuls kh = −ke . (b) Das Anheben eines Lochs auf das Fermi-Niveau (links)
entspricht formal dem Auffüllen des Lochs mit einem Elektron von der Fermi-Kante (gestrichelter
Pfeil). Dabei wird die Energiedifferenz der beiden Elektronenzustände frei. Beim Anheben eines Lochs
wird also Energie gewonnen. Beim Anheben eines Elektrons (rechts) wird dagegen Energie verbraucht.
Der Vorgang ist formal äquivalent zum Absenken eines Lochs von der Fermi-Energie (gestrichelter
Pfeil).
3. Effektive Masse m∗ :
Da wir beim Übergang von Elektronen zu Löchern sowohl bei der Energie als auch dem 11
Wellenvektor einen Vorzeichenwechsel erhalten, folgt für die effektive Masse
1 1 ∂ 2 ε(k) 1 −∂ 2 ε(k) 1
( ) = 2 ⌊︀ }︀ = 2 ⌊︀ }︀ = − ( ∗ ) , (9.2.15)
∗
m h ħ ∂k∂k h ħ (−∂k)(−∂k) e m e
also
In der Nähe der Oberkante eines Bandes ist m∗e negativ und damit m∗h positiv.
4. Geschwindigkeit v:
Der mit dem Übergang von Elektronen zu Löchern verbundene Vorzeichenwechsel so-
wohl bei der Energie als auch dem Wellenvektor resultiert in
1 ∂ε(k) 1 −∂ε(k)
vh (k) = ⌊︀ }︀ = ⌊︀ }︀ = ve (k) . (9.2.17)
ħ ∂k h ħ −∂k e
Dieses Ergebnis ist anschaulich klar, da die Löcher bei einer gleichförmigen Bewegung
der Elektronen natürlich der Elektronenbewegung folgen müssen. Beim Stromtransport
ist allerdings zu berücksichtigen, dass sich die Elektronen in einem Band an der Band-
unterkante und die Löcher an der Bandoberkante befinden. Infolge des umgekehrten
Vorzeichens der effektiven Masse bewegen sich dann Elektronen und Löcher aufgrund
der auf sie wirkenden Kraft in entgegengesetzte Richtungen.
386 9 Dynamik von Kristallelektronen
5. Bewegungsgleichungen:
Aus den obigen Überlegungen ergibt sich für die Bewegungsgleichungen der Elektronen
und Löcher
∂ke
ħ = −e(E + ve × B) (9.2.18)
∂t
∂kh
ħ = +e(E + vh × B) . (9.2.19)
∂t
Löcher bewegen sich also wie Teilchen mit positiver Ladung.
𝒌𝒛
𝑩
𝜀 𝒌 = const
Abb. 9.8: Die Bahnkur-
ven von Kristallelektronen
im homogenen Magnet-
feld verlaufen entlang der
Schnittlinie einer Ebene 𝒌𝒚
senkrecht zum Magnetfeld
mit der Fläche konstan- Fläche ┴ 𝑩
ter Energie im k-Raum. 𝒌𝒙 Bahnkurven
Gebiets liegen Zustände niedrigerer Energie. Bei Lochbahnen wäre dies gerade umgekehrt:
∇k ε(k) ist nach innen gerichtet, die Bewegung erfolgt im Uhrzeigersinn und innerhalb des
umrundeten Gebiets liegen Zustände höherer Energie.
Wir betrachten nun die Trajektorien im realen Raum und zwar ihre Projektion auf eine Ebe-
ne senkrecht zum Magnetfeld. Es gilt (siehe Abb. 9.9)
⧹︂ (B
r⊥ = r − B ⧹︂ ⋅ r) . (9.2.22)
⧹︂ der Einheitsvektor in Feldrichtung. Bilden wir das Vektorprodukt mit B
Hierbei ist B ⧹︂ auf
beiden Seiten der Bewegungsgleichung (9.2.21), so erhalten wir11
⧹︂ × ħk̇ = (−e)B
B ⧹︂ × (ṙ × B) = (−e) )︀ṙ(B
⧹︂ ⋅ B) − B(B
⧹︂ ⋅ ṙ)⌈︀
⧹︂ B
= (−e)B )︀ṙ − B( ⧹︂ ⋅ ṙ)⌈︀ = (−e)Bṙ⊥ . (9.2.23)
(a) (b) 𝒛
𝒌𝒛 𝑩
𝑩
Projektion
der
Bahnkurve
Abb. 9.11: Die Projektion der Orts-
raum-Bahnkurven (b) von Kristall-
𝒌𝒚 𝒚
elektronen auf eine Ebene senkrecht
𝒌𝒙 zum angelegten Magnetfeld können
𝒙 aus den Trajektorien im k-Raum (a)
erhalten werden, indem man diese mit
dem Faktor eħB skaliert und um 90○
Bahnkurve
um die Feldachse dreht.
∇𝐤 𝜀
die Situation schwieriger, da die Flächen konstanter Energie im k-Raum sehr kompliziert
sein können, wie wir im Abschnitt 8.6 bei der Diskussion der Fermi-Flächen von Metallen
bereits gesehen haben. Wir klassifizieren die Bahnkurven in offene und geschlossene Bahn-
kurven. Eine offene Bahnkurve ist in Abb. 9.12a dargestellt. Sie setzt sich im periodischen
Zonenschema immer weiter fort, ohne sich jemals zu schließen. Bei einer geschlossenen
Bahn (siehe Abb. 9.12b und c) liegt eine geschlossene Energiefläche ε(k) = const vor.
Bei einer geschlossenen Bahn kann von der umschlossenen Fläche aus betrachtet die Ener-
gie ε(k) entweder nach außen (∇k ε(k) ist nach außen gerichtet) oder nach innen (∇k ε(k)
ist nach innen gerichtet) zunehmen. In Abb. 9.12b und c sind zwei Beispiele gezeigt. Zeigt B
aus der Papierebene heraus, so verläuft, wie wir oben bereits diskutiert haben, die Bahn eines
Kristallelektrons im einen Fall (∇k ε(k) ist nach außen gerichtet) entgegen dem Uhrzeiger-
sinn wie dies auch ein freies Elektron tun würde. Im anderen Fall (∇k ε(k) ist nach innen
gerichtet) verläuft die Bahn des Kristallelektrons genau entgegengesetzt im Uhrzeigersinn.
Das Kristallelektron verhält sich also wie ein positiv geladenes Teilchen, weshalb wir hier
von einer Lochbahn sprechen.
Geschlossene Bahnen treten bei den Alkalimetallen Li, Na, K und Rb auf. Wie Abb. 8.28
zeigt, sind für diese Metalle die Fermi-Flächen fast kugelförmige Gebilde, die den Rand der
1. Brillouin-Zone nicht berühren. Dadurch sind keine offenen Bahnen möglich und die ge-
offene Bahn,
geschlossen, elektronenartig
N elektronartig
111
100
geschlossen,
Cu lochartig
Abb. 9.13: Fermi-Fläche von Kupfer mit offenen und geschlossenen Bahnen. Im periodischen Zonen-
schema (rechts) ist die Fermi-Fläche durch die Hälse verbunden und ermöglicht somit offene Bahnen.
Die geschlossenen Bahnen können sowohl elektronenartig als auch lochartig sein.
9.2 Bewegung von Kristallelektronen 389
schlossenen Bahnen sind elektronenartig. Für einige Metalle wie z. B. Bi, Sb, W oder Mo
liegen sowohl elektronenartige als auch lochartige Bahnen vor. Da die Zahl der Elektronen
und Löcher in diesen Metallen nahe beieinander liegt, spricht man von kompensierten Me-
tallen. Viele Metalle wie die Edelmetalle Au, Ag und Cu sowie Mg, Zn, Cd, Sn, Pb oder Pt
haben Fermi-Flächen, die sowohl offene als auch geschlossene Bahnen erlauben. Als Bei-
spiel ist in Abb. 9.13 die Fermi-Fläche von Kupfer mit möglichen offenen und geschlossenen
Bahnen gezeigt.
9.2.4.2 Zyklotronfrequenz
Wir wollen nun die Umlaufzeit der Kristallelektronen auf einer im k-Raum geschlossenen
Bahn berechnen. Natürlich hat die Umlaufzeit im Ortsraum den gleichen Wert. Aus (9.2.21)
folgt für ein Bahnelement dk der Bahnkurve (siehe hierzu Abb. 9.14)
e e ∂ε(k)
dk = 2
)︀B × ∇k ε(k)⌈︀ dt = 2 B ( ) dt . (9.2.25)
ħ ħ ∂k ⊥
Hierbei ist (∂ε(k)⇑∂k)⊥ die Komponente von ∇k ε(k), die senkrecht auf B steht. Integrieren
wir (9.2.25) über einen Umlauf, so erhalten wir
T
ħ2 1
∮ dk = ∫ dt . (9.2.26)
eB (∂ε⇑∂k)⊥
0
Um das Integral auf der linken Seite auszuwerten, betrachten wir Abb. 9.14. Der Flächen-
inhalt zwischen den Flächen konstanter Energie ε und ε + dε ergibt sich zu
1
δS ε (kB ) = ∮ δk⊥ (k) dk = ∮ δε dk , (9.2.27)
(∂ε(kB )⇑∂k)⊥
woraus wir
δS ε (kB ) ∂S ε (kB ) 1
≃ =∮ dk (9.2.28)
δε ∂ε (∂ε(kB )⇑∂k)⊥
erhalten. Hierbei ist kB der Wellenvektor senkrecht zur Magnetfeldrichtung. Setzen wir dies
in (9.2.26) ein, so ergibt sich für die Umlaufzeit T = ∫0 dt
T
ħ 2 ∂S ε (kB )
T(ε, kB ) = . (9.2.29)
eB ∂ε
𝜹𝑺𝜺
𝒅𝒌∥
𝐤𝑩
𝜹𝒌⊥
𝑩
Abb. 9.14: Zur Berechnung der Zyklotronfre-
𝜺 𝜺 + 𝜹𝜺 quenz eines Kristallelektrons. Das Magnetfeld
zeigt aus der Papierebene heraus.
390 9 Dynamik von Kristallelektronen
Die Größe ∂S ε (kB )⇑∂ε gibt an, wie schnell die Fläche senkrecht zum Magnetfeld wächst,
wenn wir die Energie ε ändern. Die Umlauffrequenz beträgt
2π 2πeB 1
ωc = = ∂S ε (k B )
. (9.2.30)
T ħ2
∂ε
Die Größe ω c bezeichnet man als Zyklotronfrequenz der Kristallelektronen. Sie hat im All-
gemeinen für unterschiedliche Elektronen eines Energiebandes unterschiedliche Werte.
Für freie Elektronen sind die Bahnkurven Kreise und wir erhalten δS ε = 2πk B δk⊥ . Mit δε =
(k B )
ħ 2 k B δk⊥ ⇑m erhalten wir ∂S ε∂ε = 2πm
ħ2
und damit die bekannte Zyklotronfrequenz ω c = emB
für freie Elektronen (vergleiche (7.3.43)). Vergleichen wir diesen Ausdruck mit (9.2.30), so
können wir für die Kristallelektronen einen zu dem Fall freier Elektronen analogen Aus-
druck ω c = m eB
c
erhalten, indem wir die Zyklotronmasse
ħ 2 ∂S ε (k⊥ )
mc = (9.2.31)
2π ∂ε
einführen. Die Größe m c enthält die Energieabhängigkeit der von der Umlaufbahn im
k-Raum umschlossenen Fläche und ist nicht notwendigerweise gleich der effektiven
Masse m∗ . Dies ist sofort einsichtig, wenn wir bedenken, dass die Zyklotronmasse durch die
Lage einer bestimmten Bahn auf der Fermi-Fläche bestimmt wird und nicht durch einen
bestimmten elektronischen Zustand ε(k).
ħ ⧹︂
B × )︀k(t) − k(0)⌈︀ + (⧹︂ ⧹︂
E
r⊥ (t) − r⊥ (0) = − E × B)t
eB B
ħ ⧹︂
=− B × )︀k(t) − k(0)⌈︀ + ut (9.2.33)
eB
mit
E ⧹︂ ⧹︂
u= (E × B) . (9.2.34)
B
9.2 Bewegung von Kristallelektronen 391
𝒛 𝑩
𝒚
𝒙
𝒓┴
𝑬
Abb. 9.15: Semiklassische Bewegung im
𝒖 Ortsraum.
Wir sehen, dass die Bewegung im Ortsraum eine Überlagerung aus der bereits oben disku-
tierten Bewegung (k-Raum Trajektorie um 90○ gedreht und skaliert) mit einer gleichmä-
ßigen Driftgeschwindigkeit u ist, die senkrecht auf E und B steht.12 Dies ist in Abb. 9.15
veranschaulicht.
Um die Trajektorie im k-Raum zu bestimmen, benutzen wir die Tatsache,
28
dass wir für E ⊥ B
die Bewegungsgleichung (9.1.7) wie folgt schreiben können:13
dk e ∂ε e ∂̃
ε
ħ = (−e) (E + v × B) = eu × B − ×B=− ×B (9.2.35)
dt ħ ∂k ħ ∂k
mit
̃
ε(k) = ε(k) − ħk ⋅ u . (9.2.36)
Gleichung (9.2.35) ist die Bewegungsgleichung, die ein Elektron mit Energie ̃
ε(k) hätte, falls
nur ein Magnetfeld anliegen würde. Wir können deshalb folgern, dass die k-Raum Trajek-
torien durch die Schnittlinien von Ebenen senkrecht zu B mit den Flächen ̃ ε(k) = const ge-
geben sind. Wir werden unten sehen, dass in vielen Fällen ferner ̃
ε ≃ ε eine gute Näherung
ist.
∎ das anliegende Magnetfeld groß ist (typischerweise einige Tesla, wir werden aber weiter
unten noch genauer spezifizieren, was groß bedeutet)
∎ ̃
ε(k) nur wenig von ε(k) abweicht.
Die zweite Voraussetzung ist fast immer unter der Annahme der ersten gegeben. Da k ma-
ximal etwa 1⇑a (a = Gitterkonstante) werden kann, gilt nämlich
ħE ħ 2 eEa
ħk ⋅ u < = 2 . (9.2.37)
a B a m ħω c
12
Diese Driftgeschwindigkeit entspricht gerade der Geschwindigkeit eines Bezugssystems, in dem
das elektrische Feld verschwindet.
13
Wir können E = − EB (⧹︂
E × B)
⧹︂ × B = −u × B schreiben.
392 9 Dynamik von Kristallelektronen
Da eEa ∼ 10−10 eV (siehe Abschnitt 9.1.2), ħω c ∼ 10−4 eV für B ∼ 1 T und aħ2 m ∼ 10 eV,14 er-
2
halten wir ħk ⋅ u < 10−5 eV. Da ε(k) typischerweise im eV-Bereich liegt, ist in der Tat ̃
ε(k) ≃
ε(k) eine gute Näherung.
Das Verhalten in hohen Magnetfeldern hängt stark davon ab, ob alle besetzten (oder alle un-
besetzten) Zustände auf geschlossenen Bahnen liegen, oder ob ein Teil der Zustände offene
Bahnen besitzt.
Hall-Effekt: Für die Stromdichte J⊥ senkrecht zur Magnetfeldrichtung können wir ent-
sprechend den vorangegangenen Überlegungen schreiben:
In gleicher Weise erhalten wir, falls alle unbesetzten Zustände geschlossene Trajektorien be-
sitzen
Hierbei ist n e bzw. n h die Dichte der besetzten bzw. unbesetzten Zustände. Gleichung (9.2.39)
und (9.2.40) zeigen, dass im Falle geschlossener Orbits die Ablenkung durch die Lorentz-
Kraft so effektiv ist, dass sie praktisch eine Energieaufnahme der Elektronen aus dem
elektrischen Feld verhindert und die Driftbewegung u senkrecht zu E den dominierenden
Beitrag zum Strom ergibt. Wir erhalten einen Hall-Winkel tan θ H ≃ 90○ . Es sei darauf
14 ħ2
2
2ma B
= 1 Rydberg = 13.6 eV, wobei a B der Bohrsche Radius ist.
9.2 Bewegung von Kristallelektronen 393
hingewiesen, dass im Experiment üblicherweise die Richtung des Stroms durch die Pro-
bengeometrie vorgegeben ist. Betrachten wir die in Abb. 9.15 gezeigte Geometrie, wo
das angelegte elektrische Feld in x-Richtung zeigt, so würde dies zu einer (technischen)
Stromdichte J x in x-Richtung, d. h. zu einer Bewegung der Elektronen in −x-Richtung und
somit zu einer Driftbewegung u in −y-Richtung führen. Da sich die Elektronen an der
Vorderseite der Probe ansammeln, entsteht ein elektrisches Feld in −y-Richtung und damit
ein negativer Hallwiderstand ρ x y = E y ⇑J x . Für Löcher gilt das Umgekehrte.
Benutzen wir die Definition (7.3.49) für den Hall-Koeffizienten (R H = E y ⇑BJ x ) so erhalten
wir für den Hochfeld-Grenzfall:
1 1
R H,∞ = − (Elektronen) R H,∞ = + (Löcher) . (9.2.41)
ne e nh e
Dies entspricht dem Ergebnis (7.3.50), das wir für freie Elektronen erhalten haben. Wir re-
produzieren das Ergebnis für freie Elektronen also unter den Annahmen, dass (i) die Orbits
aller besetzten bzw. aller unbesetzten Zustände geschlossen sind, dass (ii) das anliegende
Magnetfeld hoch genug ist, dass die Orbits mehrmals zwischen Streuprozessen durchlaufen
werden und dass (iii) wir die unbesetzten Zustände als Löcher mit positiver Ladung betrach-
ten. Wir sehen, dass die semiklassische Theorie im Gegensatz zum Modell freier Elektronen
in natürlicher Weise das experimentell beobachtete anomale Vorzeichen des Hall-Koeffizi-
enten erklären kann.
Es sei hier noch darauf hingewiesen, dass in der Praxis oft mehrere Bänder zur Stromdichte
beitragen. In diesem Fall gilt die obige Betrachtung separat für jedes Band. Falls in einem
Band alle besetzten und im anderen alle unbesetzten Zustände geschlossene Bahnen ha-
ben, so erhalten wir im gemessenen Hall-Koeffizienten eine effektive Ladungsträgerdichte,
die sich aus der Differenz der Elektronendichte im einen und der Lochdichte im anderen
Band ergibt. Ein einfaches Beispiel ist in Abb. 9.16 gezeigt. Während die Bahnen in der
1. Brillouin-Zone alle geschlossen und lochartig sind, sind diejenigen in der 2. Brillouin-
Zone ebenfalls alle geschlossen aber elektronenartig. Der gemessene Hall-Koeffizient wird
in diesem Fall durch die Kompensationseffekte sehr klein sein. Eine genaue Diskussion folgt
in Abschnitt 9.9.2.
(a) (b)
9.3 Streuprozesse
Im vorangegangenen Abschnitt haben wir nur die Bewegung der Kristallelektronen zwi-
schen zwei Streuprozessen behandelt und nichts über die Streumechanismen selbst gesagt.
Die Streuprozesse sind allerdings von zentraler Bedeutung, da wir ohne diese keinen elek-
trischen oder thermischen Widerstand von Festkörpern erhalten würden. Wir wollen uns
deshalb in diesem Abschnitt mit den wichtigsten Streuprozessen in Festkörpern beschäfti-
gen.
Drude15 nahm ursprünglich an, dass Elektronen von den positiven Atomrümpfen gestreut
werden.16 Dies hätte allerdings eine mittlere freie Weglänge von nur wenigen Å zur Folge.
Die meisten Metalle haben aber bei Raumtemperatur mittlere freie Weglängen von einigen
100 Å. Die Ursache für diesen Widerspruch kennen wir bereits: Eine exakt periodische An-
ordnung von Atomen in einem Kristall führt zu keinen Streuprozessen. Die Bloch-Wellen,
mit denen wir Elektronen in der Ein-Elektron-Näherung beschreiben können, sind ja sta-
tionäre Lösungen der Schrödinger-Gleichung. Da ⋃︀Ψ⋃︀2 zeitunabhängig ist, beschreiben diese
Lösungen die ungestörte Ausbreitung von Elektronenwellen. Dieses Ergebnis gilt auch, wenn
wir zu Bloch-Wellenpaketen übergehen. Streuprozesse erhalten wir nur dann, wenn wir die
Ausbreitung der stationären Bloch-Wellen stören. Dies kann auf verschiedene Art und Weise
geschehen:
1. Abweichungen von der strengen Periodizität des Kristallgitters:
(a) Kristalldefekte wie z. B. Fehlstellen, Versetzungen, Verunreinigungen etc.: Diese De-
fekte sind räumlich fest und können üblicherweise als zeitunabhängig betrachtet wer-
den.
(b) Phononen: Hierbei handelt es sich um zeitabhängige Abweichungen von der strengen
Periodizität.
2. Elektron-Elektron-Streuung:
Die Wechselwirkung zwischen Elektronen haben wir in der Ein-Elektron-Näherung im-
mer vernachlässigt. Streuprozesse zwischen Elektronen können aber in der Tat die sta-
tionären Bloch-Wellen stören. Wir werden allerdings sehen, dass die Elektron-Elektron-
Streuung gegenüber den unter 1. genannten Effekten meistens vernachlässigt werden
kann.
15
Paul Karl Ludwig Drude, siehe Seite 260.
16
P. Drude, Zur Elektronentheorie der Metalle, Annalen der Physik 1, 566 (1900).
396 9 Dynamik von Kristallelektronen
wobei ℋ p das Störpotenzial beschreibt. Da Ψk (r) eine Bloch-Welle ist, können wir schreiben:
′
∐︀k′ ⋃︀ℋ p ⋃︀k̃︀ = ∫ d 3 r u ∗k′ (r)e−ık ⋅r ℋ p u k (r) e ık⋅r
′
= ∫ d 3 r u ∗k′ (r) ℋ p u k (r) e ı(k−k )⋅r . (9.3.2)
Wenn wir das Störpotenzial als Funktion der Ortskoordinaten schreiben können, so
stellt (9.3.2) ein Fourier-Integral dar, das die Streuamplituden für eine periodische Struktur
beschreibt, wobei u∗k′ ℋ p u k mit der Streudichte ρ(r, t) identifiziert werden kann (vergleiche
hierzu (2.2.21) in Abschnitt 2.2.4).
Wir haben bei der Behandlung der allgemeinen Beugungstheorie in Kapitel 2 bereits gese-
hen, dass wir zwischen einer zeitlich konstanten und einer zeitabhängigen Streudichte unter-
scheiden können. Falls ℋ p (r) zeitunabhängig ist, wie dies für statische Defekte wie Fehlstel-
len, Versetzungen oder Verunreinigungen der Fall ist, so sind nur elastische Streuprozesse
möglich (vergleiche hierzu Abschnitt 2.2.4) und es gilt
Falls andererseits ℋ p (r, t) zeitabhängig ist, wie wir dies für die Streuung an Phononen er-
warten, erhalten wir inelastische Streuprozesse. In diesem Fall lautet die Energieerhaltung
beim Streuprozess
Hierbei ist ħω(q) die Energie des Phonons, das beim Streuprozess absorbiert oder emittiert
wird.
Bei der Streuung an einem Phonon mit Wellenvektor q hat das Störpotenzial die räumli-
che Abhängigkeit e ıq⋅r . Das bedeutet, dass die Streuamplitude (9.3.1) ein Matrixelement der
Form
′
∐︀k′ ⋃︀e ıq⋅r ⋃︀k̃︀ = ∫ d 3 r u ∗k′ u k e ı(k−k +q)⋅r (9.3.5)
enthält. Da u ∗k′ u k die Periodizität des Gitters besitzt und deshalb in eine Fourier-Reihe nach
den reziproken Gittervektoren G entwickelt werden kann, ist das Matrixelement in (9.3.5)
nur dann von null verschieden, wenn
k′ − k + q = G . (9.3.6)
Dies entspricht dem Impulserhaltungssatz. Wir wissen ja, dass der Wellenvektor k einer
Bloch-Welle einer Quantenzahl entspricht. Die Größe ħk ist aber nicht wie bei freien Elek-
tronen der Impuls, sondern nur ein Kristall- oder Quasi-Impuls. Deshalb ist k nur bis auf
einen reziproken Gittervektor G definiert.
9.3.1.1 Elektron-Elektron-Streuung
Wir wollen kurz die Ein-Elektron-Näherung verlassen und die Elektron-Elektron-Streuung
diskutieren. Es kann in einer Vielteilchenbeschreibung gezeigt werden, dass auch für solche
9.3 Streuprozesse 397
Prozesse die Energie- und Impulserhaltung gelten muss. Das heißt, bei einer Streuung von
zwei Elektronen in Zustand 1 und 2 in die Zustände 3 und 4 muss gelten:
k1 + k2 = k3 + k4 + G . (9.3.8)
ε 1 + ε 2 = ε 3 + ε 4 ≥ 2ε F − 2k B T . (9.3.9)
kB T 2
Pe–e (T) = Se–e ( ) (9.3.10)
εF
abschätzen. Hierbei ist Se–e der Streuquerschnitt, den wir ohne Berücksichtigung des Pauli-
Prinzips für ein klassisches Gas abgeschirmter Punktladungen erhalten würden.
Nehmen wir an, dass Se–e in der gleichen Größenordnung ist wie der Streuquerschnitt für
die Streuung eines Elektrons an dem geladenen Kern einer Verunreinigung, so ist für ε F ≃
10 eV und k B T ≃ 10−4 eV bei T = 1 K die Elektron-Elektron-Streuung um den Faktor 10−10
geringer als die Elektron-Verunreinigung-Streuung. Die Elektron-Elektron-Streuung wird
398 9 Dynamik von Kristallelektronen
𝒌𝒚
(3)
𝒌𝟑
(2)
𝒌𝟐
𝒌F
𝒌𝟏 (1)
𝒌𝟒 (4)
also nur in sehr reinen Materialien ein Rolle spielen. Bei höheren Temperaturen wird der
Faktor (k B T⇑ε F ) zwar größer, es dominiert dann aber üblicherweise die Elektron-Phonon-
2
Streuung.
Wir wollen an dieser Stelle darauf hinweisen, dass die obige Argumentation auch zeigt, dass
wir Elektronen in Festkörpern aufgrund des Pauli-Prinzips in guter Näherung als nicht-
wechselwirkende Teilchen betrachten dürfen. Bei der Diskussion des elektrischen und ther-
mischen Transports in Festkörpern werden wir die Elektron-Elektron-Streuung vernachläs-
sigen.
9.3.2 Streuquerschnitte
Wir können verschiedene Typen von Streuzentren durch ihre Dichte n s und ihren Streu-
querschnitt S charakterisieren. Entsprechend der Optik gilt für die mittlere freie Weglänge
1⇑ℓ = n s S. Wir wollen im Folgenden eine phänomenologische Übersicht über die verschie-
denen Streuprozesse geben.
Falls in einer Probe unterschiedliche Streuprozesse vorliegen, die durch eine Dichte n si und
einen Streuquerschnitt S i der Streuzentren gekennzeichnet sind, und diese Streuprozesse
voneinander unabhängig sind, so addieren sich die mit der Dichte gewichteten Streuquer-
schnitte und wir erhalten ℓ−1 = ∑ n si S i . Die inverse mittlere freie Weglänge ist proportional
zum Widerstand, so dass wir den Gesamtwiderstand ρ als Summe der von den unabhängi-
gen Mechanismen verursachten Einzelwiderstände ρ i erhalten:
1 1 1 1
= + + +...
ℓ ℓ1 ℓ2 ℓ3 (9.3.11)
ρ = ρ1 + ρ2 + ρ3 + . . . .
Diesen Sachverhalt nennt man die Matthiessen-Regel, die bereits seit 1864 bekannt ist. In
Metallen ergibt sich der Gesamtwiderstand durch die Beiträge aus den üblicherweise domi-
nierenden Beiträgen durch die Phononenstreuung und die Streuung an Verunreinigungen.
Wir haben bereits in Abb. 7.14 gezeigt, dass der Widerstand von reinen Metallen wie Ag und
Cu durch Einbringen von Verunreinigungen einen temperaturunabhängigen Beitrag erhält.
9.3 Streuprozesse 399
Die Streuquerschnitte S i der einzelnen Streumechanismen können mit Hilfe der Streutheo-
rie in erster oder zweiter Bornscher Näherung berechnet werden.17 , 18 Liegt eine Dichte n si
von Streuern mit differentiellem Wirkungsquerschnitt σ i (θ) vor, so ist die daraus resultie-
rende mittlere freie Weglänge ℓ i durch
2π π
1
= n si S i = n si ∫ ∫ (1 − cos θ) σ i (θ) sin θ dθ dφ (9.3.12)
ℓi
0 0
gegeben. Um den totalen Streuquerschnitt zu erhalten, haben wir den differentiellen Wir-
kungsquerschnitt über den gesamten Raumwinkel aufintegriert und dabei mit dem Wich-
tungsfaktor (1 − cos θ) berücksichtigt, dass Streuprozesse in Vorwärtsrichtung (θ = 0○ )
nicht und solche in Rückwärtsrichtung (θ = 180○ ) maximal zur Impulsrelaxation beitragen.
Wir wollen noch darauf hinweisen, dass sowohl die Streuquerschnitte als auch die Dichten
der Streuzentren von der Temperatur und der Energie abhängen können. Im Folgenden
werden einzelne Streumechanismen näher diskutiert.
mit k V2 = 2mV0 ⇑ħ 2 . Der Streuquerschnitt ist also proportional zu der von den Elektronen ge-
sehenen Querschnittsfläche πr 02 und zum Quadrat des Verhältnisses von Potenzialhöhe und
Fermi-Energie. Die Streuung an ungeladenen Fremdatomen liefert einen temperaturunab-
hängigen Beitrag zum spezifischen Widerstand. Dieser Beitrag ist verantwortlich für den so
genannten Restwiderstand, der bei sehr tiefen Temperaturen (wenn die Streuung an Phono-
nen vernachlässigbar klein wird, siehe unten) „übrig“ bleibt. Er ist auch verantwortlich für
den fast temperaturunabhängigen Widerstand von Legierungen.
wobei Z die Valenzdifferenz ist. Den totalen Streuquerschnitt erhalten wir durch Winkelin-
tegration zu
2 π
2mZe 2 1
S ≃ 2π ( ) ∫ 2 (1 − cos θ) sin θ dθ . (9.3.15)
0 )︀k s ⇑k F + 4 sin (θ⇑2)⌈︀
4πє 0 ħ 2 k F2 2 2 2
Ohne auf den exakten Wert des Integrals einzugehen sehen wir sofort, dass das geladene
2mZ e 2
Fremdatom offensichtlich ein Hindernis mit Radius r 0 ≃ 4πє 2 2 darstellt.
0 ħ kF
23
Es sei hier noch
angemerkt, dass gemäß (9.3.15) der Beitrag der geladenen Streuer und damit der Widerstand
aufgrund dieser Streuer unabhängig von der Temperatur und proportional zum Quadrat der
Valenzdifferenz ist. Dieser Sachverhalt wird als Lindesche Regel bezeichnet.
22
Dem erhaltenen Ergebnis sollte nicht zu viel Bedeutung beigemessen werden, da die Bornsche
Näherung für Elektronen bei der Fermi-Energie, die an einem tiefen Coulomb-Potenzial gestreut
werden, nicht sehr gut ist. Ein besseres Ergebnis liefert die Verwendung von Partialwellen und der
Friedelschen Summenregel, auf die wir hier nicht eingehen.
23
Diesen Zusammenhang können wir uns anhand eines nicht abgeschirmten Coulomb-Potenzials
leicht klar machen. Der Streuquerschnitt ist hier in einfachster Näherung eine kreisförmige Schei-
be, deren Radius r 0 diejenige Entfernung vom geladenen Streuzentrum ist, bei der die Coulomb-
Energie Ze 2 ⇑4πє 0 r gerade gleich der kinetischen Energie 12 mv F2 = ħ 2 k F2 ⇑2m der Ladungsträger ist.
Daraus ergibt sich sofort der Zusammenhang r 0 = 2mZe 2 ⇑4πє 0 ħ 2 k F2 . Man beachte, dass bei Halb-
leitern im Gegensatz zu Metallen nicht die Fermi-Geschwindigkeit, sondern die thermische Ge-
schwindigkeit verwendet werden muss (vergleiche hierzu Abschnitt 10.1.4).
9.3 Streuprozesse 401
µ ∝ T 3⇑2 m∗
1⇑2
. (9.3.16)
Die Beweglichkeit nimmt also mit sinkender Temperatur ab. Die T 3⇑2 -Abhängigkeit der Be-
weglichkeit dominiert bei tiefen Temperaturen, da hier die Streuung an Phononen klein ist
und die Streuung an den geladenen Donatoren bzw. Akzeptoren mit abnehmender Tempera-
tur aufgrund der abnehmenden Geschwindigkeit der Ladungsträger und des zunehmenden
Streuquerschnitts zunimmt (vergl. Abschnitt 10.1.4).
Hierbei ist 𝒟(ε F ) = D(ε F )⇑V die elektronische Zustandsdichte pro Energie und Volumen.
Wir sehen also, dass ein Elektron aufgrund einer Gitterschwingung ein fluktuierendes Po-
tenzial δε = 23 ε F ∆ sieht.
Wir müssen jetzt noch überlegen, wie groß die lokale, fluktuierende Dehnung ∆(r) ist. Bei
hohen Temperaturen (T ≫ Θ D ) weit oberhalb der Debye-Temperatur Θ D können wir den
quadratischen Mittelwert u 2 der Auslenkung der Atome aus ihrer Ruhelage unter Benutzung
402 9 Dynamik von Kristallelektronen
der mit dem Faktor (1 − cos θ) gewichtete gesamte Streuquerschnitt eines einzelnen Gitter-
atoms ist.
Um den spezifischen Widerstand von Metallen aufgrund von Elektron-Phonon-Streuung
abzuschätzen, können wir den einfachen Zusammenhang ρ = mv F ⇑ne 2 ℓ benutzen. Mit der
mittleren freien Weglänge (9.3.20) erhalten wir
mv F T
ρ ph ≃ ∝ (T ≫ Θ D ) . (9.3.22)
2
ne ℓ MΘ2D
Der Widerstand steigt also für hohe Temperaturen proportional zu T an. Dieses Ergebnis
hatten wir bereits mit einer stark vereinfachten Betrachtung für das freie Elektronengas ab-
geleitet (vergleiche hierzu (7.3.19)). Die Abhängigkeit von der Ionenmasse und der Debye-
Temperatur stimmt im Allgemeinen gut mit dem Experiment überein.
24
Man ordnet jedem Oszillator eine mittlere Energie zu, die über die Oszillatormasse M und die Fe-
derkonstante mit einer typischen Oszillationsamplitude verknüpft ist. Das Quadrat dieser Ampli-
tude entspricht der temperaturbedingten räumlichen Verschmierung des jeweiligen Gitterplatzes
und somit einem endlichen Streuquerschnitt. Bei hohen Temperaturen kann man annehmen, dass
jede Mode besetzt ist, während bei tiefen Temperaturen die Besetzung entsprechend der Bose-
Einstein Statistik berücksichtigt werden muss. Die Energie⌈︂ eines mechanischen Oszillators mit
Federkonstante k ist 12 kx 2 = 12 Mω 2 x 2 , wobei wir ω = k⇑M benutzt haben. Setzen wir für das
Auslenkungsquadrat den quadratischen Mittelwert der lokalen, thermisch fluktuierenden Auslen-
kung u(t) ein und setzen die Schwingungsenergie gleich 12 k B T, so erhalten wir den Zusammen-
hang Mω 2q u 2 = k B T.
9.3 Streuprozesse 403
𝒒 𝒌′ q
𝒌′𝐅
𝝅Τ 𝜽 𝝅Τ 𝝅Τ
𝒌′ 𝜽 𝒌 𝒂 𝒌 𝒂 𝜽/𝟐 𝒒 𝒂
𝜽/𝟐
𝒌𝒙 𝒌𝒙 𝒌𝒙
𝒌𝐅
Abb. 9.19: Schematische Darstellung der Normal-Prozesse bei der Elektron-Phonon-Streuung für ein
freies Elektronengas: (a) hohe Temperaturen und (b) tiefe Temperaturen. Die getönte Fläche entspricht
der thermischen Aufweichung der Fermi-Kugel. Neben der Fermi-Kugel ist auch die Brillouin-Zone
eines kubisch primitiven Gitters eingezeichnet. In (c) ist der geometrische Zusammenhang zwischen
Streuwinkel θ und den Wellenvektoren des Phonons und des Elektrons gezeigt.
Bei tiefen Temperaturen ist die Situation komplizierter, da hier die Besetzung der Schwin-
gungsmoden entsprechend der Bose-Einstein Statistik
1
n(ω q ) = (9.3.23)
exp ( k B Tq ) − 1
ħω
41
berücksichtigt werden muss. Durch die Bose-Einstein-Statistik fällt die Streuwahrschein-
lichkeit schnell ab, wenn ein Phonon mit Energie ħω q > k B T absorbiert oder emittiert wer-
den muss. Dies führt zu einer starken Einschränkung des maximalen Streuwinkels mit ab-
nehmender Temperatur, wie dies in Abb. 9.19 gezeigt ist. Bei hohen Temperaturen ist die
Streuung von Elektronen um hohe Winkel möglich. Da hier große effektive Impulsände-
rungen parallel zur Stromrichtung erhalten werden können, ist dieser Streuprozess in bezug
auf den elektrischen Widerstand sehr effektiv. Bei tiefen Temperaturen sind dagegen auf-
grund des kleinen Phononenimpulses nur kleine Streuwinkel möglich, wodurch sich der
elektrische Widerstand reduziert.
Um eine einfache Abschätzung des maximalen Streuwinkels zu machen, gehen wir von ei-
nem Debye-Modell (Zustandsdichte der Phononen ist proportional zu ω 2q ) aus und berück-
sichtigen nur Normalprozesse auf einer Fermi-Kugel. Dies führt, wie in Abb. 9.19c gezeigt
ist, insgesamt dazu, dass Streuprozesse mit großen Streuwinkeln θ praktisch ausgeschlossen
werden. Aus Abb. 9.19c folgt für den maximalen Streuwinkel sin θ2 = q max ⇑2k F . Setzen wir
≃ ΘTD
q
für den maximalen Wellenvektor des Phonons bei der Temperatur T den Wert qmax D
ein, so erhalten wir
θ qD T
sin < . (9.3.24)
2 2k F Θ D
Hierbei ist q D der zur Debye-Frequenz ω D gehörende Wellenvektor. Wir sehen also, dass wir
zu tiefen Temperaturen hin in der Tat ein starkes Abschneiden des Integranden in (9.3.21)
für die Winkelvariable θ erhalten. Schließen wir Streuprozesse aus, für die ħω q > k B T gilt,
so schränken wir den Streuwinkel auf den durch (9.3.24) gegebenen Wert ein.
Um die mittlere freie Weglänge mit Hilfe von (9.3.20) und (9.3.21) zu berechnen, nehmen
wir zur Vereinfachung an, dass die Winkelabhängigkeit von σA (θ) klein ist, so dass wir
σA (θ) ≃ σA benutzen können und diese Größe vor das Integral ziehen können. Ersetzen
404 9 Dynamik von Kristallelektronen
wir ferner (1 − cos θ) sin θdθ durch 8 sin3 θ2 d(sin θ2 )25 , sin θ2 durch
qD T
2k F Θ D
und führen die
Abkürzung x = ħω q ⇑k B T = ΘTD q D ein, so erhalten wir
q
Θ D ⇑T
1 ħ 2 q 2D k B T T 4 4x 4
≈ n A σA ( ) ∫ dx . (9.3.25)
ℓ Mk B2 Θ2D Θ D (ex − 1)
0
Bei hohen Temperaturen ist Θ D ⇑T klein, so dass der Nenner im Integral durch x approxi-
miert werden kann. Das Integral ergibt dann (Θ D ⇑T)4 und wir erhalten das bereits oben
abgeleitete Ergebnis (9.3.20). Für tiefe Temperaturen wird das Integral konstant und wir er-
halten das Bloch-Grüneisen-Gesetz 26 , 27 , 28
T 5
ρ ph ∝ ( ) (T ≪ Θ D ) . (9.3.26)
ΘD
Das T 5 Verhalten bei tiefen und die lineare T-Abhängigkeit bei hohen Temperaturen stim-
men für viele Metalle gut mit dem experimentell beobachteten Verhalten überein (verglei-
che hierzu Abb. 7.14). Vor allem der T 5 -Verlauf stellt allerdings nur eine grobe Näherung
dar, da die gemachten Annahmen (Phononen-Spektrum entspricht Debye-Spektrum, der
Streuquerschnitt ist unabhängig vom Streuwinkel, Umklapp-Prozesse werden vernachläs-
sigt) auch grob sind. Die Problematik der Vernachlässigung der Umklapp-Prozesse ist in
Abb. 9.20 gezeigt. Der minimale Wert von q für einen Umklapp-Prozess ist offenbar durch
den Minimalabstand zwischen der Fermi-Fläche in der einen Zone und ihrer Wiederho-
lung in der benachbarten Zone gegeben. Wenn die Fermi-Fläche sich zur Zonengrenze hin
ausbaucht, verringert sich der Minimalwert von q. Umklapp-Prozesse können dann bis zu
relativ tiefen Temperaturen nicht vernachlässigt werden. Eine einfache Formel zur Berück-
sichtigung der Beiträge der Umklapp-Prozesse zum elektrischen Widerstand gibt es leider
nicht.29 Es sind hier vielmehr aufwändige numerische Rechnungen notwendig.
Wir wollen auch noch darauf hinweisen, dass wir bei der obigen Diskussion rein elastische
Streuprozesse angenommen haben, was natürlich nicht richtig ist. Bei einer genaueren Ana-
lyse unter Berücksichtigung von Phonon-Erzeugungs- und Vernichtungsprozessen erhalten
wir aber fast das gleiche Ergebnis. Wir müssen lediglich das Integral in (9.3.25) durch
Θ D ⇑T
4x 5
∫ dx (9.3.27)
(ex − 1)(1 − e−x )
0
𝒒
𝒌
𝒌′
𝑮 𝒒𝐦𝐢𝐧
Abb. 9.20: Zur Veranschaulichung des minima-
𝜺 𝒌 = 𝜺𝐅 len Wellenvektors für Umklapp-Prozesse bei der
Elektron-Phonon-Streuung.
9.4 Boltzmann-Transportgleichung
Wir haben gesehen, dass Elektronen, die sich in einem Festkörper unter der Wirkung von
äußeren Kräften bewegen, durch Abweichungen von der strengen Periodizität des Kristall-
gitters gestreut werden und dadurch ihre Bewegung eingeschränkt wird. Transportprozesse
in Festkörpern wie der Ladungs- oder Wärmetransport beinhalten immer zwei gegenläu-
fige Prozesse: Die treibenden Kräfte durch äußere Felder verursachen eine Beschleunigung
der Ladungsträger, während die Streuprozesse zu einer Energie- und Impulsrelaxation füh-
ren. Im stationären Zustand stellt sich dann ein Gleichgewicht ein. Das Wechselspiel zwi-
schen antreibenden Kräften und relaxierenden Streuprozessen beschreiben wir durch die
Boltzmann-Transportgleichung. Diese gibt an, wie sich die Besetzungswahrscheinlichkeit
der Elektronenzustände in einem Festkörper unter der Wirkung von äußeren Kräften und
Streuprozessen ändert.
Die Boltzmann-Transportgleichung wurde bereits in Abschnitt 6.4.2 und 7.3.1.3 benutzt, um
die Wärmeleitfähigkeit von Isolatoren und die elektrische Leitfähigkeit eines freien Elektro-
nengases zu diskutieren. Die nachfolgende Diskussion vertieft und erweitert diese Betrach-
tung. Ein wesentlicher Unterschied zur im Zusammenhang mit dem freien Elektronengas
geführten Diskussion wird sein, dass wir jetzt nicht mehr die Geschwindigkeit v = ħk⇑m
n (k)
von freien Elektronen verwenden werden, sondern die Geschwindigkeit vn (k) = ħ1 d εdk
von Kristallelektronen, die wir direkt aus der quantenmechanisch berechneten Bandstruk-
tur erhalten. Die im Folgenden geführte Diskussion erweitert die bereits in Abschnitt 7.3 für
406 9 Dynamik von Kristallelektronen
freie Elektronen gemachte Betrachtung. Die in 7.3 für freie Elektronen erhaltenen Beziehun-
gen sind als Spezialfälle in den hier abgeleiteten allgemeinen Ausdrücken für die Transport-
koeffizienten enthalten. Wir werden die nachfolgende Betrachtung für Ladungsträger mit
der Ladung q führen. Für Elektronen gilt q = −e.
∎ treibende externe Kräfte verursacht durch externe elektrische und magnetische Felder
oder Temperaturgradienten,
∎ Diffusion aufgrund von Schwankungen der räumlichen Elektronendichte,
∎ Relaxation durch Streuprozesse.
(a)
48
9.4 Boltzmann-Transportgleichung 407
t - dt Streuung t
wobei µ das chemische Potenzial ist. Für einen homogenen Festkörper ist f 0 unabhängig vom
Ort. Unter der Wirkung von äußeren Kräften und durch Streuprozesse geht diese Gleichge-
wichtsverteilung in eine Nichtgleichgewichtsverteilung über: f 0 → f (r, k, t). Um diese Ver-
teilungsfunktion zu bestimmen, vernachlässigen wir zunächst Streuprozesse und betrachten
die Verteilung f von Ladungsträgern in einem Testvolumen zur Zeit t − dt und zur Zeit t
(siehe Abb. 9.22). Da sich im Zeitintervall dt die Ladungsträger um dr = v(k)dt bewegen
und sich ihr Impuls um ħdk = Fdt ändert, gilt:
Zeit t: r k
Zeit t − dt: r − v(k) dt k− F
ħ
dt
Hierbei ist F die äußere Kraft, die z. B. durch elektrische (E) und magnetische Felder (B)
verursacht werden kann:30
F = q (E + v × B) . (9.4.2)
In Abwesenheit von Stößen muss jeder Ladungsträger, der sich zur Zeit t − dt am Ort
r − vdt befindet und den Impuls k − F⇑ħ dt besitzt, zur Zeit t am Ort r ankommen und den
Impuls k besitzen.31 Wir erhalten somit
Berücksichtigen wir jetzt zusätzlich Streuprozesse, so muss ein Streuterm hinzugefügt wer-
den und wir erhalten
∂f
f (r, k, t) = f (r − vdt, k − F⇑ħ dt, t − dt) + ( ) dt . (9.4.4)
∂t Streu
d f (r,k,t)
Da (︀ f (r, k, t) − f (r − vdt, k − F⇑ħ dt, t − dt)⌋︀⇑dt gerade der zeitlichen Ableitung dt
entspricht, erhalten wir
∂ f (r,k,t)
wobei wir nur Terme 1. Ordnung berücksichtigt haben. Durch Auflösen nach ∂t erhal-
ten wir mit dk
dt
= Fħ = − ħ1 ∇r ε k 32 und dr
dt
= v eine Differentialgleichung 1. Ordnung, die man
als Boltzmann-Gleichung bezeichnet:
∂ f (r, k, t) 1 ∂ f (r, k, t)
+ v(k) ⋅ ∇r f (r, k, t) − ∇r ε(r, k, t) ⋅ ∇ k f (r, k, t) = ( ) .
∂t ħ ∂t Streu
(9.4.6)
∂f
Hierbei repräsentiert ∂t die lokale, direkte Zeitabhängigkeit der Nichtgleichgewichtsvertei-
lungsfunktion. Der Term v ⋅ ∇r f resultiert aus räumlichen Gradienten der Verteilungsfunk-
tion. Er wird als Diffusionsterm bezeichnet, weil er Transporteffekte aufgrund räumlicher
Variationen der Verteilungsfunktion beschreibt. Der Term − ħ1 ∇r ε(k) ⋅ ∇ k f wird Feldterm
genannt. Er ist der Teilchenbeschleunigung proportional und über ihn gehen die auf das
Teilchen wirkenden Kräfte unmittelbar ein. Werden die Kräfte z. B. durch elektrische (E)
und magnetische Felder (B) verursacht, so gilt F = −∇r ε(k) = q (E + v × B).
Im stationären Zustand ändert sich die Konzentration der Ladungsträger im betrachteten
Testvolumen nicht (∂ f ⇑∂t = 0). Aus der Boltzmann-Gleichung folgt sofort, dass sich die
Driftterme und die Streuterme hier die Waage halten müssen. Wir können dann vereinfacht
schreiben:
∂f ∂f ∂f ∂f
=( ) +( ) +( ) =0. (9.4.7)
∂t ∂t Diff ∂t Kraft ∂t Streu
Werden die äußeren Kräfte z. B. nur durch ein elektrisches Feld verursacht (B = 0) und hängt
außerdem f nicht von r ab (homogene Probe, keine Gradienten der Temperatur und des
chemischen Potenzials), vereinfacht sich Gleichung (9.4.6) zu
∂f q ∂f
( ) = − E ⋅ ∇k f = −qE ⋅ v(k) ( ) , (9.4.8)
∂t Streu ħ ∂ε
wobei
−1
ε0 − µ0
f 0 = ]︀exp ( ) + 1{︀ (9.4.10)
k B T0
die thermische Gleichgewichtsverteilung ist. Da ε 0 , µ 0 und T0 und somit auch f 0 räumlich
und zeitlich konstant sind, gilt
∂ f ∂δ f
∇r f = ∇r δ f =
∂t ∂t (9.4.11)
∂ f ∂ε ∂ f
∇r ε = ∇r δε ∇k f = = ħv .
∂ε ∂k ∂ε
Setzen wir dies in die Boltzmann-Gleichung (9.4.6) ein, erhalten wir die linearisierte Boltz-
mann-Gleichung
∂δ f (r, k, t) ∂f ∂δ f (r, k, t)
+ v(k) ⋅ ∇r δ f (r, k, t) − ∇r δε(r, k, t) ⋅ v = ( ) .
∂t ∂ε ∂t Streu
(9.4.12)
9.4.3 Relaxationszeit-Ansatz
Für die Vereinfachung des Streuterms setzen wir die Relaxationszeit-Näherung
an, wobei in räumlich inhomogenen Systemen τ(k) durch τ(r, k) ersetzt werden muss. Das
heißt, wir führen eine mittlere Relaxationszeit τ ein, um die komplizierten Streuprozesse
einfach zu beschreiben.
410 9 Dynamik von Kristallelektronen
Relaxationszeit-Ansatz:
Die physikalische Bedeutung der Relaxationszeit wird klar, wenn wir betrachten, was in
einem räumlich homogenen System (∇r f = 0) nach dem Abschalten der äußeren Kraft
zum Zeitpunkt t = 0 passiert. Aus (9.4.6) folgt dann für t ≥ 0
∂g(k) g(k)
=−
∂t τ(k) (9.4.14)
g(k, t) = g(k, 0)e−t⇑τ(k) .
D. h., g relaxiert nach Abschalten der Störung mit der Zeitkonstante τ auf null. Wichtig
ist hierbei, dass in einfachster Näherung eine konstante Relaxationszeit, die nicht von der
Energie abhängt, angenommen wird.
Im allgemeinen Fall können die Energie ε, Temperatur T und das chemische Potenzial µ
räumlich variieren. Die Relaxation nach Abschalten einer Störung erfolgt dann gegen die
lokale Gleichgewichtsverteilung
−1
(ε + δε) − (µ + δµ)
f 0loc = ⌊︀exp ( ) + 1}︀ . (9.4.15)
k B (T + δT)
Das heißt, die Größe g(r, k, t) gibt die Abweichung der tatsächlichen Nichtgleichgewichts-
verteilungsfunktion f (k, r, t) von der lokalen Gleichgewichtsverteilung f 0loc (r, k, t) an:
Die Größe
sowie durch lokale Änderungen der Temperatur δT(r, t) und des chemischen Potenzials
δµ(r, t) an.
Mit δ f = f − f 0 und δ f loc = f 0loc − f 0 können wir g = f − f 0loc = δ f − δ f 0loc schreiben. Sind
die Abweichungen der lokalen Verteilungsfunktion f 0loc von f 0 klein, können wir eine
Taylor-Entwicklung durchführen und erhalten
∂ f0 ∂ f0 ∂ f0
δ f loc = δε + δµ + δT . (9.4.19)
∂ε ∂µ ∂T
34
Es gilt ∇r δε = q(∇r ϕ + ∂A⇑∂t) = −qE mit der eichinvarianten Form der elektrischen Feldstärke
E = −∇r ϕ − ∂A⇑∂t.
9.4 Boltzmann-Transportgleichung 411
Mit ∂T0 = (− ∂ε0 ) T0 0 und ∂ µ0 = (− ∂ε0 ) ergibt sich unter Benutzung von ξ(k) = ε(k) − µ 0
∂f ∂f ε(k)−µ ∂f ∂f
∂ f0 ξ
δ f loc = ⌊︀δε − δµ − δT}︀
∂ε T
(9.4.20)
1 ξ
=− ⌊︀δε − δT − δµ}︀
4k B T cosh2 ξ
2k B T0
T0
und damit
Setzen wir dies zusammen mit dem Relaxationszeitansatz in die linearisierte Boltzmann-
Gleichung (9.4.12) ein, erhalten wir
∂(g + δ f loc ) ∂ f0 g
+ v ⋅ ∇r (g + δ f loc ) − ∇r δε ⋅ v = − . (9.4.22)
∂t ∂ε τ
∂g ∂ { [︀δε − δµ −
∂ f0 ξ
δT⌉︀}
+ + v ⋅ ∇r g
∂ε T0
∂t ∂t (9.4.23)
∂ f0 ξ ∂ f0 g
+ v ⋅ ∇r { ⌊︀δε − δµ − δT}︀(︀ − ∇r δε ⋅ v = − .
∂ε T0 ∂ε τ
35
Die mit δ f loc zusammenhängende lokale Änderung der Teilchendichte ist gegeben durch
1 1 ∂ f0 ε − µ0
δn(r, t) = D(ε)δ f loc (r, t)dε = ∫ D(ε) ]︀δε − δµ − δT{︀ dε .
V∫ V ∂ε T0
Da wir in guter Näherung − ∂∂εf 0 durch eine δ-Funktion δ(ε − µ 0 ) approximieren können, erhalten
wir mit δε = qϕ
D(µ 0 )
δn(r, t) = (︀δµ(r, t) − qϕ(r, t)⌋︀ .
V
412 9 Dynamik von Kristallelektronen
∂ 1 ∂ f0 ∂ δn ξ
]︀ + + v ⋅ ∇r {︀ g − ⌊︀ + δT}︀
∂t τ ∂ε ∂t D(µ)⇑V T0
(9.4.24)
∂ f0 δn ξ
+ v ⋅ ⌊︀qE − ∇r − ∇r δT}︀ = 0 .
∂ε D(µ)⇑V T0
Multiplizieren wir diese Gleichung auf beiden Seiten mit τ und vernachlässigen höhere Ord-
nungen (in τ ∂t∂ und τv ⋅ ∇r ), erhalten wir die Transportgleichung
∂ f0 δn(r, t) ξ
g(r, k, t) = − τ(k)v(k) ⋅ ⌊︀qE(r, t) − ∇r − ∇r δT(r, t)}︀ . (9.4.25)
∂ε D(µ)⇑V T0
Diese Transportgleichung werden wir in Abschnitt 9.5 für die Berechnung der elektrischen
und thermischen Leitfähigkeit sowie für ihre thermoelektrische Kopplung verwenden.
∂ f0
g(k) = − τ(k)v(k) ⋅ qE . (9.4.26)
∂ε
Schreiben wir (9.4.26) als g(k) = f (k) − f 0 (k) = − ∂ε0 τ(k)v(k) ⋅ qE = −∇k f 0 ⋅ ħ , so se-
∂f qEτ(k)
hen wir, dass f (k) = f 0 (k) + g(k) als Entwicklung von f 0 (k) aufgefasst werden kann und
wir können schreiben36
q
f (k) = f 0 (k − δk) = f 0 (k − τ(k)E) . (9.4.27)
ħ
Dies entspricht einer Fermi-Verteilungsfunktion, die um den Betrag qEτ⇑ħ gegenüber der
Gleichgewichtsverteilungsfunktion im k-Raum verschoben ist (siehe hierzu Abb. 9.23).
Es ist wichtig, sich klar zu machen, was mit der verschobenen Fermi-Kugel in Abb. 9.23 nach
Abschalten der äußeren Kraft passiert. Offensichtlich erfolgt eine Relaxation in den Gleich-
gewichtszustand. Hierzu sind aber inelastische Streuprozesse notwendig. Falls nur elastische
Streuprozesse vorliegen würden, würde sich die Fermi-Kugel, wie in Abb. 9.24 gezeigt ist,
aufblähen.
(a) 𝒌𝒚 (b) 𝒌𝒚
A
B A
C
B
𝒌𝒙 𝒌𝒙
𝜹𝒌𝒙 𝜹𝒌𝒙
Abb. 9.24: Streuprozesse von Ladungsträgern im k-Raum. Die gestrichelte Linie stellt die Fermi-Fläche
im Gleichgewichtszustand für verschwindendes elektrisches Feld (E = 0) dar. Bei Abschalten des elek-
trischen Feldes relaxiert die Fermi-Fläche in den Gleichgewichtszustand zurück und zwar durch Streu-
prozesse von besetzten in unbesetzte Zustände. (a) Da die Zustände A und B unterschiedliche Energien
(unterschiedliche Abstände von k = 0 haben), sind dazu inelastische Streuprozesse notwendig. (b) Für
rein elastische Streuung würde die Fermi-Fläche aufgeweitet.
∂ f0 ξ(k)
g(k) = − τ(k)v(k) ⋅ ⌊︀qE − ∇T}︀
∂ε T
∂ f0
=− τ(k)v(k) ⋅ 𝒜 (9.5.1)
∂ε
Hierbei haben wir das Volumenintegral im k-Raum (d 3 k) in Integrale über Schalen kon-
stanter Energie (dS ε dε) überführt, wobei die Beziehung d 3 k = dS ε dk⊥ = dSε ∇dkεε = dS ε ħv(k)
dε
benutzt wurde.
Aufgrund der geringen Temperaturverschmierung der Fermi-Verteilung (k B T ≪ ε F ) lässt
sich (− ∂ε0 ) näherungsweise durch eine δ-Funktion δ(ε − ε F ) ersetzen und es verbleibt nur
∂f
1 q τ(k)v(k) ⊗ v(k)
Jq = 3 ∫ dS F ⋅𝒜. (9.5.3)
4π ħ v(k)
ε=ε F
9.5 Thermoelektrische und thermomagnetische Effekte 415
Hierbei ist v(k) ⊗ v(k) das dyadische Produkt der beiden Vektoren, stellt also eine 3×3-Ma-
trix dar. Setzen wir den Ausdruck für 𝒜 ein, so erhalten wir die elektrische Stromdichte
1 q2 τ(k)v(k) ⊗ v(k)
Jq = 3 ∫ dS F ⋅E
4π ħ v(k)
Wir sehen, dass die elektrische Stromdichte sowohl durch das elektrische Feld als auch den
Temperaturgradienten getrieben wird. Insbesondere erzeugt der Temperaturgradient ∇T,
wenn er alleine wirkt, einen elektrischen Strom. Wir bezeichnen dies als thermoelektrischen
Effekt.
Wir sehen also, dass auch die Wärmestromdichte sowohl durch ein elektrisches Feld als auch
einen Temperaturgradienten getrieben wird.
Gleichung (9.5.4) und (9.5.6) zeigen, dass wir folgende allgemeinen Transportgleichungen
aufstellen können:37
Den Gradienten des elektrochemischen Potenzials und den Temperaturgradienten auf der
rechten Seite können wir als verallgemeinerte Kräfte auffassen, die resultierenden Ströme
37
Einen Gradienten des chemischen Potenzials µ können wir in das elektrische Feld E integrieren,
indem wir E = −∇µ q ⇑q = −∇ϕ q benutzen, wobei das elektrochemische Potenzial µ q = µ + ϕ durch
die Summe aus chemischem Potenzial µ und elektrostatischem Potenzial ϕ gegeben ist.
416 9 Dynamik von Kristallelektronen
sind die Response-Größen. Die Koeffizienten der Matrix L i j stellen somit lineare Antwort-
koeffizienten dar, die wir als allgemeine Transportkoeffizienten bezeichnen. Wie von Onsa-
ger38 gezeigt wurde, erfüllen diese Koeffizienten die Reziprozitätsbeziehungen39
die aus der Zeitumkehrsymmetrie der zugrunde liegenden mikroskopischen Prozesse fol-
gen, wobei Hext das externe Magnetfeld ist.40 Wir werden gleich sehen, dass sie mit der
elektrischen Leitfähigkeit σ, der Wärmeleitfähigkeit κ, der Thermokraft S und dem Peltier-
Koeffizienten Π verknüpft sind.
Aus historischen Gründen werden üblicherweise nicht die allgemeinen Transportkoeffizi-
enten L i j verwendet, sondern die besser vertrauten Größen ρ = σ −1 , κ, S und Π, die über
folgende Beziehungen definiert wurden:
E = ρ Jq + S ∇T . (9.5.10)
Jh = Π Jq − κ ∇T . (9.5.11)
Dies liegt darin begründet, dass in Experimenten meist ein Temperaturgradient und/oder
ein elektrischer Strom vorgegeben werden und das resultierende elektrische Feld und der
resultierende Wärmestrom gemessen werden. Schreiben wir (9.5.10) und (9.5.11) analog zu
den Beziehungen (9.5.7) und (9.5.8) um, so erhalten wir:
J σ σTS −∇ϕ q
( q) = ( )( ). (9.5.12)
Jh σ T S Tσ(κ⇑σ + T S 2 ) −∇T⇑T
definiert als
L 11 = ℒ(0) (9.5.14)
1
L 21 = L 12 = ℒ(1) (9.5.15)
q
1 (2)
L 22 = ℒ . (9.5.16)
q2
38
Lars Onsager, norwegischer Physikochemiker und theoretischer Physiker: geboren am 27. No-
vember 1903 in Oslo, gestorben am 5. Oktober 1976 in Coral Gables (Florida). Er wurde 1968 mit
dem Nobelpreis für Chemie ausgezeichnet.
39
Lars Onsager, Reciprocal relations in irreversible processes I, Phys. Rev. 37, 405 (1931); Reciprocal
relations in irreversible processes II, Phys. Rev. 38, 2265 (1931).
40
Hierbei wurde angenommen, dass die zugehörige Zustandsvariable gerade unter Zeitumkehr ist.
Sonst müsste auf der linken Seite von (9.5.9) ein Minuszeichen eingeführt werden.
9.5 Thermoelektrische und thermomagnetische Effekte 417
Wir können den obigen Ausdruck für ℒ(α) vereinfachen, indem wir die tensorielle Größe
1 q2 τ(k)v(k) ⊗ v(k)
⧹︂
σ(ε) = ∫ dS ε (9.5.17)
4π 3 ħ v(k)
ε(k)=const
Um das Integral auszurechnen, benutzen wir die Tatsache, dass (− ∂ε0 ) vernachlässigbar ist
∂f
außer in einem Bereich der Breite k B T um µ ≃ ε F . Zur Auswertung können wir dann die
Sommerfeld-Entwicklung benutzen (siehe Anhang C). Da die Integranden von ℒ(1) und
ℒ(2) Faktoren beinhalten, die für ε = µ verschwinden, müssen wir bei der Auswertung der
Integrale nur den ersten Entwicklungsterm in der Sommerfeld-Entwicklung berücksichti-
gen.42 Wir erhalten damit für die Transportkoeffizienten:
L 11 = ⧹︂
σ(ε F ) (9.5.19)
π (k B T) ′
2 2
L 21 = L 12 = ⧹︂
σ (ε F ) (9.5.20)
3 e
π 2 (k B T)2
L 22 = ⧹︂
σ(ε F ) . (9.5.21)
3 q2
Hierbei ist
∂⧹︂
σ(ε)
σ′ =
⧹︂ ⋁︀ . (9.5.22)
∂ε ε=ε F
Jq = L 11 E = ⧹︂
σE. (9.5.23)
Vergleichen wir diesen Ausdruck mit (9.5.4), so erhalten wir bei ∇T = 0 für den Leitfähig-
keitstensor ⧹︂
σ:
1 q2 τ(k)v(k) ⊗ v(k)
⧹︂
σ = ⧹︂
σ(ε F ) = ∫ dS ε . (9.5.24)
4π 3 ħ v(k)
ε=ε F
41
σ(ε F ) ist.
Man beachte, dass die elektrische Leitfähigkeit eines Metalls gerade ⧹︂
2
42 ∂ f0 2 π 2 ∂ K(ε) kB T 4
Es gilt: ∫ K(ε)(− ∂ε )dε = K(µ 0 ) + (k B T) 6 ( ∂ε 2 )ε=µ + O( µ ) .
418 9 Dynamik von Kristallelektronen
1 q2 1 1 q2 1
σ= ∫ τ(ε )v
F F dS ε = ∫ ℓ dS ε , (9.5.25)
4π 3 ħ 3 4π 3 ħ 3
ε=ε F ε=ε F
wobei die mittlere freie Weglänge ℓ = τ(ε F )v F eingeführt wurde. Wir können aus diesem
Ergebnis sofort das Resultat (7.3.17) für freie Elektronen (q = −e) gewinnen. Benutzen wir
v F = ħk F ⇑m, ∫ε=ε F dS ε = 4πk F2 und n = k F3 ⇑3π 2 , so erhalten wir aus (9.5.25) den bekannten
2 2
Ausdruck σ = nem τ = ne mv F
ℓ
.
Wir können das Ergebnis für freie Elektronen (q = −e) auch durch folgende Argumentation
plausibel machen: Es ist bemerkenswert, dass (9.4.27) in der Form
geschrieben werden kann, d. h. als hätte ein Elektron im Zustand k den Energiebe-
trag δε(k) = eτv(k) ⋅ E gewonnen. Klassisch hätte ein Elektron das genau dann getan,
wenn es sich für die mittlere Zeit τ mit der Geschwindigkeit v(k) im Feld E bewegt hätte.
Auf diesem Sachverhalt basiert die kinetische Methode zur Behandlung von Transport-
eigenschaften. Die zwischen zwei Streuprozessen zusätzlich gewonnene Energie ist einer
mittleren Driftgeschwindigkeit δv in Richtung des Feldes äquivalent und es gilt
∂ε
δε = ⋅ δv (9.5.27)
∂v
mit
ħk eEτ
δv = =− (9.5.28)
m m
für ein klassisches Teilchen mit Masse m und Ladung q = −e. Wenn n Teilchen pro Einheits-
volumen vorhanden sind, erhalten wir die Stromdichte
eτ
Jq = n(−e)δv = ne E (9.5.29)
m
und damit
ne 2 τ
σ= . (9.5.30)
m
43
Der Ausdruck für die Leitfähigkeit zeigt anschaulich, was in Metallen geschieht, wenn die Fläche
bei der Integration durch Zonengrenzen reduziert wird. Er zeigt auch, wie Gittereffekte, die die ef-
fektive Geschwindigkeit der Elektronen auf der Fermi-Fläche verringern, sich auf die Leitfähigkeit
auswirken.
9.5 Thermoelektrische und thermomagnetische Effekte 419
Für ein Gas freier Elektronen haben wir oben bereits gezeigt, dass (9.5.30) dasselbe aussagt
wie (9.5.25). Allerdings treten in Metallen, in denen die Integration in (9.5.25) durch Zonen-
grenzen reduziert wird oder in denen Gittereffekte die effektive Geschwindigkeit der Elek-
tronen auf der Fermi-Fläche verringern (z.B in Wismut) Abweichungen auf. Für Halbleiter
eignet sich dagegen die kinetische Formel (9.5.30) gut. Gewöhnlich schreibt man hier
σ = n ⋃︀q⋃︀ µ (9.5.31)
mit der Beweglichkeit
⋃︀q⋃︀ τ
µ= (9.5.32)
m
der Ladungsträger.
9.5.1.3 Wärmeleitfähigkeit
Wir wollen nun aus den Gleichungen (9.5.7) und (9.5.8) sowie (9.5.19) bis (9.5.21) die Wär-
meleitfähigkeit κ bestimmen. Hierzu müssen wir berücksichtigen, dass die Wärmeleitfä-
higkeit die Proportionalitätskonstante zwischen Wärmestrom und Temperaturgradient ist
unter der Randbedingung, dass kein elektrischer Strom fließt. Setzen wir Jq = 0, so erhalten
wir aus (9.5.7)
E = −(L 11 )−1 L 12 (−∇T⇑T) . (9.5.33)
Setzen wir dies in (9.5.8) ein, so ergibt sich
κ (−∇T) = )︀L 22 − L 21 (L 11 )−1 L 12 ⌈︀ (−∇T⇑T) .
Jh = ⧹︂ (9.5.34)
σ ′ ∼ ⧹︂
Aus (9.5.19) bis (9.5.21) und der Tatsache, dass ⧹︂ σ⇑ε F ,44 folgt, dass in Metallen der erste
Term in der eckigen Klammer den zweiten um einen Faktor der Größenordnung (ε F ⇑k B T)2
übersteigt. Wir können diesen Korrekturterm für Metalle deshalb vernachlässigen und er-
halten den Tensor der Wärmeleitfähigkeit zu
L 22 π 2 k B2 T π 2 k B2 T
⧹︂
κ= = 2
⧹︂
σ(ε F ) = ⧹︂
σ. (9.5.35)
T 3 q 3 q2
Das heißt, wir erhalten das gleiche Ergebnis, das wir bei einer Vernachlässigung des ther-
moelektrischen Feldes erwartet hätten.45 Gleichung (9.5.35) gibt uns auch einen Zusam-
menhang zwischen elektrischer und thermischer Leitfähigkeit an, der nichts anderes als das
Wiedemann-Franz-Gesetz ist (vergleiche (7.3.26) in Abschnitt 7.3.2). Dieser Zusammen-
hang lässt sich leicht verstehen. Bei der elektrischen Leitung transportiert jeder Ladungsträ-
ger seine Ladung q und wird von der Kraft qE beeinflusst. Der Strom pro elektrisches Feld
44
Schreiben wir formal ⧹︂σ = nq⧹︂
µ und nehmen an, dass die Beweglichkeit ⧹︂ µ keine oder nur eine ge-
σ ′ = q⧹︂
ringe Energieabhängigkeit besitzt, so erhalten wir ⧹︂ µ ( ∂n )
∂ε ε=ε F
µ𝒟(ε F ). Mit der Zustands-
= q⧹︂
σ ′ ≃ ⧹︂
dichte eines freien Elektronengases, 𝒟(ε F ) = D(ε F )⇑V = 32 εn , erhalten wir ⧹︂
F
σ⇑ε F .
45
In Halbleitern ist die Fermi-Energie wesentlich niedriger und der Korrekturterm kann deshalb
nicht mehr vernachlässigt werden.
420 9 Dynamik von Kristallelektronen
E = ⧹︂
S ∇T = (L 11 )−1 L 12 (∇T⇑T) . (9.5.36)
⧹︂ (L 11 )−1 L 12 π 2 k B2 T −1 ′
S= = ⧹︂
σ ⧹︂
σ . (9.5.37)
T 3 q
Wir beschränken die nachfolgende Diskussion auf kubische Metalle, für welche die Tensoren
L i j diagonal sind. Wir erhalten dann
π 2 k B2 T ∂ ln σ(ε)
S= ⌊︀ }︀ . (9.5.38)
3 q ∂ε ε=ε F
Um diesen Ausdruck zu interpretieren, wollen wir ihn mit dem für freie Elektronen erhal-
tenen Ergebnis vergleichen. Zunächst sehen wir, dass der Ausdruck für die Thermokraft
wesentlich komplizierter ist als das für freie Elektronen (q = −e) erhaltene Ergebnis S =
2 k B2 T 1
− π6 e εF
. Falls τ(ε) unabhängig von der Energie angenommen werden kann, erhalten wir
k2 T
für freie Elektronen σ ′ ⇑σ = 3⇑2ε F und damit S = − 2e
2
π B 46
εF
. Dieses Ergebnis ist um den Fak-
tor 3 größer als unsere grobe Abschätzung in Abschnitt 7.3.3. Der Unterschied wird durch
die groben Näherungen bei der thermischen Mittelung von Energien und Geschwindigkei-
ten verursacht, die wir dort verwendet haben. Nehmen wir an, dass τ = τ(ε) und damit die
Beweglichkeit µ = µ(ε), so erhalten wir für eine Leitfähigkeit σ = n(ε)e µ(ε):47
π 2 k B2 T D(ε) ∂ ln ⧹︂
µ(ε)
S=− ⌊︀ + }︀ . (9.5.39)
3 e nV ∂ε ε=ε F
Den ersten Summanden können wir leicht interpretieren. Wie wir in Abschnitt 7.2 gese-
hen haben, beträgt für ein freies Elektronengas die Wärmekapazität pro Elektron gerade
46
Falls τ energieunabhängig ist, ist die Beweglichkeit µ ebenfalls unabhängig von der Energie. Mit
′
σ = ne µ erhalten wir σσ = )︀ ∂ ln∂εσ(ε) ⌈︀ε=ε = n1 ∂n ⋂︀
∂ε ε=ε
= n1 D(εV F ) . Mit der Zustandsdichte D(εV F ) = 32 εnF
F F
σ′ 3
erhalten wir also σ
= 2ε F
.
47 σ′ ∂ ln µ
Wir verwenden σ
= 1
ne µ
(eµ ∂n
∂ε
+ ne ∂∂εµ ) = 1 ∂n
n ∂ε
+ 1 ∂µ
µ ∂ε
= D(ε)
nV
+ ∂ε
.
9.5 Thermoelektrische und thermomagnetische Effekte 421
F)
2
c̃ V = nV
CV
= cnV = π3 k B2 T D(ε
nV
. Somit entspricht der erste Term gerade c̃ V ⇑(−e), also gera-
de dem Verhältnis der von einem Elektron transportierten Wärmemenge zu der von ihm
transportierten Ladung. Wir können also, falls wir den zweiten Term vernachlässigen kön-
nen, das Produkt S ⋅ T gerade mit diesem Verhältnis identifizieren. Wir werden weiter unten
sehen, dass dieses Produkt gerade dem Peltier-Koeffizienten entspricht. Die Ableitung der
Beweglichkeit tritt in (9.5.39) deshalb auf, weil wir die Art und Weise, wie der Elektronen-
strom bezüglich der Energie verteilt ist, berücksichtigen müssen. Wenn µ(ε) mit zuneh-
mendem ε größer wird, wird ein hoher Stromanteil von energiereicheren Elektronen trans-
portiert. Diese verursachen aber wiederum einen größeren Wärmestrom. Diese einfache
Diskussion ist natürlich für viele Metalle nicht verwendbar, da die vereinfachende Annahme
σ(ε) = n(ε)e µ(ε) nicht gerechtfertigt ist, sondern wir die Leitfähigkeit durch eine Integra-
tion über die mehr oder weniger komplexe Fermi-Fläche gewinnen müssen. Wir müssen
dabei im Einzelnen die Energieabhängigkeit der verschiedenen Faktoren analysieren, um
die Thermokraft zu erhalten. Darauf wollen wir hier nicht eingehen.
Wir wollen uns schließlich noch mit dem Vorzeichen der Thermokraft beschäftigen. Wir
haben bereits in Abschnitt 7.3.3 darauf hingewiesen, dass für die Thermokraft von Metallen
ein sowohl positives als auch negatives Vorzeichen beobachtet wird, was im Rahmen des
Modells freier Elektronen nicht erklärt werden konnte. Wir schreiben den Ausdruck für ⧹︂σ′
zunächst um, indem wir (9.5.17) differenzieren:
σ(ε) τ ′ (ε)
∂⧹︂ 1
= σ(ε) + 3 q 2 τ(ε) ∫ d 3 k δ ′ )︀ε − ε(k)⌈︀ v(k) ⊗ v(k) .
⧹︂ (9.5.40)
∂ε τ(ε) 4π
σ(ε) τ ′ (ε)
∂⧹︂ q 2 τ(ε) −1
= ⧹︂
σ(ε) + 3
3
⧹︂ ∗ (k)) .
∫ d k δ)︀ε − ε(k)⌈︀ (m (9.5.41)
∂ε τ(ε) 4π
Seebeck-Effekt: Zur Messung der Thermokraft wird üblicherweise die in Abb. 9.25 gezeig-
te Anordnung verwendet. Man bildet einen geschlossenen Stromkreis aus zwei Metallen A
und B mit zwei Kontaktstellen, die sich auf unterschiedlicher Temperatur T1 und T2 befin-
den. Dazwischen befindet sich bei beliebiger Temperatur ein Spannungsmessgerät. Die von
diesem Messgerät gemessene Potenzialdifferenz ist durch das Integral des elektrischen Feldes
422 9 Dynamik von Kristallelektronen
𝚷𝐀 − 𝚷𝐁 𝑱𝒒
𝚷𝑩 𝑱𝒒
A 2 B 𝑱𝒒
𝚷𝑨 𝑱𝒒 𝑱𝒒
A 1 B
Abb. 9.25: Geometri-
sche Anordnung zur Mes- 𝚷𝑩 𝑱𝒒
sung des Seebeck-Effekts. 𝚷𝑩 − 𝚷𝑨 𝑱𝒒
Wir erhalten also eine elektrische Spannung, die eine Funktion der Temperaturdifferenz der 69
beiden Kontaktstellen und der Differenz S A − S B der absoluten Thermokräfte der beiden
Metalle ist. Man bezeichnet dieses Phänomen als Seebeck-Effekt.
Die in Abb. 9.25 gezeigte Anordnung bezeichnet man als ein Thermoelement. Hält man zum
Beispiel die Kontaktstelle 2 bei einer bekannten Temperatur T2 , so kann man durch Messung
der Seebeck-Spannung die unbekannte Temperatur T1 bestimmen. In der Praxis verwen-
det man natürlich Materialkombinationen mit einer möglichst großen Differenz der absolu-
ten Thermokraft, um bei vorgegebener Temperaturdifferenz eine möglichst große Seebeck-
Spannung zu erhalten. In Tabelle 9.1 sind die Eigenschaften einiger genormter Thermopaare
zusammengestellt.
9.5.1.5 Peltier-Effekt
Als weiteren thermoelektrischen Effekt, der mit dem Transportkoeffizienten L 21 verbunden
ist, wollen wir den Peltier-Effekt diskutieren. Wir nehmen an, dass längs der in Abb. 9.26 ge-
9.5 Thermoelektrische und thermomagnetische Effekte 423
(PA – PB) Jq
PB Jq
A 2 B
PA Jq Jq Jq
A 1 B
Abb. 9.26: Geometrische Anord-
PB Jq nung zur Messung des Peltier-
(PB – PA) Jq Effekts.
zeigten Anordnung kein Temperaturgradient vorhanden ist. Nach (9.5.7) gilt dann Jq = L 11 E
bzw. E = (L 11 )−1 Jq und damit nach (9.5.8)
⧹︂ Jq .
Jh = L 21 (L 11 )−1 Jq = Π (9.5.43)
Die Größe Π⧹︂ = L 21 (L 11 )−1 bezeichnen wir als Peltier-Koeffizient. Wir sehen, dass ein iso-
thermer elektrischer Strom Jq mit einem thermischen Strom Jh verbunden ist.
Wir lassen jetzt mit Hilfe einer Batterie einen elektrischen Strom Jq durch den in Abb. 9.26
gezeigten Stromkreis fließen. Im Zweig A entsteht ein Wärmestrom Π A Jq , im Zweig B ein
davon verschiedener Strom Π B Jq . An den Kontaktstellen muss das Wärmegleichgewicht
wieder hergestellt werden. An der einen Kontaktstelle wird deshalb der Wärmestrom
(Π A − Π B )Jq generiert und an der anderen Kontaktstelle absorbiert. Das heißt, eine Kon-
taktstelle erwärmt sich und die andere wird abgekühlt. Diesen Effekt bezeichnet man als
Peltier-Effekt. Er wird zur Realisierung von Kühlelementen eingesetzt, deren Wirkungsgrad
allerdings für eine breite Anwendung noch zu schlecht ist. Die technische Anwendung zur
Kühlung ist letztendlich durch die phononische Wärmeleitung begrenzt. Sie bewirkt ins-
besondere bei großen Temperaturdifferenzen einen entgegengerichteten Wärmestrom, der
ab ∆T ∼ 100 K den durch den Stromfluss hervorgerufenen Wärmestrom aufhebt. Aus dem
gleichen Grund haben thermoelektrische Generatoren nur einen geringen Wirkungsgrad
von 3–8%.
Nach (9.5.20) gilt L 21 = L 12 und damit
⧹︂ = L 21 (L 11 )−1 = L 12 (L 11 )−1 = T S .
Π (9.5.44)
⧹︂ ist mit der Thermokraft S⧹︂ verknüpft. Dies ist eine der
Das heißt, der Peltier-Koeffizient Π
Kelvinschen Beziehungen der Thermoelektrizität.48
9.5.1.6 Thomson-Effekt
Ein weiterer thermoelektrischer Effekt ist der Thomson-Effekt.49 Er manifestiert sich als Tem-
peraturänderung beim Durchleiten eines elektrischen Stromes durch einen Draht, dessen
48
Diese Beziehung stellt einen Spezialfall der Onsager-Relationen der Thermodynamik irreversibler
Prozesse dar. Die Gleichungen (9.5.7) und (9.5.8) müssen, wenn sie durch Jq und Jh ⇑T ausgedrückt
werden, eine symmetrische Matrix geben. Deshalb gilt L 21 = L 12 .
49
Benannt nach William Thomson, 1. Baron Kelvin, der meist als Lord Kelvin bezeichnet wird. Wil-
liam Thomson war ein irischer Physiker. Er wurde am 26. Juni 1824 in Belfast, Nordirland geboren
und starb am 17. Dezember 1907 in Netherhall bei Largs, Schottland.
424 9 Dynamik von Kristallelektronen
Teile verschieden warm sind. Es fließt hier also sowohl ein elektrischer Strom aufgrund einer
elektrischen Potenzialdifferenz (E ≠ 0) als auch ein Wärmestrom aufgrund eines Tempera-
turgradienten (∇T ≠ 0). In Kupfer erzeugt ein im Sinn der fallenden Temperatur fließender
elektrischer Strom Wärme, ein umgekehrter Kälte. Eisen verhält sich entgegengesetzt.
Eine elektrische Stromdichte J q in einem homogenen Leiter verursacht eine Wärmeleistung
pro Volumeneinheit von
p h = ρ J q2 − µJ q ∇T , (9.5.45)
d S⧹︂
⧹︂
µ=T (9.5.46)
dT
9.5.1.7 Phononen-Mitführung
Wir haben in den vorangegangenen Abschnitten nur die mit den Ladungsträgern verbun-
denen Transporteigenschaften diskutiert. Der Wärmetransport in Festkörpern erfolgt aber
parallel auch durch verschiedene andere Anregungen (z.B. Phononen, Magnonen), die mit
dem Ladungsträgersystem wechselwirken. Wir diskutieren hier kurz die Wechselwirkung
des Ladungsträgersystems mit dem Phononensystem. Wir betrachten hierzu einen Festkör-
per, z. B. einen Draht, durch den wir einen elektrischen Strom Jq schicken. Wir haben gese-
hen, dass wir aufgrund des endlichen elektrischen Feldes E im Festkörper eine Verschiebung
des Fermi-Körpers um den Betrag δk = ħ E im k-Raum bekommen. Da das Elektronensys-
qτ
ben:
ph
cV T
Jh ∝ c V Tδv =
ph ph
Jq . (9.5.47)
ne
50
Wir benutzen für den Thomson-Koeffizienten das übliche Symbol µ, obwohl dies leicht zu Ver-
wechslungen mit der Beweglichkeit führen kann.
9.5 Thermoelektrische und thermomagnetische Effekte 425
∇ϕ q × B ∇T × B
Jh = L 21 (−∇ϕ q ) + L 22 (−∇T⇑T) + L 23 (− ) + L 24 (− ) (9.5.50)
B BT
Die allgemeinen Transportkoeffizienten L i j werden allerdings in der Praxis nicht verwendet.
Analog zum Fall B = 0, wo wir durch Benutzen der gebräuchlicheren Größen ρ = σ −1 , κ, S
und Π die allgemeinen Transportgleichungen (9.5.7) und (9.5.8) in E = ρ Jq + S ∇T und Jh =
Π Jq − κ ∇T umgeschrieben haben, können wir dies auch für den Fall B ≠ 0 tun. Wir müssen
hier auf der rechten Seite dieser Gleichungen zusätzliche Terme einfügen, die proportional
zu (B × Jq ) bzw. (B × ∇T) sind. Wir erhalten somit
51
Wir haben bereits darauf hingewiesen (vergleiche Abb. 9.20), dass bei manchen Metallen Um-
klapp-Prozesse auch noch bis zu tiefen Temperaturen von Bedeutung sind. Das Vorzeichen von S ph
hängt in der Tat davon ab, ob der Phonon-Drag durch Umklapp- oder Normalprozesse dominiert
wird.
426 9 Dynamik von Kristallelektronen
• allgemeine Transportgleichungen (B ≠ 0)
𝑩𝒛 −𝝏𝑻/𝝏𝒙, 𝑬𝒙 𝒛
𝒚
+ + + + +𝑭 + + + + + 𝒙
+ + + + + + + + + +
𝒗 𝑱𝒒,𝒙
Abb. 9.27: Probengeometrie zur Mes- 𝑭𝐋
sung thermomagnetischer Effekte. 𝑱𝒉,𝒙
In y-Richtung kann kein elektrischer - - - - - - - - - -
und kein Wärmestrom stattfinden. - - - - - - - - - -
Auf die explizite Herleitung des Zusammenhangs zwischen den allgemeinen Transportko-
effizienten L i j und den in (9.5.51) und (9.5.52) Hall-Koeffizient
verwendeten Größen wollenNernst-Koeffizient
wir hier ver-
zichten, da dies mit elementarer linearer Algebra leicht gemacht werden kann. Mit den vier
weiteren Termen sind vier so genannte thermomagnetische Effekte verbunden, die wir im
Folgenden kurz diskutieren wollen. Bei der Diskussion nehmen wir an, dass das Magnet-
Ettingshausen-Koeffizient P/k Righi-Leduc-Koeffizient L/k
feld in z-Richtung zeigt und ein elektrischer oder Wärmestrom nur in x-Richtung fließen
kann (siehe Abb. 9.27). Wir betrachten ferner der Einfachheit halber ein isotropes System, so
dass wir die tensoriellen Transportkoeffizienten durch Skalare ersetzen können. Die dadurch 70
erhaltenen Ergebnisse können wir dann nur zur Beschreibung der Transporteigenschaften
von Alkali-Metallen, deren Fermi-Flächen fast isotrop sind, oder von polykristallinen Pro-
ben, bei denen wir über alle Raumrichtungen mitteln, anwenden. Wir werden uns ferner auf
kleine Magnetfelder (ω c τ ≪ 1) beschränken.
9.5.2.1 Hall-Effekt
Der zweite Term in (9.5.51) entspricht dem Hall-Effekt, den wir bereits in Abschnitt 7.3.4
für freie Elektronen diskutiert haben. Den gewöhnlichen Hall-Effekt erhalten wir unter der
Randbedingung, dass der transversale Temperaturgradient ∂T⇑∂y verschwindet. Wir erhal-
ten dann
E y = R H BJ q,x , (9.5.53)
was Gleichung (7.3.49) entspricht. Wir können aber auch den so genannten adiabatischen
Hall-Effekt definieren, den wir unter der Randbedingung J h, y = 0 erhalten. Aus (9.5.51) und
(9.5.52) ergibt sich
SP
E y = (R H + ) B J q,x . (9.5.54)
κ
9.5.2.2 Ettingshausen-Effekt
Wir nehmen an, dass ein elektrischer Strom in x-Richtung fließt und entlang der Probe kein
Temperaturgradient anliegt, d. h. J q,x ≠ 0 und ∂T⇑∂x = 0. Falls in y-Richtung weder ein Wär-
mestrom noch ein elektrischer Strom fließen kann, J h, y = 0 und J q, y = 0, erhalten wir einen
Temperaturgradienten in y-Richtung:
∂T P
= B J q,x . (9.5.55)
∂y κ
9.5 Thermoelektrische und thermomagnetische Effekte 427
Dieses Phänomen wird als Ettingshausen-Effekt 52 und die Größe P⇑κ als Ettingshausen-
Koeffizient bezeichnet. In Metallen wie Cu, Ag oder Au ist P⇑κ ∼ 10−16 K⋅m
T⋅A
und deshalb
schwer zu messen. Für Wismut ist P⇑κ = 7.5 × 10−4 K⋅m
T⋅A
besonders hoch, da dieses Metall
eine kleine Wärmeleitfähigkeit besitzt.
9.5.2.3 Righi-Leduc-Effekt
Wir nehmen jetzt an, dass kein elektrischer Strom in x-Richtung fließt, aber ein endlicher
Temperaturgradient entlang der Probe existiert, d. h. J q,x = 0 und ∂T⇑∂x ≠ 0. Mit den Rand-
bedingungen J q,x = 0 sowie J h, y = 0 und J q, y = 0 erhalten wir
∂T L ∂T
= B . (9.5.56)
∂y κ ∂x
Dieses Phänomen wird als Righi-Leduc-Effekt 53 und die Größe L⇑κ als Righi-Leduc-Koeffi-
zient bezeichnet. Für Metalle wie Cu, Ag oder Au ist L⇑κ ∼ −2 × 10−3 m
2
Vs
. Der Righi-Leduc
Effekt entspricht einem thermischen Hall-Effekt. Die Ladungsträger, die sich aufgrund des
Temperaturgradienten ∂T⇑∂x ≠ 0 entlang der Probe in x-Richtung bewegen, werden durch
das Magnetfeld in y-Richtung abgelenkt und führen zu einem transversalen Temperaturgra-
dienten.
9.5.2.4 Nernst-Effekt
Wir gehen wiederum von der Situation aus, dass kein elektrischer Strom in x-Richtung
fließt, aber ein endlicher Temperaturgradient entlang der Probe existiert, d. h. J q,x = 0
und ∂T⇑∂x ≠ 0. Wegen der Ablenkung der sich aufgrund des Temperaturgradienten in
x-Richtung bewegenden Ladungsträger erhalten wir ein elektrisches Querfeld. Unter den
Randbedingungen J q,x = 0 und J q, y = 0 sowie ∂T⇑∂y = 0 erhalten wir das Querfeld zu
∂T
Ey = N B . (9.5.57)
∂x
Dieses Phänomen ist unter dem Namen Nernst-Effekt 54 bekannt und die Größe N bezeich-
nen wir als Nernst-Koeffizienten. Äquivalent zum adiabatischen Hall-Effekt erhalten wir den
adiabatischen Nernst-Effekt, wenn wir die Bedingung ∂T⇑∂y = 0 durch J h, y = 0 ersetzen:
SL ∂T
E y = (N + ) B . (9.5.58)
κ ∂x
Äquivalent zu den Koeffizienten, die die thermoelektrischen Effekte beschreiben, sind auch
bei den thermomagnetischen Effekten nur drei der vier Koeffizienten voneinander unabhän-
gig.55 Es gilt P = N T.
52
Benannt nach dem österreichischen Physiker Albert von Ettingshausen (1850 – 1932).
53
Benannt nach dem italienischen Physiker Augusto Righi (1850–1920) und dem französichen Phy-
siker Sylvestre Anatole Leduc (1856-1937).
54
Benannt nach dem deutschen Chemiker Walther Hermann Nernst (1864–1941).
55
Dies folgt wiederum aus den Onsager-Relationen der Thermodynamik irreversibler Prozesse. Die
Transportkoeffizienten müssen eine symmetrische Matrix bilden, so dass wir nur drei unabhängige
Koeffizienten haben.
428 9 Dynamik von Kristallelektronen
9.6 Spin-Transport
In unserer bisherigen Diskussion der Transporteigenschaften haben wir unberücksichtigt
gelassen, dass Ladungsträger in Festkörpern außer einer Ladung q und einer Wärmemen-
ge h auch einen Drehimpuls (Spin) s transportieren (siehe Abb. 9.28). Diese Vernachlässi-
gung ist zwar gerechtfertigt, wenn sich gleich viele Ladungsträger mit entgegengesetztem
Spin in die gleiche Richtung bewegen und so effektiv kein Spin-Transport stattfindet. In
einigen Fällen, z.B. in ferromagnetischen Metallen, ist dies aber nicht der Fall und es tritt
zusammen mit dem Ladungs- und Wärmetransport auch ein Spin-Transport auf. Wir müs-
sen dann das durch (9.5.10)–(9.5.12) gegebene thermoelektrische Kopplungschema um den
Spin-Freiheitsgrad erweitern und erhalten eine thermo-spin-elektrische Kopplung. Da der
Zusammenhang zwischen den drei Stromdichten und den drei Potenzialgradienten dann
durch eine (3 × 3)-Matrix gegeben ist, erhöht sich die Zahl der Transportkoeffizienten von
4 auf 9, wobei aufgrund der Onsager-Relationen nur 6 unabhängig sind. Bei Anlegen eines
äußeren Magnetfeldes verdoppeln sich die Zahlen nochmals, so dass die Zusammenhänge
bereits recht unübersichtlich werden. Wir wollen auch darauf hinweisen, dass die Kopplung
zwischen Spin- und Wärmetransport heute unter dem Begriff Spin-Kaloritronik zusammen-
gefasst wird.
Abb. 9.28: Mit der Bewegung
von Ladungsträgern ist (a) (a) (b) (c)
Ladungs-, (b) Wärme- und (c)
Spin-Transport verbunden. 𝒒 𝑱𝒒 𝒉 𝑱𝒉 𝒔 𝑱𝒔
Mit diesen Definitionen können wir die allgemeinen Transportgleichungen (9.5.7) und
(9.5.8) um den Spin-Transport erweitern und erhalten
𝝁𝒒↓
𝝁𝐪
𝝁𝒒↑
Abb. 9.29: Zur Definition des elektro-
chemischen Potenzials µ q = (µ ↑q + µ ↓q )⇑2
und der Spin-Akkumulation µ s = µ ↑s − µ ↓s
𝟎 𝟎 entlang einer Probe der Länge L. Die Spin-
𝟎 𝑳 𝒙 𝑳 𝒙 Akkumulation entspricht dem spinchemi-
𝝁𝐬 schen Potenzial bezogen auf µ q .
430 9 Dynamik von Kristallelektronen
ten Jq = J↑q + J↓q , J̃s = J̃↑s − J̃↓s und Jh = J↑h + J↓h benutzen und damit die Transport-Koeffizienten
L i j in (9.6.4)-(9.6.6) ersetzen:56
⎛J q ⎞ ⎛1 P ST ⎞ ⎛ −∇µ q ⇑q ⎞
⎜ J̃s ⎟ = σq (ε F ) ⎜ P 1 P′ ST ⎟ ⎜−∇µ s ⇑2q⎟ . (9.6.7)
⎝J h ⎠ ⎝ST P′ ST κT⇑σq ⎠ ⎝ −∇T⇑T ⎠
Tabelle 9.2: Klassifizierung der mit den Ladungsträgern in Festkörpern verbundenen Transportkoef-
fizienten eines magnetisch nicht geordneten Systems (M = 0). B⧹︂ ist der Einheitsvektor in Magnetfeld-
richtung. In der linken Spalte stehen die Stromdichten (Response-Größen) und in den rechten Spalten
die Potenzialgradienten als Ursache für die Stromdichten.
B = 0, M = 0
Jq −∇ϕ q −∇T −∇ϕ s
elektr. Leitfähigkeit Ladungs-Seebeck-Effekt N.N.
Jh −∇ϕ q −∇T −∇ϕ s
Ladungs-Peltier-Effekt therm. Leitfähigkeit Spin-Peltier-Effekt
Js −∇ϕ q −∇T −∇ϕ s
N.N. Spin-Seebeck-Effekt Spin-Leitfähigkeit
B ≠ 0, M = 0
Jq −∇ϕ q × ⧹︂
B −∇T × ⧹︂
B −∇ϕ s × ⧹︂
B
Ladungs-Hall-Effekt Ladungs-Nernst-Effekt N.N.
Jh −∇ϕ q × ⧹︂
B −∇T × ⧹︂
B −∇ϕ s × ⧹︂
B
Ladungs-Ettingshausen- therm. Hall-Effekt Spin-Ettingshausen-Effekt
Effekt
Js −∇ϕ q × ⧹︂
B −∇T × ⧹︂
B −∇ϕ s × ⧹︂
B
N.N. Spin-Nernst-Effekt Spin-Hall-Effekt
56
G.E.W. Bauer, E. Saitoh, B.J. van Wees, Spin Caloritronics, Nature Materials 11, 391–399 (2012).
9.6 Spin-Transport 431
Diagonalen immer die mit den Freiheitsgraden Ladung, Wärme und Spin verbundenen Leit-
fähigkeiten stehen, während das für B ≠ 0 die entsprechenden Hall-Effekte sind. Der ther-
mische Hall-Effekt wird auch als Righi-Leduc-Effekt bezeichnet. Die für B = 0 durch einen
Temperaturgradienten in Längsrichtung erzeugten longitudinalen Ladungs- und Spinströ-
me resultieren in den entsprechenden Seebeck-Effekten, die für B ≠ 0 erzeugten transver-
salen Ladungs- und Spinströme in den entsprechenden Nernst-Effekten. Ferner resultieren
die für B ≠ 0 durch longitudinale Gradienten des elektro- oder spinchemischen Potenzials
in Querrichtung erzeugten Wärmeströme in den entsprechenden Ettingshausen-Effekten.
Leider wird in der Literatur üblicherweise der Zusammenhang zwischen einem in Längs-
richtung fließenden Ladungsstrom und dem dazu in Querrichtung auftretenden Gradienten
des spinchemischen Potenzials als Spin-Hall-Effekt und der umgekehrte Effekt als inverser
Spin-Hall-Effekt bezeichnet. Da diese Nomenklatur leider etwas unlogisch ist,57 haben wir
das entsprechende Feld in der Tabelle mit N.N. bezeichnet. Wir weisen ferner darauf hin,
dass in ferromagnetischen Systemen mit endlicher Magnetisierung M ≠ 0 auch für B = 0 die
in der unteren Tabellenhälfte aufgelisteten transversalen Effekte auftreten. Sie basieren auf
der Spin-Bahn-Kopplung und werden üblicherweise als die korrespondierenden anomalen
Effekte bezeichnet. Als Beispiele werden wir in Abschnitt 9.7.1 und 9.7.2 den anomalen Hall-
und Nernst-Effekt diskutieren.
Es sollte uns auch klar sein, dass in einem Festkörper üblicherweise nicht nur die Ladungs-
träger alleine zu den beobachteten Transportphänomenen beitragen, sondern auch andere
Anregungen. In einem ferromagnetischen Metall müssen wir z.B. außer den Ladungsträgern
noch die Phononen und die Magnonen berücksichtigen, die sowohl zum Wärmetransport
(Phononen und Magnonen) als auch zum Spin-Transport (Magnonen) beitragen. Das in Ta-
belle 9.2 gezeigte Klassifizierungsschema bleibt davon unberührt, die Interpretation der ge-
messenen Transportkoeffizienten (Proportionalitätskonstanten zwischen Strömen und Po-
tenzialgradienten) wird aber schwieriger, da zu der gemessenen Größe mehrere Anregungen
gleichzeitig beitragen und wir deren Anteil im Experiment meist nicht trennen können.
9.6.2 Spin-Ströme
Wir können Stromdichten ganz allgemein als Produkt aus Teilchendichte, der von den Teil-
chen transportierter Größe und der mittleren Driftgeschwindigkeit der Teilchen aufgrund
57
Hall-Effekte verbinden den Längsstrom einer Größe mit einem Querstrom der gleichen Größe
bzw. dem daraus resultierenden Potenzialgradienten. Das heute mit Spin-Hall-Effekt bezeichnete
Phänomen basiert ähnlich zum anomalen Hall- und Nernst-Effekt auf der Spin-Bahn-Kopplung
und wird in Abschnitt 9.7.3 kurz diskutiert.
432 9 Dynamik von Kristallelektronen
einer äußeren Störung schreiben (siehe Abb. 9.28). Bei einer elektrischen Stromdichte Jq
wird von den Teilchen eine Ladungsmenge q, bei einer Wärmestromdichte Jh eine Wärme-
menge h und bei einem Spin-Strom Js eine Drehimpulsmenge s transportiert. Wären die
Teilchen die Leitungselektronen in einem Festkörper, so wäre q = −e, h = ε − µ und s = ħ2 σ.
Eine Besonderheit bei Spin-Strömen ist die Tatsache, dass die transportierte Größe kein Ska-
lar sondern ein Drehimpuls ist, der eine bestimmte Richtung hat. Dies können wir dadurch
berücksichtigen, indem wir den Spin-Strom durch das dyadische Produkt σ ⊗ v des Vek-
tors der Paulischen Spin-Matrizen [vergleiche (9.7.25)] und der Driftgeschwindigkeit aus-
drücken. Dadurch erhalten wir einen Tensor 2. Stufe, der sowohl die Transportrichtung als
auch die Spin-Richtung enthält. Für Ladungsträger mit Dichte n, Ladung q, Driftgeschwin-
digkeit v und Spin s = ħ2 σ erhalten wir
ħ
Js = n ∐︀σ ⊗ ṽ︀ , (9.6.9)
2
wobei ∐︀. . .̃︀ den thermodynamischen Erwartungswert für den durch die Störung hervorge-
rufenen Nichtgleichgewichtszustand bedeutet. Mit Jq = nqv können wir dies umschreiben
in
ħ
Js = ∐︀σ ⊗ Jq ̃︀ . (9.6.10)
2q
Wir sehen, dass das Verhältnis der von den Ladungsträgern transportierten Ladungs- und
Spin-Stromdichte gerade durch das Verhältnis der von ihnen transportierten Ladungs- und
Drehimpulsmenge gegeben ist.
Im Rahmen des bereits oben diskutierten Zweiflüssigkeitenmodells können wir (9.6.10) ver-
einfachen. Nutzen wir aus, dass der Spin der Ladungsträger bezüglich einer Quantisierungs-
achse (z.B. die z-Achse) nur zwei Werte s =↑, ↓ annehmen kann und die beiden Spin-Sorten
parallele Transportkanäle bilden, erhalten wir
ħ ↑ ↓
Js = (J − J ) . (9.6.11)
2q q q
Geben wir die Spin-Stromdichte in Einheiten der Ladungsstromdichte an, so erhalten wir
2q
J̃s = Js = (J↑q − J↓q ) . (9.6.12)
ħ
In einem nichtmagnetischen Metall wie Kupfer liegen genauso viele Ladungsträger mit par-
alleler und anti-paralleler Spin-Richtung bezüglich einer bestimmten Quantisierungsachse
vor. Wie Abb. 9.30a zeigt, führt dann die z.B. durch ein elektrisches Feld oder einen Tempe-
raturgradienten erzeugte Driftbewegung der Ladungsträger zu einem reinen Ladungsstrom
und keinem Spin-Strom, da J↑q − J↓q = 0. Dies ändert sich, wenn wir zu einem ferromagneti-
schen Metall wie Eisen übergehen (Abb. 9.30b). Da hier eine Spin-Richtung überwiegt – wir
sprechen von einer endlichen Spin-Polarisation P –, erhalten wir neben dem Ladungsstrom
auch einen endlichen Spin-Strom, da jetzt J↑q − J↓q ≠ 0. Genauer gesagt sprechen wir hier von
einem spin-polarisierten Ladungsstrom. Einen reinen Spin-Strom – also einen reinen Dreh-
impulsstrom ohne einen damit verbundenen Ladungsstrom – könnten wir erzeugen, wenn
9.6 Spin-Transport 433
𝑱𝒒 𝑱𝒔 𝑱𝒔
𝑱𝒒
Abb. 9.30: (a) Reine Ladungsströme: Die Summe der gleich großen Ladungsströme von Ladungsträ-
gern mit entgegengesetztem Spin führt zu der unten gezeigten Situation, dass nur Ladung (Kugeln)
aber kein Spin (Pfeile) transportiert wird. (b) Spin-polarisierte Ladungsströme: es wird sowohl La-
dung als auch Spin transportiert, falls eine Spin-Sorte überwiegt. (c) Reine Spin-Ströme: es wird nur
Spin und keine Ladung transportiert, falls gleich große Ladungsströme der beiden Spin-Sorten in ent-
76
gegengesetzte Richtungen fließen.
wir alle Ladungsträger der einen Spin-Richtung nach rechts und alle mit der entgegengesetz-
ten nach links laufen lassen könnten (Abb. 9.30c). Spinpolarisierte Ladungsströme treten au-
tomatisch beim Ladungstransport in Metallen mit endlicher Spin-Polarisation auf und kön-
nen leicht erzeugt werden. Heute sind auch mehrere Methoden (z.B. Spin-Pumpen über das
Treiben einer Magnetisierungsdynamik) zum Erzeugen von reinen Spin-Strömen bekannt,
auf die wir hier aber nicht eingehen wollen. Wichtig ist, dass reine Spin-Ströme auch in Iso-
latoren fließen können, da mit ihnen ja kein Ladungstransport verbunden ist. Spin-Ströme
in Isolatoren werden durch die quantisierten Anregungen des Spin-Gitters (Magnonen) ge-
tragen, genauso wie der Wärmestrom in Isolatoren durch die quantisierten Anregungen des
Atom-Gitters (Phononen) getragen wird.
Wir wollen noch auf einige Besonderheiten von Spin-Strömen hinweisen. Da der Spin keine
skalare Größe ist, müssten wir für die Beschreibung seiner Bewegung zusätzlich zur Strom-
dichte Js , welche die lineare Bewegung bei konstanter Spin-Richtung beschreibt, noch eine
weitere Größe verwenden, welche der Änderung der Spin-Richtung Rechnung trägt. Beim
Ladungstransport brauchen wir eine solche Größe nicht, da sich hier die Ladungsmenge ei-
nes Ladungsträgers beim Transport nicht ändert. Falls eine Änderung der Spin-Richtung
beim Spin-Transport erlaubt ist, ist dies gleichbedeutend damit, dass wir keine Drehimpuls-
erhaltung vorliegen haben. Mit der Ladungsdichte ρ q und der Spin-Dichte ρ s können wir
die Erhaltungssätze beim Ladungs- und Spin-Transport wie folgt formulieren:
∂ρ q
+ ∇ ⋅ Jq = 0 . (9.6.13)
∂t
∂ρ s ρ − ρ 0,s
+ ∇ ⋅ Js = − s . (9.6.14)
∂t τ
434 9 Dynamik von Kristallelektronen
Da die Spin-Dichte ρ s sowohl die Dichte als auch die Richtung der Spins beschreiben muss,
ist sie im Gegensatz zur Ladungsdichte ρ q eine vektorielle Größe. Aufgrund der Ladungs-
erhaltung kann beim Ladungstransport die Ladungsmenge innerhalb eines bestimmten Vo-
lumens nur durch den Zu- oder Abfluss von Ladungen durch die Volumenoberfläche erfol-
gen. Beim Spin-Transport ist dies nicht der Fall. Zum Beispiel können Ladungsträger durch
Wechselwirkung mit dem Gitter Drehimpuls an das Phononensystem abgeben. Diesen Ver-
lustterm haben wir in (9.6.14) mit einem Relaxationsterm auf der rechten Seite beschrieben,
wobei die Zeitkonstante τ angibt, wie schnell die Relaxation erfolgt, und ρ 0,s die Spin-Dichte
im Gleichgewicht ist.
𝒛 𝒛 𝒛
Bereits kurz nach der Entdeckung des normalen Hall-Effekts (NHE) 58 wurde in ferroma-
gnetischen Metallen ein zusätzlicher, anomaler Hall-Effekt (AHE)59 entdeckt, so dass wir
den gesamten spezifischen Hall-Widerstand durch
ρ x y (T, B) = ρ NHE + ρ AHE = R H (T)B ext + R AHE (T)µ 0 M(T, B ext ) (9.7.1)
ausdrücken können. Hierbei sind R H und R AHE der normale und anomale Hall-Koeffizient.
Letzterer verbindet den spezifischen anomalen Hall-Widerstand ρ AHE mit der Magnetisie-
rung M des Ferromagneten. Als Ursache des AHE wurde bereits 1954 von Karplus und
Luttinger60 die Spin-Aufspaltung der Bänder unter dem Einfluss der Spin-Bahn-Kopplung
angegeben. Dieser intrinsische, von der Störstellenkonzentration im Material unabhängige
Mechanismus führt zu einem AHE, der, wie wir unten zeigen werden, als Folge einer Größe
F(k) verstanden werden kann, die einer effektiven magnetischen Flussdichte im reziproken
Raum entspricht. Diese erzeugt eine zusätzliche transversale Geschwindigkeitskomponente
(q⇑ħ)E × F und somit eine dissipationslose Hall-Stromdichte J AHE , die für den beobachte-
ten AHE verantwortlich ist.61 Es wurden aber auch so genannte extrinsische Mechanismen
vorgeschlagen, die auf spinabhängigen Streuprozessen basieren und damit von der Störstel-
58
E. H. Hall, On a new Action of the Magnet on Electric Currents, Am. J. Math. 2, 287 (1879).
59
E. H. Hall, On the “Rotational Coefficient” in nickel and cobalt, Philos. Mag. 12, 157 (1881).
60
R. Karplus, J. M. Luttinger, Hall Effect in Ferromagnetics, Phys. Rev. 95, 1154-1160 (1954); Phys.
Rev. 112, 739 1958).
61
N. Nagaosa, J. Sinova, S. Onoda, A. H. MacDonald, N. P. Ong, Anomalous Hall Effect, Rev. Mod.
Phys. 82, 1539 (2010).
436 9 Dynamik von Kristallelektronen
Abb. 9.32: Illustration der Mechanismen, die zum anomalen Hall-Effekt führen. (a) Intrinsischer
Mechanismus: positive Ladungsträger mit Spin-Richtung in die (rot) und aus der Papierebene her-
aus (blau) erfahren eine anomale Geschwindigkeitskomponente nach oben und unten. (b) Skew-
Scattering-Mechanismus: Ladungsträger mit entgegengesetzter Spin-Richtung erfahren eine präferen-
zielle Streuung an neutralen Störstellen nach oben und unten. (c) Side-Jump-Mechanismus: Ladungs-
träger mit entgegengesetzter Spin-Richtung erfahren beim Passieren einer neutralen Störstelle einen
seitlichen Versatz nach oben und unten.
lenkonzentration des Materials abhängen.62 , 63 Wir wollen im Folgenden die einzelnen Me-
chanismen, die in Abb. 9.32 skizziert sind, kurz diskutieren.
tern. Wir betrachten ein System, das wir mit dem Parametervektor R beschreiben und sich
adiabatisch entlang einem Pfad Γ in seinem Parameterraum bewegt. Befindet sich das Sys-
tem zur Zeit t 0 in einem bestimmten Eigenzustand ⋃︀ψ(t 0 )̃︀ = ⋃︀m(︀R(t 0 )⌋︀̃︀ mit Eigenenergie
ε m (t 0 ) (m ist der Bandindex) und ändern wir die Systemparameter R adiabatisch, so bleibt
das System in dem sich zeitlich ändernden Eigenzustand ⋃︀m(t)̃︀. Die Phasendifferenz des
Systems im Anfangs- und Endpunkt des Pfades setzt sich aus einer dynamischen Phase [sie-
he (14.3.2)] und einer geometrischen Phase [vergleiche (14.3.3)]
Der Hamilton-Operator, bzw. seine Eigenwerte ε m (k) und Eigenzustände ⋃︀u m (k)̃︀, beschrei-
ben die Bandstruktur. Das Potenzial V (R) resultiert in einer Kraft
dk ∂V
ħ = −ı(︀k, ℋ⌋︀ = − , (9.7.4)
dt ∂R
die zu einer Drift von k entlang einem Pfad Γ im k-Raum resultiert. Wir nehmen an, dass V
so klein ist, dass eine adiabatische Bewegung möglich ist. Wie wir in Abschnitt 14.3.1 zeigen
werden, resultiert diese Bewegung in einer Berry-Phase
Der Berry-Fluss Fm (k) = ∇ × Am (k) verändert die Antwort eines Ladungsträgers auf das
Störpotenzial. Um uns diesen Sachverhalt klar zu machen, führen wir eine Eichtransfor-
mation durch, welche die Berry-Phase beseitigt. Dies erreichen wir dadurch, dass wir das
Berry-Potenzial Am zum Ortsoperator ı∇k addieren und damit zu einem verallgemeinerten
Ortsoperator (analog zum verallgemeinerten Impulsoperator, siehe Anhang D)
im k-Raum gelangen. Wir können leicht zeigen, dass der Ortsoperator jetzt nicht mehr mit
sich selbst kommutiert. Es gilt vielmehr
Benutzen wir diesen Hamilton-Operator, so erhalten wir unter Benutzung von (9.7.7)
dk ∂V
ħ = −ı(︀k, ℋ⌋︀ = −
dt ∂Rm
(9.7.9)
∂V
ħvm = −ı(︀Xm , ℋ⌋︀ = ∇k ε m (k) + ( ) × Fm (k) .
∂Xm
Wir sehen, dass die Kraft ħk̇ gleich bleibt, die Gruppengeschwindigkeit aber einen zusätz-
lichen Beitrag durch den Berry-Fluss erhält. Dieser Beitrag wird als anomale Luttinger-
Geschwindigkeit bezeichnet. Nehmen wir an, dass das Potenzial durch ein elektrisches Feld
64
Für die Impulsraumdarstellung verwenden wir den Ortsoperator im k-Raum: ıħ∇p = ı∇k .
438 9 Dynamik von Kristallelektronen
E erzeugt wird und wir zusätzlich ein externes Magnetfeld B angelegt haben, erhalten wir
mit V = qE ⋅ Xm folgende im Vergleich zu (9.1.7) modifizierten Bewegungsgleichungen für
Ladungsträger mit der Ladung q:65
Wir können nun die Boltzmann-Transportgleichung verwenden, um den Effekt der anoma-
len Geschwindigkeitskomponente für den Fall B = 0 zu untersuchen. Die elektrische Strom-
dichte ist gegeben durch [vergleiche (9.5.2)]
1
Jq = ∫ ev(k) (︀ f 0 (k) + g(k)⌋︀ d k ,
3
(9.7.11)
4π 3
wobei f 0 (k) die Gleichgewichtsverteilungsfunktion und g(k) = −qτv(k) ⋅ E(∂ f 0 ⇑∂ε) die
Korrektur durch das elektrische Feld ist (τ ist die Impulsrelaxationszeit). Wie wir in Ab-
schnitt 9.5 diskutiert haben, verschwindet üblicherweise aus Symmetriegründen der Term
mit f 0 und es bleibt lediglich der Beitrag von g übrig, der die bekannte longitudinale Leit-
fähigkeit σx x und eine verschwindende Hall-Leitfähigkeit σx y = 0 ergibt. Dies ist aber nicht
mehr richtig, wenn wir eine anomale Geschwindigkeitskomponente vAHE nach (9.7.10) vor-
liegen haben. Der f 0 -Term liefert dann den transversalen elektrischen Stromdichtebeitrag
q2
Jq,AHE = − E × n∐︀Fm ̃︀ = nq∐︀vAHE ̃︀ = σAHE E (9.7.12)
ħ
mit
q q2
∐︀vAHE ̃︀ = − E × ∐︀Fm ̃︀ , σAHE = n ∐︀Fm ̃︀ . (9.7.13)
ħ ħ
Hierbei ist
1 1
∐︀Fm ̃︀ = ∫ Fm (k) f 0 (k) d k ,
3
(9.7.14)
n 4π 3
BZ
der mit der Teilchendichte n gewichtete Mittelwert des Berry-Flusses über die Brillouin-
Zone. Bemerkenswerterweise ist JAHE bzw. σAHE unabhängig von der Streuzeit τ und hängt
somit über den Berry-Fluss nur von der Topologie der elektronischen Bandstruktur ab. Man
bezeichnet deshalb JAHE als dissipationslos (unabhängig von der Streurate).
Welche Rolle spielt nun die Spin-Bahn-Wechselwirkung. Bei gegebener Inversions-
und Zeitumkehrsymmetrie gilt für einen skalaren Bloch-Zustand Fm (−k) = Fm (k) und
Fm (−k) = −Fm (k), woraus Fm (k) = 0 für alle k folgt. Wir erhalten aber einen endlichen
65
Elektronen besitzen die Ladung q = −e.
9.7 Vertiefungsthema: Relativistische und topologische Effekte 439
Fluss und in Folge einem anomalen Hall- (AHE) und Nernst-Effekt (ANE) resultiert. Wir
wollen jetzt zeigen, dass auch durch die Bewegung von Ladungsträgern im Ortsraum eine
Berry-Phase resultiert, welche die Ladungsträger aufsammeln, wenn ihr Spin adiabatisch
einer sich räumlich ändernden Magnetisierungstextur folgt. Im Gegensatz zum bereits dis-
kutierten Fall spielt die Spin-Bahn-Kopplung keine Rolle. Da die Berry-Phase nur von der
räumlichen Topologie einer nicht-koplanaren Magnetisierungstextur abhängt, werden die
damit verbundenen transversalen Effekte auch als topologischer Hall-Effekt (THE) und to-
pologischer Nernst-Effekt (TNE) bezeichnet, je nachdem ob die longitudinale Ladungsträ-
gerbewegung durch ein elektrisches Feld oder einen Temperaturgradienten bewirkt wird.68
Wenn sich ein Ladungsträger durch eine räumlich variierende Magnetisierungstextur be-
wegt und die Wechselwirkung zwischen dem Spin des Ladungsträgers und der lokalen Ma-
gnetisierung stark genug ist, wird die Spin-Richtung adiabatisch der lokalen Magnetisie-
rungsrichtung folgen. Im Ruhesystem des Ladungsträgers entspricht dann die räumliche
Magnetisierungstextur einem sich zeitlich verändernden Magnetfeld. Wir werden in Ab-
schnitt 14.3.1 ausführlich zeigen, dass die Berry-Phase, die von einem Ladungsträger in ei-
nem Magnetfeld B(t) aufgesammelt wird, proportional zum halben Raumwinkel ist, der
vom Feldvektor B(t) überstrichen wird. Der Effekt der Berry-Phase kann einem durch die-
sen Raumwinkel tretenden emergenten magnetischen Fluss zugeordnet werden. Es ist evi-
dent, dass dieser Berry-Fluss zu einer Lorentz-Kraft und damit zu transversalen Transport-
Phänomenen führt, die nur von der aufgesammelten Berry-Phase und damit der Topologie
der Magnetisierungstextur abhängen.
Um uns den Zusammenhang zwischen Berry-Phase und einem fiktiven magnetischen Fluss
klar zu machen, betrachten wir ein 2D-Elektronensystem (siehe Abb. 9.33), das wir mit dem
Tight-Binding-Hamilton-Operator
beschreiben. Hierbei bezeichnen i, j die Gitterpunkte und γ, δ sind die Spin-Indizes. Der
erste Term repräsentiert die kinetische Energie, deren Größe durch die Hüpfamplitude t zwi-
schen benachbarten Gitterplätzen beschrieben wird, und der zweite die lokale Austausch-
kopplung mit Stärke J ex . Hierbei ist M(r i ) = Mm(r i ) die lokale Magnetisierung mit Am-
plitude M und Richtung m(r i ) und σ der Vektor der Paulischen Spin-Matrizen. Wir kön-
(a) 𝛀 (b)
Abb. 9.33: Abbildung der Bewegung eines
Ladungsträgers in einer Magnetisierungs- 𝒎 𝒓𝒊 𝒎 𝒓𝒋 𝒕𝐞𝐟𝐟
𝒊𝒋
textur m(r) (a) auf diejenige eines spinlo- 𝒊 𝒋 𝒊 𝒋
sen Ladungsträgers um einen magnetischen
Fluss Φ (b). Die konstante Hüpfampli- 𝒕 𝒂 𝚽 𝒂
tude t in (a) wird zu einer durch unter-
schiedliche Farben angedeuteten effektiven
Hüpfamplitude t eff
i j in (b). Die Pfeile in (b)
𝒂 𝒂
bezeichnen die Änderung der Hüpfphase.
68
P. Bruno, V.K. Dugaev, M. Taillefumier, Topological Hall Effect and Berry Phase in Magnetic Nano-
structures, Phys. Rev. Lett. 93, 096806 (2004).
9.7 Vertiefungsthema: Relativistische und topologische Effekte 441
nen nun einen neuen Satz von Basiszuständen ⋃︀i, ±̃︀ am Gitterplatz i definieren, deren Spin-
Richtung parallel (+) oder antiparallel (−) zur lokalen Magnetisierung ist [vergleiche hierzu
(14.3.15)]:
Hierbei sind θ i und φ i die sphärischen Winkel der lokalen Magnetisierungsrichtung m(r i ).
Mit Hilfe der Projektionsoperatoren
können wir nun in die Unterräume projizieren, die von den beiden Spin-Richtungen (±)
aufgespannt werden. Wenn allerdings die Austauschenergie J ex M groß genug ist, wird der
(+)-Zustand stark bevorzugt und Spin-Flip-Prozesse werden vernachlässigbar. In diesem
adiabatischen Bereich können wir uns auf den (+)-Unterraum beschränken und können
den effektiven Hamiltonian
i j = t cos
θij
t eff 2
e ıγ i j (9.7.21)
verwenden. Da wir den konstanten Term J ex M in (9.7.20) weglassen können, haben wir das
ursprüngliche Problem auf das eines vollkommen freien Elektronengases mit renomalisier-
ten Hüpfamplituden abgebildet, die vom Winkel θ i j zwischen den Magnetisierungsrichtun-
gen am Gitterplatz i und j abhängen. Am wichtigsten ist allerdings, dass ein Phasenfaktor
e ıγ i j aufgesammelt wird, der gerade den Effekt der Berry-Phase repräsentiert.
Wir betrachten nun in Abb. 9.33 einen geschlossenen Pfad um eine Plakette des zweidimen-
sionalen Gitters. Da der Spin adiabatisch der Magnetisierungsrichtung m(r i ) folgt, sam-
melt der Ladungsträger bei einem Rundlauf eine Berry-Phase γ auf, die gerade dem halben
Raumwinkel Ω⇑2 entspricht, der von m(r) überstrichen wird. Würde ein magnetischer Fluss
Φ = Ba 2 dieselbe Plakette mit Fläche a 2 durchdringen, so würde der Ladungsträger dadurch
eine Phasenänderung 2πΦ⇑Φ ̃ 0 erfahren (vergleiche Abschnitt 14.3.1). Hierbei ist Φ 0 = h⇑2e
̃
das “supraleitende” und Φ 0 = 2Φ 0 = h⇑e das “normale” Fluss-Quant. Wir sehen also, dass
die aufgesammelte Berry-Phase γ⇑2π äquivalent zu einem emergenten magnetischen Fluss
Φ⇑Φ̃ 0 = Ω⇑4π ist, der die Plakette durchdringt. Wir können die Berry-Phase auch durch ein
Berry-Potenzial A(r) [vergleiche hierzu (14.3.23)] ausdrücken:
j j
q 2π
γ i j = ∫ A ⋅ dℓ = A ⋅ dℓ
̃0 ∫
(9.7.22)
ħ Φ
i i
q 2π Φ
γ(Γ) = ∮ A ⋅ dℓ = ̃ ∫ B ⋅ dF = 2π ̃ . (9.7.23)
ħ Φ0 F Φ0
Γ
442 9 Dynamik von Kristallelektronen
(a) (b)
Insgesamt sehen wir, dass wir den Hamilton-Operator eines Ladungsträgers, der sich in einer
Magnetisierungstextur bewegt, auf denjenigen eines spinlosen Teilchens abbilden können,
das sich in einer inhomogenen Flussverteilung bewegt. Da der emergente magnetische Fluss
durch den Raumwinkel gegeben ist, der von der Magnetisierungsrichtung überstrichen wird,
ist sofort klar, dass wir eine endliche Berry-Phase und damit einen THE nur für eine nicht-
koplanare Magnetisierungstextur erhalten.
Um uns den entscheidenden Einfluss der Magnetisierungstextur klar zu machen, betrach-
ten wir die in Abb. 9.34 gezeigten, auf den ersten Blick sehr ähnlich aussehenden Texturen.
Wir nehmen an, dass die lokale Magnetisierung überall den gleichen Betrag M besitzt, aber
innerhalb der magnetischen Einheitszelle (rot schattiert) seine Richtung ändert, wie es in
Abb. 9.34 anhand der Pfeile dargestellt ist. In Abb. 9.34a beträgt der Raumwinkel, der von
m(r) in jeder der vier Gitterzellen (blau schattiert) überstrichen wird, Ω = +π, während er in
Abb. 9.34b Ω = +π in zwei der vier Gitterzellen und Ω = −π in den beiden anderen beträgt.
Übersetzen wir das in einen emergenten magnetischen Fluss, so beträgt dieser Φ⇑Φ ̃ 0 = ±1⇑4
in jeder einzelnen Gitterzelle. Für Abb. 9.34a erhalten wir deshalb einen Gesamtfluss Φ = Φ ̃0
für die vier Gitterzellen der magnetischen Einheitszelle, während Φ = 0 in Abb. 9.34b. Wir
sagen, dass die Magnetisierungstextur in Abb. 9.34a eine nichtverschwindende, diejenige in
Abb. 9.34b dagegen eine verschwindende Chiralität bzw. topologische Ladung [vergleiche
(9.7.24)] besitzt. Für Abb. 9.34a erwarten wir einen THE, für Abb. 9.34b dagegen nicht. Dies
macht uns nochmals die entscheidende Bedeutung der Topologie der Magnetisierungstextur
klar. Die in Abb. 9.34 unten gezeigten Texturen erhalten wir aus den oberen durch Vergröße-
rung der magnetischen Einheitszelle um den Faktor vier. In jeder Gitterzelle (blau) ist die Va-
riation der Magnetisierungsrichtung jetzt kleiner und damit der überstrichene Raumwinkel
sowie der assoziierte emergente Fluss. Der Gesamtfluss durch die magnetische Einheitszelle
(rot) bleibt allerdings gleich.
Um die in Abb. 9.34a und b gezeigten unterschiedlichen Topologien zu klassifizieren, können
wir die so genannte topologische Ladung
1 ∂m(r) ∂m(r)
Q = ∫ q(r)d2 r = ∫ m(r) ⋅ ⌊︀ − }︀ d2 r (9.7.24)
4π ∂x ∂y
9.7 Vertiefungsthema: Relativistische und topologische Effekte 443
einführen, die wir durch Integration der topologischen Ladungsdichte q(r) über die ma-
gnetische Einheitszelle erhalten. Die topologische Ladung ist eine ganze Zahl. Wir nennen
Magnetisierungstexturen mit Q = 0 (siehe Abb. 9.34b) trivial und solche mit Q ≠ 0 (sie-
he Abb. 9.34a) nicht-trivial. Nur nicht-triviale Magnetisierungstexturen verursachen eine
emergente magnetische Flussdichte, die zum THE führt.
01 0 −ı 1 0
σ = {σx , σ y , σz } = {( ),( ),( )(︀ (9.7.25)
10 ı 0 0 −1
der Vektor der Paulischen Spin-Matrizen. Wir können diese Energie auch formal als
E so = pel ⋅ ∇ϕ el schreiben und so jedem sich bewegenden Elektron das elektrische Dipol-
moment pel = αk × σ zuordnen, wobei α die Stärke der Spin-Bahn-Kopplung beschreibt.
Nach Abb. 9.35 können wir uns dies anschaulich so vorstellen, dass durch die Bahnbewe-
gung des Elektrons ein Magnetfeld erzeugt wird, das mit dem Spin-Moment wechselwirkt
und zu einer Translation senkrecht zu k und s führt. Diese Translation führt zu einem
elektrischen Dipolmoment senkrecht zu k und s.
Berücksichtigen wir zusätzlich zu E so noch die potenzielle Energie E pot = qE ⋅ r durch die
Kraft auf die Ladung qe sowie die Wechselwirkungsenergie −pel ⋅ E des elektrischen Dipol-
moments mit dem homogenen elektrischen Feld E, so ergibt sich insgesamt der Hamilton-
Operator69
ħ2 k2
ℋ= + qE ⋅ r − pel ⋅ E + qϕ el + α(k × σ) ⋅ ∇ϕ el . (9.7.26)
2m
(a) 𝒌 × 𝒌′′ 𝒌′
(b) 𝒌 × 𝒌′′ 𝒌′
𝐬
+𝜃 +𝜃
𝒌 𝒌
−𝜃 𝐬 −𝜃
𝒌′′ 𝒌′′
𝒌 × 𝒌′ 𝒌 × 𝒌′
Abb. 9.36: Skew Scattering Mechanismus: (a) Elektronen mit Spin nach hinten werden bevorzugt nach
oben (+θ) und (b) Elektronen mit Spin nach vorne bevorzugt nach unten (−θ) gestreut. Bei gleicher
Dichte beider Spin-Sorten wäre die Gesamtstreurate beider Spin-Sorten symmetrisch und die anomale
Geschwindigkeitskomponente vAHE = 0. Die Streuebene wurde in der Papierebene angenommen, die
Spin-Richtung senkrecht dazu und es gilt k = k ′ = k ′′ (elastische Streuung).
Hierbei sind die beiden letzten Terme lokale Korrekturterme, die nur in der unmittelba-
73
ren Umgebung des Streuzentrums auftreten. Diese Terme führen mit einer gewissen Wahr-
scheinlichkeit zu einem Übergang der einlaufenden Welle mit Wellenzahl k und Spin s in
den gestreuten Zustand mit Wellenzahl k′ und Spin s′ . Für das Übergangsmatrixelement gilt
∐︀k′ , s′ ⋃︀qϕ el + α(k × σ) ⋅ ∇ϕ el ⋃︀k, s̃︀ = Vkk′ {δ s,s′ − ıα(k × k′ ) ⋅ ∐︀s′ ⋃︀σ⋃︀s̃︀} . (9.7.27)
Der erste Term in der geschweiften Klammer resultiert aus der Potenzialstreuung allein (ver-
gleiche Abschnitt 9.3.2), bei dem die Spin-Richtung erhalten bleibt, und der zweite Term
ist der Beitrag aufgrund der Spin-Bahn-Kopplung. Dieser Term hat unterschiedliches Vor-
zeichen, je nachdem ob k × k′ eine Komponente parallel oder antiparallel zu s besitzt. Wie
Abb. 9.36 zeigt, wird dadurch die Streuung nach oben und unten unterschiedlich groß, da
k × k′ abhängig von der Spin-Richtung parallel oder antiparallel zu s ist. Dieses asymmetri-
sche Verhalten nennt man Skew Scattering. Aufgrund der Asymmetrie erzeugt die Verun-
reinigungstreuung einen transversalen Strombeitrag. Da üblicherweise im Experiment kein
Querstrom fließen kann, baut sich eine anomale Hall-Spannung auf. Da die betrachteten
Streuereignisse gleichzeitig den longitudinalen und den transversalen Widerstand verursa-
chen, erwarten wir, dass der Hallwiderstand ρ AHE proportional zum spezifischen Längswi-
derstand ρ x x ist. Aus Abb. 9.36 wird außerdem sofort klar, dass eine Querspannung aufgrund
von Skew Scattering nur dann auftreten kann, wenn die Spins der Ladungsträger eine Vor-
zugsrichtung besitzen. Anderenfalls würden sich die Beiträge aufgrund des Skew Scatterings
beider Spin-Sorten gerade wegmitteln. Wir erwarten deshalb, dass der Hall-Widerstand auch
proportional zur Spin-Polarisation der Ladungsträger ist, die bei Bandferromagneten wie-
derum proportional zur Magnetisierung M ist. Wir erwarten deshalb insgesamt70
Intrinsischer und extrinsischer, auf Skew Scattering basierender AHE skalieren also unter-
schiedlich mit dem Längswiderstand und können deshalb gut unterschieden werden.
70
J. Smit, The Spontaneous Hall Effect in Ferromagnetics I, Physica (Amsterdam) 21, 877 (1955).
9.7 Vertiefungsthema: Relativistische und topologische Effekte 445
Für den anomalen Beitrag n(ε − µ)vAHE zur Wärmestromdichte erhalten wir
(ε − µ)2 −∇T
Jh,AHE = ( ) × n∐︀Fm ̃︀ . (9.7.32)
ħ T
Dieser Beitrag resultiert in einem anomalen Righi-Leduc-Effekt (anomalen thermischen
Hall-Effekt).
(a) (b)
Abb. 9.37: (a) Zum Spin-Hall- und Spin-Nernst-Effekt in paramagnetischen Metallen: Ein durch ein
elektrisches Feld bzw. einen Temperaturgradienten erzeugter longitudinaler Ladungs- bzw. Wärme-
strom resultiert in einem transversalen Spin-Strom. (b) Zum inversen Spin-Hall- und Spin-Nernst-
Effekt in paramagnetischen Metallen: Ein durch einen Gradienten des spinchemischen Potenzial er-
zeugter longitudinaler Spin-Strom resultiert in einem transversalen Ladungs- und Wärmestrom.
73
Wir verwenden hier die in der Literatur eingeführte Bezeichnung Spin-Hall-Effekt, obwohl diese
nach dem in Tabelle 9.2 gezeigten Klassifizierungsschema nicht logisch ist. Der Spin-Hall-Effekt
79
9.7 Vertiefungsthema: Relativistische und topologische Effekte 447
Wärmestrom Jh als Spin-Nernst-Effekt (SNE) bezeichnet. Es ist evident, dass umgekehrt ein
longitudinaler Spin-Strom zu einem transversalen Ladungs- und Wärmestrom führt (siehe
Abb. 9.37b). Die entsprechenden Effekte werden als inverser Spin-Hall-Effekt (ISHE) und
inverser Spin-Nernst-Effekt (ISNE) bezeichnet. Da mit dem ISHE Spin-Ströme in elektri-
sche Ströme umgewandelt werden können, wird dieser Effekt heute häufig zum Messen von
Spin-Strömen verwendet.
Spin-Hall-Effekt: Der SHE wurde bereits 1971 von Dyakonov und Perel vorgeschlagen.74
Die physikalischen Ursachen des SHE und SNE sind identisch zu den bereits oben disku-
tierten Ursachen für den AHE und ANE, sie können also intrinsischer oder extrinsischer
Natur sein. Historisch wurde der SHE zuerst durch eine asymmetrische Streuung von La-
dungsträgern mit entgegengesetzter Spin-Richtung an Verunreinigungen erklärt. Wir be-
zeichnen diesen Effekt heute als extrinsischen SHE.75 Im Jahr 2003 wurde dann allerdings
gezeigt, dass die Spin-Bahn-Kopplung einen transversalen Spin-Strom auch ohne Verun-
reinigungsstreuung erzeugen kann.76 , 77 Diesen Effekt bezeichnen wir als intrinsischen SHE.
Erste experimentelle Belege für den SHE wurden bereits 1984 gefunden.78 Die mit dem SHE
verbundene Spin-Akkumulation wurde aber erstmals 2004 in GaAs und InGaAs-Schichten
direkt nachgewiesen.79 Der Nachweis des SNE gelang erstmals 2017.80
Um einen Zusammenhang zwischen der longitudinalen Ladungsstromdichte und der trans-
versalen Spin-Stromdichte herzuleiten, nutzen wir wieder aus, dass der Spin der Ladungs-
träger bezüglich einer Quantisierungsachse (z.B. die z-Achse) nur zwei Werte s =↑, ↓ anneh-
men kann und die beiden Spin-Sorten parallele Transportkanäle bilden. Wir können dann
(9.6.11) umschreiben in81
ħ ↑ ↓
Js = θ SHE (J + J ) = σSHE E . (9.7.33)
2q q q
sollte danach ein Quergradient im Spin-Potenzial sein, der durch einen in Längsrichtungs fließen-
den Spin-Strom – und nicht durch einen Ladungsstrom – verursacht wird.
74
M. I. Dyakonov, V. I. Perel, Possibility of Orientating Electron Spins with Current, JETP Lett. 13, 467
(1971); Phys. Lett. A 35, 459 (1971).
75
J. E. Hirsch, Spin Hall Effect, Phys. Rev. Lett. 83, 1834 (1999).
76
S. Murakami, N. Nagaosa, S. C. Zhang, Dissipationless Quantum Spin Current at Room Temperature,
Science 301, 1348-1351 (2003).
77
J. Sinova, D. Culcer, Q. Niu, N. A. Sinitsyn, T. Jungwirth, A. H. MacDonald, Universal Intrinsic Spin
Hall Effect, Phys. Rev. Lett. 92, 126603 (2004).
78
A.A. Bakun, B.P. Zakharchenya, A.A. Rogachev, M.N. Tkachuk, V.G. Fleisher, Detection of a surface
photocurrent due to electron optical orientation in a semiconductor, Sov. Phys. JETP Lett. 40, 1293
(1984).
79
Y. K. Kato, R. C. Myers, A. C. Gossard, D. D. Awschalom, Observation of the Spin Hall Effect in Se-
miconductors, Science 306, 1910 (2004).
80
S. Meyer, Yan-Ting Chen, S. Wimmer, M. Althammer, S. Geprägs, H. Huebl, D. Ködderitzsch,
H. Ebert, G.E.W. Bauer, R. Gross, S.T.B. Goennenwein, Observation of the Spin Nernst Effect, Nature
Materials 16, 977–981 (2017).
81
Allgemein gilt für die Spin-Stromdichte in Richtung j mit Polarisation in Richtung i: Js,i j =
σSHE є i jk E k . Hierbei ist є i jk das Levi-Civita-Symbol. Da є i jk = 0, wenn zwei Indizes gleich sind,
erhalten wir eine endliche Spin-Stromdichte nur in die Richtung j, die senkrecht auf der Spin-
Polarisation und dem elektrischen Feld steht.
448 9 Dynamik von Kristallelektronen
Wichtig ist, dass im Gegensatz zu (9.6.11) in der Klammer auf der rechten Seite ein Pluszei-
chen auftritt. Dies liegt daran, dass J↑q und J↓q parallel sind. Die transversale Spin-Stromdichte
ergibt sich daraus, dass die beiden Spin-Sorten in entgegengesetzte transversale Richtung
abgelenkt werden (vergleiche Abb. 9.37a). Der Winkel θ SHE ist der Spin-Hall-Winkel. Er ist
ein Maß dafür, wie effektiv ein longitudinaler Ladungsstrom in einen transversalen Spin-
Strom umgewandelt werden kann. Da die zugrundeliegenden physikalischen Mechanismen
auf der Spin-Bahn-Wechselwirkung beruhen und diese proportional zu Z 4 anwächst, eignen
sich nichtmagnetische Metalle mit großer Kernladungszahl Z wie z.B. Pt (θ SHE ≃ 0.182 ). Wir
haben in (9.7.33) ferner die Spin-Hall-Leitfähigkeit σSHE eingeführt, welche die transversale
Spin-Stromdichte mit dem longitudinalen elektrischen Feld verbindet. Geben wir die Spin-
Stromdichte in Einheiten der Ladungsstromdichte an [vergleiche (9.6.12)], so erhalten wir
korrekturen zu den Transportgrößen gering und haben lange Zeit nicht viel Aufmerksam-
keit erregt. Nachdem aber Festkörperstrukturen mit Abmessungen im Nanometerbereich
eine immer größere Rolle spielen, wurden die Quanteninterferenzeffekte wichtiger, da die
Kohärenzlänge der Elektronenwellen typischerweise ebenfalls im Nanometerbereich liegt.
Um solche Interferenzeffekte zur elektrischen Leitfähigkeit zu analysieren, betrachten wir
Abb. 9.38.83 Um die Wahrscheinlichkeit W für die Bewegung eines Elektrons von Punkt A
nach Punkt B zu bestimmen, müssen wir über die Wahrscheinlichkeiten für alle möglichen
Pfade aufsummieren und müssen dabei auch Interferenzterme zwischen verschiedenen Pfa-
den berücksichtigen. Falls die Elektronenwellen interferenzfähig sind, müssen wir die Wahr-
scheinlichkeit dadurch bestimmen, dass wir zuerst über alle Wahrscheinlichkeitsamplituden
aufsummieren und dann das Absolutquadrat bilden. Wir erhalten also:
2
W = ⨄︀∑ Pi ⨄︀ = ∑ ⋃︀Pi ⋃︀ + ∑ Pi P ∗j .
2
(9.8.1)
i i i≠ j
Hierbei repräsentiert der Term ∑ i ⋃︀Pi ⋃︀2 die Summe der Wahrscheinlichkeiten für die ver-
schiedenen Pfade und der Term ∑ i≠ j Pi P ∗j die Interferenz zwischen verschiedenen Pfaden.
Da die Länge der Pfade unterschiedlich ist, werden die Elektronenwellen an Punkt B mit
unterschiedlichen Phasendifferenzen
B B
1
∆φ = ∫ p ⋅ ds = ∫ k ⋅ ds (9.8.2)
ħ
A A
ankommen. Das bedeutet, dass sich die Interferenzbeiträge alle gegenseitig wegmitteln.
Es gibt allerdings eine Ausnahme, nämlich sich selbst kreuzende Pfade.84 Jeder dieser Tra-
jektorien können wir zwei Wahrscheinlichkeitsamplituden zuordnen, die sich hinsichtlich
der Richtung, mit der die Schleife durchlaufen wird, unterscheiden. Da eine Richtungsän-
derung der Bewegung in (9.8.2) dem Übergang p → −p und ds → −ds entspricht, bleibt ∆φ
unverändert. Das bedeutet, dass die Amplituden für die beiden in Abb. 9.39 gezeigten Pfade
83
Um Quantenkorrekturen zur elektrischen Leitfähigkeit zu berechnen, müssen Methoden der
Quantenfeldtheorie verwendet werden. Wir werden eine Argumentation verwenden, die von Lar-
kin und Khmel’nitskii (1982) motiviert wurde und von Al’tshuler in seiner Habilitationsschrift im
Jahr 1983 vorgestellt wurde.
84
Bei einer rein klassischen Betrachtung wären solche Pfade verboten. Betrachten wir aber die Tra-
jektorien der Elektronen als Schläuche mit einem Durchmesser, der durch die de Broglie Wellen-
länge λ dB = h⇑p gegeben ist, so erhalten wir eine endliche Wahrscheinlichkeit für Überkreuzungen.
450 9 Dynamik von Kristallelektronen
A
A O B
Abb. 9.39: Zur Berechnung der Wahrscheinlichkeit der Elektronenbewegung von Punkt A nach
Punkt B unter Berücksichtigung von sich selbst kreuzenden Trajektorien. Rechts sind A und B in den
Punkt O verschoben.
⋃︀P1 + P2 ⋃︀2 = ⋃︀P1 ⋃︀2 + ⋃︀P2 ⋃︀2 + P1 P2∗ + P2 P1∗ = 4⋃︀P1 ⋃︀2 (9.8.3)
erhalten. Wir sehen, dass sich die Interferenzterme jetzt nicht wegheben, da die umschlos-
sene Fläche und damit die Phasendifferenzen ∆φ für beide Pfade gleich sind.
Wie auf der rechten Seite von Abb. 9.39 gezeigt ist, können wir die Punkte A und B in den
Punkt O zusammenlegen. Die Wahrscheinlichkeit ⋃︀P1 + P2 ⋃︀2 gibt dann die Rückstreuwahr-
scheinlichkeit in den Ausgangspunkt A an. Wir sehen, dass die links und rechts umlaufenden
Elektronenwellen immer konstruktiv interferieren, da die Phasendifferenz für beide Trajek-
torien unabhängig von der umschlossenen Fläche immer gleich groß ist. Die Rückstreuwahr-
scheinlichkeit ist damit um den Faktor 2 erhöht. Dies führt zu einer Erhöhung des elektri-
schen Widerstands.
Wir können die konstruktive Interferenz zerstören, indem wir ein Magnetfeld anlegen. In
Anwesenheit eines Magnetfeldes müssen wir p durch p − eA ersetzen, wobei A das Vektor-
potenzial ist. Ändern wir die Richtung, in der wir die geschlossene Schleife durchlaufen, so
müssen wir p durch −p ersetzen, das Vektorpotenzial A behält allerdings sein Vorzeichen.
Das Magnetfeld bewirkt somit eine Phasenschiebung
2e 2e 2e Φ
∆φ M = ∮ A ⋅ ds = ∫ ∇ × A dF = ∫ B dF = 2π . (9.8.4)
ħ ħ ħ Φ0
F F
Hierbei ist A das Vektorpotenzial, Φ der durch das Magnetfeld in die geschlossene Trajek-
torie der Fläche F eingeprägte magnetische Fluss und Φ 0 = h⇑2e das Flussquant. Wir sehen,
dass für unterschiedliche Flächen und Orientierungen der Trajektorien relativ zum Magnet-
feld der eingeprägte magnetische Fluss und damit die Phasendifferenzen ∆φ M unterschied-
lich sind. Dadurch wird die konstruktive Interferenz der geschlossenen Trajektorien zerstört.
Die Rückstreuwahrscheinlichkeit und damit der elektrische Widerstand wird deshalb durch
das angelegte Magnetfeld erniedrigt. Wir erhalten einen negativen Magnetwiderstand.
(a) (b)
Au Lj
50 nm
Au
ℓ >> lF
(c) 0.8
G - <G> (e /h)
0.6
2
0.4
0.2
0.0
-0.2
-0.4
1 2 3 4 5 6 7
B (T)
Abb. 9.40: (a) Rasterelektronenmikroskopieaufnahme einer Gold-Nanobrücke. (b) Schematische Dar-
stellung der Störstellenkonfiguration und einer Trajektorie in der Probe. (c) Leitwert der Gold-Nano-
brücke als Funktion des angelegten Magnetfeldes bei T = 20 mK. Die rote und blaue Messkurve wur-
den an unterschiedlichen Tagen aufgenommen, ohne die Probe dazwischen aufzuwärmen (Quelle:
Walther-Meißner-Institut).
ℓ ≪ L ≪ Lφ . (9.8.5)
In einer solchen Probe liegt wegen ℓ ≪ L nach wie vor ein diffusiver Ladungstransport vor,
allerdings bleiben die an Verunreinigungsatomen oder Gitterdefekten elastisch gestreuten
Elektronenwellen innerhalb des Probenvolumens wegen L ≪ L φ voll interferenzfähig. Die
Elektronen verlieren bei den elastischen Streuprozessen ihr Phasengedächtnis nicht.
452 9 Dynamik von Kristallelektronen
Der elektrische Widerstand einer solchen mesoskopischen Probe hängt von der jeweiligen
Anordnung der Streuzentren ab, da die Interferenzterme für jede individuelle Anordnung
einen anderen Beitrag ergeben. Dies liegt daran, dass sich jetzt die durch (9.8.2) gegebenen
Phasenschiebungen nicht mehr wie bei einer makroskopischen Probe wegmitteln. Falls wir
den mittleren Widerstand wissen wollten, müssten wir sehr viele Proben mit unterschied-
lichen Konfigurationen der Streuzentren untersuchen und eine Mittelwertbildung vorneh-
men. Dies ist allerdings technisch sehr schwierig85 und außerdem sehr zeitaufwändig. Ei-
ne elegantere Methode besteht darin, die Ensemble-Mittelung durch die Untersuchung der
Magnetfeldabhängigkeit zu ersetzen. Betrachten wir in Abb. 9.38 zwei unterschiedliche Tra-
jektorien, die von A nach B verlaufen, so ist die Phasendifferenz zwischen den beiden Tra-
jektorien bei Anwesenheit eines Magnetfeldes gegeben durch
1 e
∆φ = ∮ p ⋅ ds − ∮ A ⋅ ds , (9.8.6)
ħ ħ
wobei wir das Integral über die von beiden Trajektorien gebildete geschlossenen Schleife
ausführen. Der zweite Term ergibt gerade π ΦΦ0 , wobei Φ = ∫ B ⋅ dF der magnetische Fluss
durch die von den beiden Trajektorien gebildete Schleife ist. Für jedes Magnetfeld erhal-
ten wir einen anderen Beitrag des Feldes zur Phasendifferenz. Für eine mesoskopische Pro-
be werden sich die durch (9.8.6) gegebenen Phasendifferenzen nicht mehr wegmitteln, wir
werden aber für jedes Magnetfeld einen anderen Interferenzbeitrag zum elektrischen Wi-
derstand erhalten. Dies ist in Abb. 9.40c gezeigt, wo der Leitwert eines Gold-Nanodrahts
als Funktion des angelegten Magnetfeldes gezeigt ist. Die Magnetfeldabhängigkeit zeigt eine
ausgeprägte Struktur, die man zunächst als Rauschen oder Messungenauigkeit interpretie-
ren könnte. Misst man jedoch dieselbe Abhängigkeit an einem anderen Tag nochmals, so
erhält man dasselbe Resultat.86 Die gefundene Magnetfeldabhängigkeit ist mit der Anord-
nung der Verunreinigungsatome in der Probe verknüpft und wird auch als „magnetischer
Fingerabdruck“ der Störstellenkonfiguration bezeichnet. Es kann nun gezeigt werden, dass
die Messung des Probenwiderstands bei vielen Magnetfeldern exakt äquivalent zur Mes-
sung vieler Proben mit unterschiedlichen Störstellenkonfigurationen im Nullfeld ist. Das
Ensemblemittel des Widerstands können wir also auch dadurch erhalten, indem wir den
Widerstand einer einzigen Probe bei vielen unterschiedlichen Magnetfeldern messen. Die
in Abb. 9.40c gezeigte Variationen des elektrischen Leitwerts als Funktion des angelegten
Magnetfeldes werden als universelle Leitwertfluktuationen bezeichnet. Ihre Größenordnung
liegt bei ∆G = e 2 ⇑h = 1⇑R K = 1⇑25 812 Ω.
in der Ordnung ω c τ sind, von der Ordnung (ω c τ)2 ist. Wir wollen diesen Effekt zunächst in
Abschnitt 9.9.1 für freie Ladungsträger in einem Einband-Modell (nur ein Ladungsträger-
typ) behandeln. In Abschnitt 9.9.2 erweitern wir unsere Diskussion dann auf ein Zweiband-
Modell. In diesem Modell gehen wir nach wie vor von freien Ladungsträgern aus, nehmen
aber zwei unterschiedliche Ladungsträgertypen an. Mit einem solchen Modell können wir in
einigen Fällen gut Festkörper beschreiben, deren Fermi-Flächen elektronen- und lochartige
Bereiche haben. Wir können dann jedem Bereich in erster Näherung einen Ladungsträger-
typ mit eigener Beweglichkeit zuordnen. Hinsichtlich der Diskussion des Hochfeld-Magnet-
widerstands von Kristallelektronen verweisen wir auf die weiterführende Fachliteratur.87
∂ f0 g(k) e
eE ⋅ v(k) (− )= + )︀v(k) × B⌈︀ ⋅ ∇k g(k) . (9.9.1)
∂ε τ ħ
Wenn wir freie Ladungsträger mit ħk = mv annehmen, kann jeder Zustand statt durch k
durch seine Geschwindigkeit v gekennzeichnet werden. In Analogie zu (9.5.1) machen wir
den Ansatz
∂ f0
g(k) = (− ) τv(k) ⋅ 𝒜 , (9.9.2)
∂ε
wobei 𝒜 ein noch zu bestimmender Vektor ist.89 Wir können die Größe 𝒜 aber als die ge-
samte Kraft interpretieren, die auf die Ladungsträger bei Vorhandensein eines elektrischen
und magnetischen Feldes wirkt. Die im Folgenden abgeleiteten Ergebnisse entsprechen den-
jenigen, die wir bereits in Abschnitt 7.3.4 für das freie Elektronengas abgeleitet haben.
Durch Einsetzen von (9.9.2) in (9.9.1) erhalten wir
eτ
ev ⋅ E = v ⋅ 𝒜 + ( ) (v × B) ⋅ 𝒜 , (9.9.3)
m
was für alle Werte von v offenbar durch
eτ
eE = 𝒜 + (B × 𝒜) , (9.9.4)
m
87
Weiterführende Literatur: A. B. Pippard, Magnetoresistance in Metals, Cambridge University Press
(1989).
88
Für den Fall, dass nur elektrische und magnetische Felder wirksam sind, gilt ∇r δε = −q(E + v ×
B).
89
In Abwesenheit eines Magnetfeldes gilt natürlich 𝒜 = e E.
454 9 Dynamik von Kristallelektronen
− 𝑒𝜏Τ𝑚 𝑩 × 𝓐
𝑱𝒒
erfüllt ist. Dies ist eine Vektorgleichung, die wir nach 𝒜 auflösen können. Wie die Geometrie
in Abb. 9.41 zeigt, ist eine Lösung von (9.9.4) durch
eE − eτ
B × eE
𝒜= m
(9.9.5)
1 + m2 B
e 2 τ2 2
gegeben. Dieses Ergebnis ist vollkommen analog zu (7.3.44). Man beachte, dass 𝒜 und somit
auch die Stromdichte mit zunehmendem B abnimmt.
Mit Hilfe von (9.9.2) und (9.9.3) erkennen wir andererseits auch direkt, dass der elektrische
Strom gleich
Jq = σ0 (𝒜⇑e) (9.9.6)
ist, wobei σ0 die gewöhnliche Leitfähigkeit eines Metalls in Abwesenheit eines Magnetfeldes
ist. Dies folgt aus (9.5.2) bis (9.5.25), wenn wir E durch 𝒜 ersetzen. Aus (9.9.4) und (9.9.6)
folgt daher
1 eτ 1 eτ
E= Jq + (B × Jq ) = ρ 0 Jq + ρ 0 (B × Jq ) (9.9.7)
σ0 m σ0 m
wobei ρ 0 der spezifische Widerstand in Abwesenheit eines Magnetfeldes ist.
Gleichung (9.9.7) zeigt, dass das zur Erzeugung des Stromes parallel zu 𝒜 notwendige elek-
trische Feld zwei Komponenten besitzt. In Richtung von Jq ∥ 𝒜 gilt
E∥ = ρ 0 J q . (9.9.8)
Das heißt, dass der beobachtete Widerstand der Probe durch ein Magnetfeld nicht geändert
wird, d. h. in dem betrachteten Einbandmodell existiert kein Magnetwiderstand! Dieses Er-
gebnis haben wir bereits in Abschnitt 7.3.4 für freie Elektronen abgeleitet. Es kann so ver-
standen werden, dass die auf die sich bewegenden Ladungsträger wirkende Lorentz-Kraft
durch ein transversales Feld der Stärke (wir nehmen B ⊥ Jq an)
eτ
EH = B ρ0 J q , (9.9.9)
m
kompensiert wird. Das transversale Feld wird als Hall-Feld bezeichnet. Für freie Elektronen
ist der Hall-Koeffizient durch (vergleiche Abschnitt 7.3.4)
E H eτ 1
RH = = ρ0 = , (9.9.10)
BJ q m ne
9.9 Vertiefungsthema: Magnetwiderstand 455
gegeben, wenn (9.5.30) zur Elimination der Streuzeit verwendet wird. Häufig wird auch der
spezifische Hallwiderstand
EH B
ρH = = RH B = (9.9.11)
J ne
verwendet. Mit σ = n ⋃︀e⋃︀ µ erhalten wir die Hall-Beweglichkeit
σ
µH = = σ⋃︀R H ⋃︀ . (9.9.12)
n ⋃︀e⋃︀
Eine Größe, die direkt proportional zur Beweglichkeit ist, ist der Hall-Winkel
EH
tan θ H = = µH B . (9.9.13)
E∥
gegeben.
Mit einer Lösung vom Typ (9.9.5) für die beiden Teilgleichungen von (9.9.14) finden wir den
komplizierten Ausdruck
⎛ σ1 σ2 ⎞
Jq = ⎜ + ⎟E
q τ 2 q τ 2
⎝ 1 + ( m1 11 ) B 2 1 + ( m2 22 ) B 2 ⎠
⎛ q τ
σ1 m1 11
q τ
σ2 m2 22 ⎞
−⎜ 2 + 2
⎟B × E , (9.9.16)
⎝ 1 + ( m1 11 ) B 2 1 + ( m2 22 ) B 2 ⎠
q τ q τ
R 1 ρ 22 + R 2 ρ 12 + R 1 R 2 (R 1 + R 2 )B 2
RH = . (9.9.17)
(ρ 1 + ρ 2 )2 + (R 1 + R 2 )2 B 2
R 1 ρ 22 + R 2 ρ 12 R 1 σ12 + R 2 σ22
RH = = (9.9.18)
(ρ 1 + ρ 2 )2 (σ1 + σ2 )2
ergibt.
𝑱𝒒
- 𝑼𝑯
- - - - -
𝑱𝒒𝟏
𝑞1 𝜏1
ൗ𝜎1 𝑚1 𝑩 × 𝑱𝑞1
𝑬
𝑱𝒒
𝑞2 𝜏2
ൗ𝜎2 𝑚2 𝑩 × 𝑱𝑞2
Die Diskussion des Magnetwiderstands ist etwas komplizierter. Hier müssen wir Jq mit der
Komponente von E in Jq -Richtung verbinden und erhalten
ρ = (Jq ⋅ E)⇑J q2 . (9.9.19)
Nach einigen Umformungsschritten ergibt sich der Ausdruck
ρ 1 ρ 2 (ρ 1 + ρ 2 ) + (ρ 1 R 22 + ρ 2 R 12 )B 2
ρ(B) = . (9.9.20)
(ρ 1 + ρ 2 )2 + (R 1 + R 2 )2 B 2 78
10
100K 110K 125K
8 YBa2Cu3O7-d 150K
/ (10 )
-4
4
175K
200K
Abb. 9.44: Magneto- 2
225K
widerstandseffekt eines
YBa2 Cu3 O7−δ -Einkristalls
(nach J. M. Harris et al., 0
Phys. Rev. Lett. 75, 1391 275K 325K 375K
(1995), © (2012) Ame- 0 5 10 15
rican Physical Society). B (T)
Der obige Ausdruck für ρ(B) kann auf den Fall vieler Ladungsträgertypen erweitert werden,
die alle getrennt zum Strom beitragen und formal als unterschiedliche Ladungsträgertypen
behandelt werden können. Dadurch lassen sich auch komplizierte Fermi-Flächen behan-
deln, deren Teile unterschiedliche Werte für me τ∗ besitzen. Die Existenz eines endlichen Ma-
gnetwiderstands in Metallen kann als Beweis für die Änderung von me τ∗ auf der Fermi-Fläche
gewertet werden.
Die bisherige Betrachtung gilt für den transversalen Magnetwiderstand, d. h. für den Fall,
dass das Magnetfeld senkrecht zur Stromrichtung anliegt. Man beobachtet aber auch einen
longitudinalen Magnetwiderstand, d. h. für B ∥ Jq . Das einfache Zweiband-Modell liefert
keinen longitudinalen Magnetwiderstand, da es in jedem Band Kugelsymmetrie annimmt.
Die Ausdrücke für den longitudinalen Magnetwiderstand sind komplizierter, da wir hier
nicht-kugelsymmetrische Fermi-Flächen verwenden müssen.
Wir erkennen aus (9.9.20) einen weiteren wichtigen Sachverhalt. Nehmen wir an, dass bei-
∆ρ
de Ladungsträgertypen durch die gleiche Streuzeit charakterisiert sind, so ist ρ 0 nur eine
Funktion von τB. Da τ selbst wiederum umgekehrt proportional zu ρ 0 ist, können wir
∆ρ B
=F( ) (9.9.21)
ρ0 ρ0
schreiben. F ist dabei eine Funktion, die durch die genauen Eigenschaften des jeweiligen
Metalls bestimmt ist. Gl. (9.9.21) ist als Kohler-Regel91 bekannt, die bereits in Abschnitt 7.3.4
erwähnt und phänomenologisch begründet wurde.
phische Richtungen finden, in denen der Magnetwiderstand nicht sättigt. Dies hängt mit offenen
Bahnen auf der Fermi-Fläche in diese Richtungen zusammen.
91
M. Kohler, Zur magnetischen Widerstandsänderung reiner Metalle, Annalen der Physik 424, 211–
218 (1938).
9.10 Quantisierung der Bahnen 459
∂2 u 2m̃ ε eB 2
+ { − (β − x) (︀ u = 0 (9.10.5)
∂x 2 ħ2 ħ
mit
460 9 Dynamik von Kristallelektronen
ħ2 2
̃
ε=ε− k (9.10.6)
2m z
erfüllen muss.
Wir sehen, dass die Bewegung parallel zum Magnetfeld, also in z-Richtung, genau diesel-
be ist wie für freie Ladungsträger. Ferner ist der Beitrag zur kinetischen Energie aufgrund
der Bewegung in z-Richtung derselbe wie für freie Ladungsträger. Für die Bewegung in der
x y-Ebene müssen wir allerdings eine neue Eigenwertgleichung lösen. Schreiben wir (9.10.5)
unter Benutzung von ω c = eB⇑m und ̃ x = x − (ħβ⇑eB) um, so erhalten wir
ħ2 ∂2 u 1
− + mω 2c ̃
x 2 u(x) = ̃
ε u(x) . (9.10.7)
2m ∂x 2 2
Diese eindimensionale Gleichung ist nichts anderes als die Schrödinger-Gleichung für die
Wellenfunktion eines einfachen harmonischen Oszillators mit der Zyklotronfrequenz
eB
ωc = = 1.758 820 088 (39) × 1011 s−1 × B [Tesla] , (9.10.8)
m
dessen Zentrum sich an der Stelle
ħβ 1 ħβ
x0 = = (9.10.9)
eB ω c m
befindet. Für die Energieniveaus des harmonischen Oszillators gilt
1
̃
ε = (n + ) ħω c (9.10.10)
2
und damit
1 ħ2 2
ε = (n + ) ħω c + k . (9.10.11)
2 2m z
Die Energie der Ladungsträgerzustände ergibt sich also als Summe der Translationsener-
gie der freien Bewegung in Feldrichtung und der quantisierten Energie der Kreisbewegung
in der Ebene senkrecht zum Magnetfeld. Die parabelförmigen Bänder freier Ladungsträger
spalten unter der Wirkung der Magnetfeldes in Subbänder auf, die als Landau-Niveaus92
bezeichnet werden. Dies ist in Abb. 9.45 gezeigt, wo wir die Ladungsträgerenergie für ver-
schiedene Subbänder gegen k z aufgetragen haben. Die Energieeigenwerte der verschiede-
nen Subbänder unterscheiden sich jeweils um ∆ε = ħω c . Bei einem Feld von 1 T beträgt ħω c
etwa 0.1 meV, was ħω c ⇑k B ≈ 1 K entspricht. Da für Metalle die Fermi-Temperatur TF typi-
scherweise weit oberhalb von 50 000 K liegt, ist bei einem Metall eine sehr große Zahl von
Landau-Niveaus besetzt. Bei Halbleitern ist dies anders. Wir werden in Kapitel 10 sehen, dass
hier wegen der viel kleineren Fermi-Energie oft nur wenige Landau-Niveaus besetzt sind.
Wir können die Energie (9.10.11) der Ladungsträgerzustände auch als
ħ2 2 ħ2 2
ε= k⊥,n + k (9.10.12)
2m 2m z
92
Lev Davidovich Landau, siehe Kasten auf Seite 466.
9.10 Quantisierung der Bahnen 461
𝜺𝒏 /ℏ𝝎𝒄
7
6
𝜺𝐅
5
4
3
Abb. 9.45: Ladungsträgerenergie im Magnet-
2 feld als Funktion der Wellenzahl k z parallel zur
Feldrichtung. Die gestrichelte Kurve zeigt die für
1 𝑩=𝟎 B = 0 erwartete Abhängigkeit. Der Abstand der
Subbänder (Landau-Niveaus) beträgt ħω c . Die
𝒌𝒛 Subbänder sind bis zur Fermi-Energie ε F besetzt.
(a) 𝒌𝒚 (b) 𝒌𝒚
n=3
n=2
n=1
n=0
𝒌𝒙 𝒌𝒙
Abb. 9.46: Quantisierungsschema für freie Ladungsträger (a) ohne und (b) mit Magnetfeld. Anschau-
lich kann man argumentieren, dass die ohne Magnetfeld im zweidimensionalen k-Raum gleichmäßig
verteilten Zustände durch das Magnetfeld auf Kreise in der ursprünglichen k x k y -Ebene gezwungen
werden. Aufeinander folgende Kreise entsprechen aufeinander folgenden Quantenzahlen n. Die Flä-
che zwischen aufeinander folgenden Kreisen ist ∆S = 2πeħ B = const.
84
462 9 Dynamik von Kristallelektronen
Energie unabhängig von β ist, könnten wir vermuten, dass für einen gegebenen Wert von n
jeder Wert von β zulässig ist. Dies ist aber nicht der Fall. Aus Gleichung (9.10.9) können wir
erkennen, dass die Funktionen u über ihren Mittelpunkt bei
1 ħβ v y
x0 = = (9.10.14)
ωc m ωc
von β abhängen. Das bedeutet tatsächlich, dass der mit der Geschwindigkeit v y loslaufende
Ladungsträger sich im Magnetfeld auf einem Kreis mit dem Mittelpunkt x 0 bewegen wird.
Der Weg des Ladungsträgers muss aber innerhalb des durch die Abmessungen des betrach-
teten Festkörpers vorgegebenen Kastens liegen, so dass
gelten muss. Wir erhalten also eine Einschränkung für die Lage des Mittelpunkts der Kreis-
bahn. Über (9.10.14) stellt dies auch eine Einschränkung für den erlaubten Bereich von β
dar. β ist nicht nur in Einheiten von 2π⇑L y quantisiert, sondern muss auch die Bedingung
mω c eB
0<β≤ Lx = Lx (9.10.16)
ħ ħ
erfüllen. Es gibt daher nur eine beschränkte Zahl von möglichen β-Werten und zwar gerade
L y mω c e Φ
p= L x = ħω c D 2D = L x L y B = . (9.10.17)
2π ħ 2πħ 2Φ 0
Hierbei ist D 2D = 2πħ
m
2 L x L y die zweidimensionale Zustandsdichte für eine Spin-Richtung
(vergleiche (7.1.20)). Die Größe p gibt die Anzahl der möglichen Zustände pro Landau-
Niveau an und wird als Entartung des Niveaus bezeichnet. Das heißt, dass jedes Niveau
gemäß (9.10.11), welches einer speziellen Wahl von n und k z entspricht, p-fach entartet ist.
In (9.10.17) ist Φ = L x L y B der magnetische Fluss durch die Probe und Φ 0 = h⇑2e das ma-
gnetische Flussquant. Wir sehen also, dass die Entartung p bis auf den Faktor 1⇑2 durch die
Zahl der magnetischen Flussquanten durch die Probe gegeben ist.93 Wir sehen ferner, dass
die Entartung linear mit dem Feld zunimmt.
Obwohl die alten Quantenzahlen k x , k y und k z durch das anliegende Magnetfeld keine gu-
ten Quantenzahlen mehr sind, wollen wir den k-Raum benutzen, um die p neuen Zustände
für eine bestimmte, durch (9.10.11) gegebene Energie ε durch Flächen im k-Raum darzu-
stellen. Lassen wir zunächst k z außer Acht, so können wir für B = 0 die möglichen Zustände
in der k x k y -Ebene durch ein Punktmuster darstellen, wobei der Abstand der Punkte in or-
thogonale Richtungen 2π⇑L x und 2π⇑L y beträgt. Für B ≠ 0 liegen die möglichen Zustände
auf Flächen konstanter Energie, die wir als Kreise mit Radius k⊥ in der k x k y -Ebene darstel-
len können (siehe Abb. 9.46). Die neuen Zustände sind allerdings nicht an einem bestimm-
ten Punkt auf diesem Kreis fixiert, sie rotieren vielmehr mit der Frequenz ω c . Wir können
93
Das magnetische Flussquant wurde im Zusammenhang mit der Flussquantisierung in Supralei-
tern eingeführt, wo gepaarte Elektronen, so genannte Cooper-Paare, vorliegen. Deshalb steht im
Nenner des Flussquants nicht e sondern 2e. Im Zusammenhang mit der jetzt geführten Diskus-
̃ 0 = 2Φ 0 = h⇑e zu verwenden, da wir es mit
sion wäre es eigentlich sinnvoller, das Flussquant Φ
ungepaarten Elektronen zu tun haben. Damit würden wir die Entartung zu p = Φ⇑Φ ̃ 0 erhalten.
9.10 Quantisierung der Bahnen 463
𝑩
𝒌𝒛
𝒌𝒚
aber die Zustände konstanter Energie im Magnetfeld durch die Kreise, auf denen sie liegen,
klassifizieren. Diese Kreise werden auch als Landau-Kreise bezeichnet. Berücksichtigen wir
nun noch k z , so liegt für B = 0 ein dreidimensionales Punktmuster vor, wobei der Punktab-
88
stand in k z -Richtung durch 2π⇑L z gegeben ist. Da die k z -Richtung durch B ∥ z nicht beein-
flusst wird, erhalten wir jetzt die in Abb. 9.47 gezeigten konzentrischen Zylinder, die wir als
Landau-Zylinder bezeichnen. Insgesamt wird der Radius der Zylinder in der k x k y -Ebene
und ihre Ausdehnung entlang von k z durch die Größe der Fermi-Kugel begrenzt.
Wir wollen jetzt noch zeigen, dass die Zahl der Zustände in einem bestimmten k-Raumbe-
reich im alten und neuen Schema exakt gleich ist. Dies erwarten wir natürlich, da die Zahl
der Zustände konstant bleiben sollte. Der Abstand der Energieniveaus ist durch ħω c gegeben.
Wir müssen nun berechnen, welcher Fläche ∆S in der k x k y -Ebene dieses Energieintervall
entspricht. Mit S n = πk⊥,n
2
und ħω c = ε n+1 − ε n erhalten wir sofort
2eB 2πeB
S n+1 − S n = ∆S = π[︀(n + 1 + 21 ) − (n + 12 )⌉︀
= . (9.10.18)
ħ ħ
Diese Beziehung können wir auch mit dem in Abschnitt 9.2.4 abgeleiteten allgemeinen Zu-
sammenhang zwischen der Flächenänderung dS und der Energieänderung dE erhalten. Wir
erhielten dort (vergleiche (9.2.30)):94
∂S 2πeB 1 2πm
= = 2 . (9.10.19)
∂ε ħ2 ωc ħ
Ersetzen wir den Differentialquotienten durch einen Differenzenquotienten und setzen ∆ε =
ħω c , so erhalten wir
2πm 2πeB
S n+1 − S n = ∆S =
2
ħω c = . (9.10.20)
ħ ħ
Wir sehen, dass im Magnetfeld die Flächen, die von den Ladungsträgerbahnen im k-Raum
eingenommen werden, quantisiert sind. Die Differenz der in Abb. 9.46 gezeigten Flächen ist
konstant und unabhängig von k z .
94
Da wir hier freie Elektronen betrachten, setzen wir m c = m.
464 9 Dynamik von Kristallelektronen
x y L L
Wir verwenden nun die Dichte (2π) 2 der Zustände in der k x k y -Ebene, um die Anzahl der
(a) (b)
D ()
D ()
0 1 2 3 4 5 6 0 1 2 3 4 5 6
E𝜺(hℏ𝝎) (h𝒄c)
𝜺 E ℏ𝝎
c𝒄
Abb. 9.48: Elektronische Zustandsdichte eines zweidimensionalen (a) und dreidimensionalen (b) Ga-
ses freier Ladungsträger im2D
Magnetfeld. Die gestrichelten Linien und grauen
3D Flächen zeigen die jewei-
ligen Zustandsdichten im Nullfeld. Die Spinaufspaltung wurde in der Darstellung nicht berücksichtigt.
9.10 Quantisierung der Bahnen 465
mit derjenigen eines eindimensionalen freien Systems parallel zur Feldrichtung. Die Zu-
standsdichte ergibt⌋︂
sich dadurch als Kombination der δ-Funktionen des zweidimensionalen
Systems mit der 1⇑ ε-Abhängigkeit für ein eindimensionales freies Elektronengas. Da sich
durch das Magnetfeld die Verteilung, nicht aber die Zahl der Zustände ändert, muss die
Fläche unter den für B = 0 und B ≠ 0 erhaltenen D(ε)-Kurven gleich sein.
9.10.3 Kristallelektronen
Wir müssen die bis jetzt für freie Ladungsträger geführte Diskussion nun auf den allgemei-
nen Fall von Kristallelektronen erweitern. Dazu müssten wir eine ähnliche Rechnung wie
im vorangegangenen Abschnitt für Kristallelektronen durchführen. Onsager hat jedoch ei-
ne etwas einfachere quasiklassische Rechnung vorgeschlagen, die auf dem Bohrschen Kor-
respondenzprinzip beruht, welches bekanntlich für Teilchenzustände mit hohen Quanten-
zahlen gilt. Für magnetische Anregungen kommen hauptsächlich Ladungsträger in Frage,
die sich nahe bei der Fermi-Energie befinden. Diese Ladungsträger liegen aber auf Landau-
Zylindern mit sehr hoher Quantenzahl n ≃ ε F ⇑ħω c . Da ħω c für Felder von einigen Tesla
typischerweise weniger als 1 meV beträgt und ε F einige eV, ist n typischerweise weit größer
als 1 000.
Wir haben in Abschnitt 9.1 bereits gezeigt, dass für ein einzelnes Band eine semiklassische
Beschreibung der Dynamik der Kristallelektronen verwendet werden kann. Die Schrödin-
ger-Gleichung für den äquivalenten Hamilton-Operator besitzt im Magnetfeld Lösungen,
die für die vorliegenden großen Quantenzahlen dem Korrespondenzprinzip genügen und
daher nach der Bohr-Sommerfeld-Bedingung
∮ p ⋅ dr = (n + γ) 2πħ (9.10.22)
quantisiert werden.95 Dabei ist n eine ganze Zahl und γ ein Korrekturfaktor, der z. B. für
den harmonischen Oszillator gleich 12 ist. Mit dem kanonischen Impuls p = ħk + eA (wir
95
Mathematisch lässt sich die Quantisierung des Drehimpulses folgendermaßen darstellen:
1
L= p φ dφ = ħ(ℓ + 1) .
2π ∮
Die zweite Quantisierungsregel lautet
1
p r dr = ħ(n + γ) .
2π ∮
Hierbei sind jeweils φ, p φ = mr 2 φ̇ und r, p r = mṙ Paare von kanonisch konjugierten Orts- und
Impulsvariablen. Die Korrektur γ kann nicht analytisch ermittelt werden, sondern muss mit Nä-
herungsverfahren (z. B. mit der WKB-Methode) berechnet werden. Für den harmonischen Os-
zillator erhält man γ = 12 , womit sich die von null verschiedene Grundzustandsenergie ergibt. Die
angegebenen Integrale über einen geschlossenen Weg im Phasenraum, der durch die Orts- und Im-
pulskoordinaten aufgespannt wird, sind quantisiert und können nur Vielfache von ħ annehmen.
Durch Addition erhält man die Form
1
p ⋅ dr = ħ(n + γ) ,
2π ∮
wobei p = mṙ. Diese Form ist sogar invariant unter kanonischen Transformationen.
466 9 Dynamik von Kristallelektronen
∮ eA ⋅ dr = e ∫ ∇ × A ⋅ dF = e ∫ B ⋅ dF = eΦ (9.10.24)
Wir sehen also, dass die Bahn eines Ladungsträgers (mit Ladung −e) so quantisiert ist, dass
der magnetische Fluss Φ n durch die von der Bahn im Ortsraum umschlossene Fläche A n
quantisiert ist:
Φ n = (n + γ)
h ̃0
= (n + γ) Φ (9.10.26)
(−e)
̃ 0 = h . Aus ħk = er × B folgt, dass das Wegelement dr in der Ebene
mit dem Flussquant Φ ⋃︀e⋃︀
senkrecht zum Magnetfeld mit dk über
ħ
⋃︀dr⋃︀ = ⋃︀dk⋃︀ (9.10.27)
eB
zusammenhängt. Wir können damit eine Beziehung zwischen der Fläche A n , die von der
Bahn im Ortsraum, und der Fläche S n , die von der Bahn im k-Raum umschlossen wird,
herstellen:
ħ 2
An = ( ) Sn . (9.10.28)
eB
Mit A n = Φ n ⇑B ergibt sich für die Quantisierung der Fläche im k-Raum der als Onsager-
Beziehung bekannte Zusammenhang97
2πe
S n = (n + γ) B (9.10.29)
ħ
und damit
2πm c 2πeB
S n+1 − S n = ∆S = ħω c = . (9.10.30)
ħ ħ
Das heißt, wir erhalten für die Kristallelektronen ein zum Ergebnis (9.10.20) für freie Elek-
tronen identisches Resultat. Das Ergebnis gilt aber jetzt nicht nur wie bei freien Elektronen
96
Wir benutzen die Identität a ⋅ (b × c) = −c ⋅ (b × a) und ferner die Tatsache, dass ∮ r × dr ein Vek-
tor parallel zu B mit der Länge 2A ist, wobei A die im Ortraum von der Trajektorie umschlossene
Fläche ist.
97
L. Onsager, Interpretation of the de Haas-van Alphen Effect, Phil. Mag. 43, 1006 (1952).
468 9 Dynamik von Kristallelektronen
für kreisförmige Bahnen, sondern auch dann, wenn die Landau-Bahnen nicht mehr kreis-
förmig sind. Der Effekt des Magnetfeldes kann also so beschrieben werden, dass die zu-
nächst äquidistant im Fermi-Körper verteilten Kristallelektronen auf konzentrische Landau-
Bahnen gezwungen werden, die senkrecht zur Magnetfeldachse verlaufen. Alle Kristallelek-
tronen mit gleicher Landau-Quantenzahl n kreisen mit der gleichen Zyklotron-Frequenz
um die Feldachse und umlaufen Bahnen, welche dieselbe Fläche umfassen aber durchaus
unterschiedliche Wellenvektoren k z parallel zum Magnetfeld haben können.
Für Experimente ist interessant zu wissen, welche Feldänderung ∆B zur gleichen Größe S
von zwei aufeinanderfolgenden Flächen S n und S n+1 führt. Aus S = (n + γ + 1) 2πe
ħ
B n+1 =
(n + γ) ħ B n bzw. 1⇑B n+1 = (n + γ + 1) ħS und 1⇑B n = (n + γ) ħS erhalten wir
2πe 2πe 2πe
1 1 1 2πe
∆( ) = ( − )= . (9.10.31)
B B n+1 B n ħS
Wir erhalten also durch gleiche Zunahmen in 1⇑B gleiche Bahnen im k-Raum. Aufgrund
dieser Tatsache zeigen physikalische Größen, die von der Dichte der Zustände an der Fermi-
Energie abhängen, ein magnetooszillatorisches Verhalten mit einer konstanten „Frequenz“
auf einer 1⇑B-Skala. Dieses Verhalten kann aber nur dann beobachtet werden, wenn die ther-
mische Verschmierung kleiner ist als der charakteristische Abstand ħω c zweier benachbarter
Landau-Zylinder. Das heißt, es muss gelten ħω c > k B T oder mit ω c = eB⇑m c
B mc kB
> = 0.78 T⇑K (9.10.32)
T ħe
für m c = m e . Wir sehen also, dass wir zu hohen Feldern im Bereich einiger Tesla und zu
tiefen Temperaturen im Bereich einiger Kelvin gehen müssen. Ein weiteres Kriterium für die
Beobachtbarkeit des oszillatorischen Verhaltens ist eine genügend lange Streuzeit τ. Obwohl
eine genaue Behandlung der Auswirkung der endlichen Streuzeit τ schwierig ist, können wir
eine grobe Abschätzung mit Hilfe der Unschärferelation machen. Mit ∆ε ≃ ħτ < ħω c folgt die
Bedingung
eB
ωc τ = τ >1, (9.10.33)
mc
also gerade die Bedingung für den Hochfeldgrenzfall. Wie bereits erwähnt können wir
ω c τ > 1 durch hohe Felder, tiefe Temperaturen und saubere Proben erreichen.
(a) (b)
A C A C
1. Band
ky
B
B 2. Band
kx
G
Abb. 9.49: (a) Bahn eines freien Elektrons im Magnetfeld. (b) Im periodischen Gitterpotenzial werden
die Bahnen an der Zonengrenze getrennt und man erhält offene Bahnen im 1. Band und geschlossene
Bahnen im 2. Band. In einem genügend starken Magnetfeld kann die Bahn aber wieder zurück auf die
ursprüngliche Bahn des freien Elektrons springen.
im Magnetfeld bewegenden Teilchen entsprechen. Wenn wir uns auf einen zweidimensiona-
len k-Raum senkrecht zum anliegenden Magnetfeld beschränken, haben wir einfache Kreis-
bahnen vorliegen (siehe Abb. 9.49a). Wir führen nun eine gitterperiodische Störung
V (x) = ∑ VG e ıG x (9.10.34)
G
ein, wobei G ein reziproker Gittervektor ist. Wir können die Störung als eine Schar von
Ebenen auffassen, die den Abstand 2π⇑G haben. Wenn die Bahn der Elektronen durch die
Zonengrenze verläuft, das heißt, wenn der Wellenvektor k x in x-Richtung gleich ±G⇑2 ist,
tritt Bragg-Reflexion auf. Dies führt zu stehenden Wellen und die Bahnen, die ja auf Flä-
chen ε(k) = const senkrecht zum Magnetfeld verlaufen, müssen die Zonengrenze senkrecht
schneiden. Statt die Bewegung entlang der Kreisbahn fortzusetzen, kann nun das Elektron
aufgrund der Reflexion seine Richtung ändern (siehe Abb. 9.49a). Ist die periodische Störung
groß genug, spalten sich die Bahnen am Punkt A bezüglich der Energie auf. Der Weg AC
wird bevorzugt und das Elektron bewegt sich somit auf einer offenen Bahn im periodischen
Zonenschema. Der Teil B der Bahn in Abb. 9.49b wird zu einem separaten Teil der Fermi-
Fläche, der völlig getrennt durchlaufen wird.
Erhöhen wir nun das Magnetfeld, so werden wir wiederum mehr zum Schema der freien
Elektronenbahnen in Abb. 9.49a zurückkehren. Anstatt entlang der offenen Bahn zu laufen,
kann das Elektron die kleine Energielücke durchbrechen bzw. das kleine Gebiet im k-Raum,
das die beiden Bahnen trennt, durchtunneln. Für den Tunnelprozess kann der Ausdruck
für das Zener-Tunneln benutzt werden, den wir hier nicht ableiten wollen.98 Beim Zener-
Tunneln kann ein elektrisches Feld E das Tunneln durch ein Gebiet mit einer Energielücke ε L
hervorrufen, falls
e ⋃︀E⋃︀ a ε F
>1. (9.10.35)
ε 2L
Hierbei ist a die Gitterkonstante und ε F die Fermi-Energie, die der kinetischen Energie des
Elektrons entspricht.
98
siehe z. B. Principles of the Theory of Solids, J. M. Ziman, Cambridge University Press, Cambridge
(1972).
470 9 Dynamik von Kristallelektronen
Wir müssen nun überlegen, welche Größe beim magnetischen Durchbruch dem elektrischen
Feld E in (9.10.35) entspricht. Ein Elektron, das den Punkt A im wiederholten Zonenschema
erreicht, hat die Geschwindigkeit
ħk F
v∼ , (9.10.36)
m
wobei der Fermi-Wellenvektor k F den Radius der Kreisbahn angibt. Dies gilt natürlich nur
näherungsweise an der Zonengrenze, da hier die Energiefläche durch die Existenz einer
Energielücke etwas gestört ist. Die Bewegung des Elektrons mit dieser Geschwindigkeit ver-
ursacht eine Lorentz-Kraft FL = −ev × B. Setzen wir diese der Kraft −eE durch ein äquiva-
lentes elektrisches Feld gleich, so erhalten wir das äquivalente elektrische Feld zu
Dieses „elektrische Feld“ steht senkrecht zu v und kann ein Tunneln hervorrufen, wenn
(9.10.35) erfüllt ist, d. h. wenn gilt:
evBa ε F eħk F Ba ε F ε F ħω c ε F
2
≃ 2
≃ ħω c k F a 2 ≃ >1. (9.10.38)
εL m εL εL ε 2L
Hierbei haben wir k F a ≃ 1 gesetzt. Gleichung (9.10.38) ist das so genannte Blount-
Kriterium99 für den magnetischen Durchbruch. Dieses kann für einige Metalle bereits
bei Feldern in der Größenordnung von einigen Tesla erfüllt sein.
1. de Haas-van Alphen-Effekt
2. Shubnikov-de Haas-Effekt
3. Zyklotronresonanz
4. anomaler Skin-Effekt
99
E. I. Blount, Bloch Electrons in a Magnetic Field, Phys. Rev. 126, 1636 (1962).
9.11 Experimentelle Bestimmung der Fermi-Flächen 471
5. Magnetwiderstand
6. Ultraschallabsorption
7. optische Reflektivität
8. Photoelektronen-Spektroskopie (siehe Abschnitt 8.5.3)
100
Weiterführende Literatur:
A. P. Crackwell, K. C. Wong, Fermi Surfaces, Oxford University Press (1973).
L. M. Falicov, Fermi Surface Studies, in Electrons in crystalline solids, IAEA, Wien (1973).
A. B. Pippard, Dynamics of Conduction Electrons, Gordon and Breach, New York (1965).
M. Springford, Electrons at the Fermi Surface, Cambridge University Press (1980).
D. Shoenberg, Magnetic Oscillations in Solids, Cambridge University Press (1984).
C. R. Stewart, Heavy Fermion Systems, Rev. Mod. Phys. 56, 755 (1984).
101
W. J. de Haas, P. M. van Alphen, Leiden Comm. 208d and 212a (1930); Proc. Netherlands Roy.
Acad. Soc. 33, 1106 (1930).
102
Wander Johannes de Haas, geboren am 2. März 1878 in Lisse nahe Leiden, gestorben am 26. April
1960 in Bilthoven, niederländischer Physiker und Mathematiker.
103
P. M. van Alphen, 1906–1967.
104
siehe z. B. Principles of the Theory of Solids, J. M. Ziman, Cambridge University Press, Cambridge
(1972).
472 9 Dynamik von Kristallelektronen
𝑩=𝟎 𝑩𝟏 𝑩𝟐 𝑩=𝟎 𝑩𝟑
𝜺 5 𝜺
4
5
4 𝝁
𝝁
4 3
3
3
2
2
2
ℏ𝜔𝑐
1 1
1
0 0
𝑫 𝑫
(a) (b) (c) (d) (e)
Abb. 9.50: Zur Erklärung des de Haas-van Alphen-Effekts für ein zweidimensionales freies Elektronen-
gas. Gezeigt sind die besetzten Zustände (grau schattiert) für B = 0 (a und d) sowie die Landau-Niveaus
96
für verschiedene Magnetfelder (b, c und e). In (c) ist der Magnetfeldwert B 2 so gewählt, dass die Fermi-
Energie zu der im Nullfeld identisch ist. Durch Erhöhen des Feldes B 2 schieben wir die Landau-Niveaus
und damit die Fermi-Energie zunächst solange nach oben, bis alle Zustände wegen der zunehmenden
Entartung in die weiter unten liegenden Niveaus umverteilt werden können und die Fermi-Energie
um ein Landau-Niveau nach unten springt. Dies ist gerade beim Feld B 3 der Fall.
2πeB
∆S = S n+1 − S n = (9.11.1)
ħ
und die Entartung jedes Energieniveaus ist nach (9.10.21)
L x L y 2πeB
p= = ρB . (9.11.2)
(2π)2 ħ
Um den de Hass-van Alphen-Effekt zu verstehen, müssen wir die Abhängigkeit des Fermi-
Niveaus vom angelegten Magnetfeld betrachten. Hierzu nehmen wir an, dass wir N Elek-
tronen in dem betrachteten System haben. Bei T = 0 werden die Landau-Niveaus von unten
her aufgefüllt. Wir wollen annehmen, dass wir s Niveaus vollkommen gefüllt haben und
das Niveau s + 1 nur teilweise gefüllt ist. Das bedeutet, dass das chemische Potenzial im Ni-
veau s + 1 liegt. Erhöhen wir nun das Feld, so wird das Fermi-Niveau nach oben geschoben,
da die Energie ε s+1 = (s + 1 + 12 ) ħω c linear mit B anwächst. Allerdings wächst auch die Ent-
artung p der Niveaus linear mit B an (siehe Abb. 9.51), so dass immer mehr Zustände in die
weiter unten liegenden Niveaus verschoben werden können. Dies geht solange weiter, bis das
Niveau s + 1 vollkommen entvölkert ist und deshalb das chemische Potenzial schlagartig in
das Niveau s springt. Dies geschieht bei einem Feld
N
Bs = , (9.11.3)
ρs
bei dem das Produkt aus der Zahl s der gefüllten Landau-Niveaus und der Entartung ρ = p⇑B
genau die Zahl der Elektronen im System ergibt.
9.11 Experimentelle Bestimmung der Fermi-Flächen 473
s=4
90 90
s=3
s=2
Anzahl
Anzahl
60 60
s=1
30 30
0 0
0 4 8 12 16 20 0.0 0.5 1.0 1.5 2.0 2.5 3.0
B (T) 10 / B (1/T)
Abb. 9.51: Zahl der Teilchen in vollkommen besetzten Landau-Niveaus (durchgezogene Linie) und in
teilweise besetzen Niveaus (getönte Fläche) als Funktion von B (a) und 1⇑B (b). Es wurde N = 120 und
ρ = 5 angenommen.
Wir berechnen nun die Gesamtenergie aller Elektronen. Dazu betrachten wir zunächst die
Energie der s vollkommen gefüllten Landau-Niveaus. Mit ε n = (n + 12 ) ħω c und der Entar-
tung p der Landau-Niveaus erhalten wir, wenn wir von n = 1 anstelle von n′ = 0 zählen,
s s−1
ε tot,1 = ∑ pħω c (n − 12 ) = ∑ pħω c (n′ + 12 ) = 1
2
pħω c s 2 . (9.11.4)
n=1 n ′ =0
Im teilweise gefüllten Niveau s + 1 befinden sich noch (N − sp) Elektronen , so dass wir für
deren Energie
U= 1
2
p ħω c s 2 + ħω c (s + 12 ) (N − sp) = ħω c [︀N (s + 12 ) − 12 ps 2 − 12 ps⌉︀ . (9.11.6)
Dieses Ergebnis ist in Abb. 9.52 grafisch dargestellt. Wir sehen, dass die Gesamtenergie U
als Funktion von 1⇑B periodisch variiert. Dies ist anschaulich zu erwarten, da ja identische
Intervalle auf einer 1⇑B-Skala benötigt werden, um einen bestimmten Landau-Zylinder auf
die Position des jeweiligen benachbarten Zylinders zu schieben. Deshalb schieben wir mit
einer konstanten „Frequenz“ ∆(1⇑B) Landau-Zylinder über die Fermi-Energie, was zu einer
periodischen Variation den Gesamtenergie mit dieser Frequenz führt.
Die Magnetisierung M einer Probe ist gegeben durch
1 ∂F
M=− ( ) , (9.11.7)
V ∂B T,V
wobei F = U − T S die freie Energie ist. Da F = U für T = 0, ist auch die Magnetisierung M
eine periodischen Funktion in 1⇑B. Diese Oszillation der Magnetisierung als Funktion von
474 9 Dynamik von Kristallelektronen
Gesamtenergie
1.2 𝑵 = 𝟏𝟐𝟎, 𝝆 = 𝟓
1.0 µ
Abb. 9.52: Gesamtener-
U / U(B=0)
gie des Elektronensystems 0.8
(rot, durchgezogen) und 𝒔=𝟔
𝒔=𝟓
Energie der Elektronen in 0.6 𝒔=𝟒
den vollständig gefüllten
Niveaus (schwarz, durch- 𝒔=𝟑
gezogen) als Funktion 0.4
von 1⇑B. Die getönte Flä- 𝒔=𝟐
che gibt den Beitrag der 0.2
Elektronen in nicht vollstän-
dig gefüllten Niveaus zur 𝒔=𝟏
0.0
Gesamtenergie an. Es wurde 0.0 0.5 1.0 1.5 2.0 2.5 3.0
wie in Abb. 9.51 N = 120
und ρ = 5 angenommen. 1 / B (10/T)
98
105 , 106
1⇑B wird als de Haas-van Alphen-Effekt bezeichnet. Nach (9.10.31) ist die Oszillations-
frequenz ∆( B1 ) gegeben durch
1 2πe
∆( ) = . (9.11.8)
B ħS
Wir können also durch Messung von ∆( B1 ) die Größe der Schnittfläche S der Fermi-Fläche
senkrecht zum anliegenden Magnetfeld bestimmen.
105
W. J. de Haas, P. M. van Alphen, Leiden Comm. 208d and 212a (1930).
106
D. Shoenberg, Magnetic Oscillations in Metals, Cambridge University Press (1984).
107
siehe z. B. Principles of the Theory of Solids, J. M. Ziman, Cambridge University Press, Cambridge
(1972).
9.11 Experimentelle Bestimmung der Fermi-Flächen 475
Extremalbahn 𝒗
𝒗 𝒗𝒛 = 𝟎 𝒌𝒚
𝒌𝒙
𝒗𝒛 ≠ 𝟎
𝒌𝒛
B A
𝑩
Abb. 9.53: Elliptischer Fermi-Körper zur Veranschaulichung von Extremalbahnen. Für die Bahnen in
der Umgebung der Schnittfläche A sind die Umlaufzeiten konstant. Wir nennen die zur Schnittflä-
che A gehörige Bahn Extremalbahn. Für die Bahnen in der Umgebung der Schnittfläche B variieren
die Umlaufzeiten und Phasenfaktoren dagegen stark, so dass eine Auslöschung erfolgt.
9.11.1.2 Beispiele
Als Beispiele wollen wir den de Haas-van Alphen-Effekt für Kupfer und Gold diskutieren.
99
Beide Metalle haben fcc-Struktur und haben ein Valenzelektron pro Atom. Die Elektro-
nenkonzentration eines einwertigen Metalls mit fcc-Struktur ist n = 4⇑a 3 , da jede Einheits-
zelle 4 Atome besitzt. Für ein freies Elektronengas wäre der Radius der Fermi-Kugel k F =
(3π 2 n)1⇑3 ≃ 4.90⇑a.
⌋︂ Der kleinste Abstand des Randes der 1. Brillouin-Zone vom Zonen-
zentrum ist 2πa
3 = 10.99⇑a > 2k F , also größer als der Durchmesser der Fermi-Kugel. Für
ein freies Elektronengas würde deshalb die Fermi-Kugel den Rand der 1. Brillouin-Zone
nicht berühren. Da für Kristallelektronen aber die Bandenergie in der Nähe der Zonengren-
ze etwas erniedrigt ist, kommt es zu einer Berührung der Fermi-Fläche mit der hexagonalen
Fläche der 1. Brillouin-Zone (siehe Abb. 9.54). Es entstehen dort so genannte Hälse, die in
einem periodischen Zonenschema zu einer Verbindung der Fermi-Flächen führen.
Aufgrund der Hälse findet man sowohl für Kupfer als auch für Gold bei einer Feldrichtung
parallel zur [111]-Richtung zwei Feldperioden 1⇑B 111 . Für Gold misst man die Perioden
2.05 × 10−9 Gauss−1 und 6 × 10−8 Gauss−1 . Für ein Feld in [100]-Richtung misst man nur ei-
ne Periode 1⇑B 100 = 1.95 × 10−9 Gauss−1 . Die beiden Perioden 1⇑B 111 entsprechen den bei-
den Flächen S 111 von 4.8 × 1016 cm−2 und 1.6 × 1015 cm−2 . Die kleinere der beiden S 111 -Flä-
chen ist hierbei gerade die Fläche der Halsbahn. Die große S 111 -Fläche ist fast identisch zur
[111] [111]
S 100 -Fläche und entspricht in etwa der Fläche πk F2 = 4.5 × 1016 1⇑cm2 , die man für Gold im
Rahmen des freien Elektronengasmodells erwartet.
Abb. 9.55 zeigt die Magnetisierung des quasi-zweidimensionalen organischen Metalls
α-(BEDT-TTF)2 TlHg(SeCN)4 bei einer Temperatur von 110 mK und angelegten Feldern
zwischen 10 and 32 T. Das Magnetfeld wurde in etwa senkrecht zu den zweidimensionalen
Leitungsebenen des Metalls angelegt. Deutlich sind die Oszillationen der Magnetisierung
zu sehen, wobei die Oszillationsamplitude wie erwartet mit steigendem Feld zunimmt.
Variiert man den Winkel θ des Magnetfeldes relativ zu den zweidimensionalen Leitungs-
ebenen, so ändert sich die Oszillationsfrequenz, da die Querschnittsfläche der für das quasi-
zweidimensionale System zylindrischen Fermi-Fläche proportional zu 1⇑ cos θ ist.
108
L. W. Shubnikov, W. J. de Haas, Proc. Netherlands Royal Academic Society 33, 130 and 160 (1930).
109
E. N. Adams, T. D. Holstein, Quantum Theory of Transverse Galvanomagnetic Phenomena, J. Phys.
Chem. Solids 10, 254–276 (1959).
9.11 Experimentelle Bestimmung der Fermi-Flächen 477
m c B 2 ∂M
D(ε F ) ∝ ( ) . (9.11.9)
S extr. ∂B
Hierbei ist S extr. die Fläche einer Extremalbahn im k-Raum. Als Beispiel sind in Abb. 9.56
die Shubnikov-de Haas-Oszillationen in dem zweidimensionalen organischen Metall
α-(BEDT-TTF)2 KHg(SCN)4 gezeigt. Wie oben erwähnt wurde [vergleiche (9.10.32)], hängt
die Amplitude der beobachteten Oszillationen vom Verhältnis ħω c ⇑k B T = ħeB⇑m c k B T ab.
Aus der gemessenen Temperaturabhängigkeit der Oszillationsamplitude kann deshalb die
Zyklotronmasse m c bestimmt werden.
α-(BEDT-TTF)2KHg(SCN)4
P = 2.3 kbar 2K
R ( a.u. )
2.5 K
3K
∂ f0 g(k) ∂g ∂g
eE ⋅ v(k) (− )= + ωc + . (9.11.10)
∂ε τ ∂ϕ ∂t
∂ f0
g(ε, k z , ϕ) = (− ) F(k z ) e ı(ϕ−ωt) (9.11.11)
∂ε
110
siehe z. B. Fundamentals of the Theory of Metals, A. A. Abrikosov, North-Holland, Amsterdam
(1988).
478 9 Dynamik von Kristallelektronen
Anmerkung: Gleichung (9.11.13) gilt für ein zirkular polarisiertes elektrisches Feld, bei
dem das elektrische Feld mit der natürlichen Zyklotronbewegung der Elektronen im Ma-
gnetfeld rotiert. Es ist evident, dass (9.11.13) für einen entgegengesetzt zirkular polarisier-
ten Strahl +ω statt −ω enthalten wird. Es tritt dann keine Resonanz auf. Allerdings trägt der
Imaginärteil von σ(ω) zum Realteil des komplexen Brechungsindex n bei111 und beeinflusst
somit die Phasengeschwindigkeit der elektromagnetischen Welle. Für eine linear polarisierte
Welle, die wir uns aus zwei entgegengesetzt zirkular polarisierten Wellen zusammengesetzt
denken können, pflanzen sich die beiden Komponenten mit unterschiedlichen Geschwin-
digkeiten fort, so dass die Polarisationsebene kontinuierlich gedreht wird. Dieses Phänomen
bezeichnen wir als Faraday-Effekt.
⌈︂
Die bisherige Betrachtung gilt gut für Halbleiter, die aufgrund ihrer relativ schlechten Leitfä-
higkeit eine große Skin-Eindringtiefe δ = 2⇑µ 0 ωσ haben und deshalb das elektrische Feld
in diesem Fall als homogen angenommen werden kann. Für Metalle ist dies nicht mehr der
Fall. In reinen Metallen ist τ ∼ 10−10 s und σ ∼ 108 Ω−1 cm−1 . Bei Frequenzen ω = ω c ≥ 1⇑τ ∼
1010 s−1 ist die Skin-Eindringtiefe δ ≤ 0.1 µm. Die Skin-Eindringtiefe ist also so klein, dass
der Zyklotronradius der Elektronenbahnen (R c ≃ 10 µm bei B = 1 T) wesentlich größer als
die Eindringtiefe des elektrischen Feldes ist und dieses nicht mehr als homogen angenom-
men werden kann. Wir können auch nicht zu niedrigeren Frequenzen ausweichen, da wir
dann nicht mehr den Grenzfall ω c τ ≫ 1 erreichen können.
Zur Beobachtung der Zyklotron-Resonanz bei Metallen benutzt man üblicherweise die in
Abb. 9.57 gezeigte Azbel-Kaner-Geometrie. Bei dieser wird das Magnetfeld parallel zur Me-
talloberfläche angelegt und das elektrische Feld schwingt ebenfalls parallel zur Oberfläche.
111 1⇑2
Es gilt n = (1 + ı 4πσ
ω
) .
9.11 Experimentelle Bestimmung der Fermi-Flächen 479
𝜹 𝒆𝑬 𝑬
B
𝒚
𝑹𝒄 𝒙
𝒛 Abb. 9.57: Zur Geometrie bei der Beobachtung
der Azbel-Kaner-Resonanz.
Ähnlich wie beim de Haas-van Alphen-Effekt kann man argumentieren, dass zu den beob-
achteten Resonanzen nur die Extremalbahnen beitragen und sich die Beiträge anderer Bah-
nen wegmitteln. Durch Messung der Azbel-Kaner-Resonanzen erhält man also Information
über die senkrecht zum Magnetfeld verlaufenden Extremalbahnen.
112
Sir Alfred Brian Pippard, geboren am 7. September 1920 in Earl’s Court, London, gestorben am
21. September 2008 in Cambridge.
113
A. B. Pippard, An Experimental Determination of the Fermi Surface in Copper, Phil. Trans. Roy. Soc.
A 250, 325–357 (1957).
480 9 Dynamik von Kristallelektronen
ein, die durch die klassische Skin-Eindringtiefe gegeben ist. Gleichung (9.11.16) gilt
allerdings nur dann, wenn die mittlere freie Weglänge ℓ klein gegenüber δ ist. Falls um-
gekehrt δ ≪ ℓ, erhält man einen anomalen Skin-Effekt. Das einfache Bild eines auf der
Längenskala δ exponentiell abfallenden elektrischen Feldes gilt hier nicht mehr. Für δ ≪ ℓ
wird das Eindringen des elektrischen Feldes und die Reflexion durch die Geometrie und
Form der Fermi-Fläche des Metalls bestimmt, weshalb diese durch Messung des anomalen
Skin-Effekts bestimmt werden kann. In den meisten Experimenten wird die Metalloberflä-
che als Teil eines Hohlraumresonators verwendet, dessen Oberflächenimpedanz vermessen
wird.
Literatur
A. A. Abrikosov, Fundamentals of the Theory of Metals, North-Holland, Amsterdam (1988).
E. N. Adams, T. D. Holstein, Quantum Theory of Transverse Galvanomagnetic Phenomena,
J. Phys. Chem. Solids 10, 254–276 (1959).
G.E.W. Bauer, E. Saitoh, B.J. van Wees, Spin Caloritronics, Nature Materials 11, 391–399
(2012).
A.A. Bakun, B.P. Zakharchenya, A.A. Rogachev, M.N. Tkachuk, V.G. Fleisher, Detection of
a surface photocurrent due to electron optical orientation in a semiconductor, Sov. Phys.
JETP Lett. 40, 1293 (1984).
L. Berger, Side-Jump Mechanism for the Hall Effect of Ferromagnets, Phys. Rev. B 2, 4559
(1970).
E. I. Blount, Bloch Electrons in a Magnetic Field, Phys. Rev. 126, 1636 (1962).
P. Bruno, V.K. Dugaev, M. Taillefumier, Topological Hall Effect and Berry Phase in Magnetic
Nanostructures, Phys. Rev. Lett. 93, 096806 (2004).
A. P. Crackwell, K. C. Wong, Fermi Surfaces, Oxford University Press (1973).
W. J. de Haas, P. M. van Alphen, Leiden Comm. 208d and 212a (1930); Proc. Netherlands
Roy. Acad. Soc. 33, 1106 (1930).
M. I. Dyakonov, V. I. Perel, Possibility of Orientating Electron Spins with Current, JETP Lett.
13, 467 (1971); Phys. Lett. A 35, 459 (1971).
J. Feldmann, K. Leo, J. Shah, D. A. B. Miller, J. E. Cunningham, T. Meier, G. von Plessen,
A. Schulze, P. Thomas, S. Schmitt Rink, Optical investigation of Bloch oscillations in
a semiconductor superlattice, Phys. Rev. B 46, 7252 (1992).
P. Drude, Zur Elektronentheorie der Metalle, Annalen der Physik 1, 566 (1900).
A. Dugdale, Electronic Properties of Metals and Alloys, Edward Arnold Publishers, London
(1982).
L. M. Falicov, Fermi Surface Studies, in Electrons in crystalline solids, IAEA, Wien (1973).
Literatur 481
E. Grüneisen, Die Abhängigkeit des elektrischen Widerstandes reiner Metalle von der Tempe-
ratur, Annalen der Physik 408, 530–540 (1933).
E. Grüneisen, H. Reddemann, Elektronen- und Gitterleitung beim Wärmefluss in Metallen,
Annalen der Physik 412, 843–877 (1934).
E. H. Hall, On a new Action of the Magnet on Electric Currents, Am. J. Math. 2, 287 (1879).
E. H. Hall, On the “Rotational Coefficient” in nickel and cobalt, Philos. Mag. 12, 157 (1881).
J. E. Hirsch, Spin Hall Effect, Phys. Rev. Lett. 83, 1834 (1999).
R. Karplus, J. M. Luttinger, Hall Effect in Ferromagnetics, Phys. Rev. 95, 1154-1160 (1954);
Phys. Rev. 112, 739 (1958). M. Kohler, Zur magnetischen Widerstandsänderung reiner
Metalle, Annalen der Physik 424, 211–218 (1938).
A. Messiah, Quantenmechanik I; aus d. Franz. übers. von Joachim Streubel, 2. verb. Auflage,
Walther de Gruyter, Berlin (1991).
S. Meyer, Yan-Ting Chen, S. Wimmer, M. Althammer, S. Geprägs, H. Huebl, D. Ködderitzsch,
H. Ebert, G.E.W. Bauer, R. Gross, S.T.B. Goennenwein, Observation of the Spin Nernst
Effect, Nature Materials 16, 977–981 (2017).
S. Murakami, N. Nagaosa, S. C. Zhang, Dissipationless Quantum Spin Current at Room Tem-
perature, Science 301, 1348-1351 (2003).
N. Nagaosa, J. Sinova, S. Onoda, A. H. MacDonald, N. P. Ong, Anomalous Hall Effect, Rev.
Mod. Phys. 82, 1539 (2010).
P. Nozières und C. Lewiner, A simple theory of the anomalous hall effect in semiconductors, J.
de Phys. 34, 901–915 (1973).
L. Onsager, Reciprocal relations in irreversible processes I, Phys. Rev. 37, 405 (1931); Reciprocal
relations in irreversible processes II, Phys. Rev. 38, 2265 (1931).
L. Onsager, Interpretation of the de Haas-van Alphen effect, Phil. Mag. 43, 1006–1008 (1952).
A. B. Pippard, Dynamics of Conduction Electrons, Gordon and Breach, New York (1965).
A. B. Pippard, Magnetoresistance in Metals, Cambridge University Press (1989).
D. Shoenberg, Magnetic Oscillations in Solids, Cambridge University Press (1984).
L. W. Shubnikov, W. J. de Haas, Proc. Netherlands Royal Academic Society 33, 130 and 160
(1930).
J. Sinova, D. Culcer, Q. Niu, N. A. Sinitsyn, T. Jungwirth, A. H. MacDonald, Universal Intrin-
sic Spin Hall Effect, Phys. Rev. Lett. 92, 126603 (2004).
J. Sinova, S.O. Valenzuela, J. Wunderlich, C.H. Back, T. Jungwirth, Spin Hall effects, Rev. Mod.
Phys. 87, 1213–1259 (2015).
J. Smit, The spontaneous Hall effect in ferromagnetics II, Physica 24, 39 (1958).
M. Springford, Electrons at the Fermi Surface, Cambridge University Press (1980).
C. R. Stewart, Heavy Fermion Systems, Rev. Mod. Phys. 56, 755 (1984).
482 9 Dynamik von Kristallelektronen
mit sinkender Temperatur etwa proportional zu exp(−E g ⇑2k B T) abnimmt, sind bei einer
Klassifizierung hinsichtlich des elektrischen Widerstands bei genügend tiefen Temperatu-
ren alle Halbleiter natürlich Isolatoren. Eine vernünftige Klassifizierung ist z. B. diejenige,
als Halbleiter alle Materialien mit einer endlichen Energielücke zu bezeichnen, die unter-
halb ihrer Schmelztemperatur noch eine beobachtbare elektrische Leitfähigkeit besitzen. Die
Tatsache, dass die elektrische Leitfähigkeit von Halbleitern mit der Temperatur abnimmt
unterscheidet sie fundamental von Metallen, deren elektrische Leitfähigkeit mit sinkender
Temperatur zunimmt (vergleiche Kapitel 7 und 9).
Der exponentielle Zusammenhang zwischen Ladungsträgerdichte und Bandlücke E g gilt
nur für so genannte intrinsische Halbleiter, bei denen freie Ladungsträger nur durch An-
regung aus dem vollen Valenzband ins leere Leitungsband erzeugt werden können. In die-
sem Fall könnten wir alternativ Materialien mit einer Energielücke kleiner als etwa 3 eV als
Halbleiter bezeichnen. Eine herausragende Eigenschaft von Halbleitern, die diese Material-
klasse gegenüber Metallen auszeichnet, ist aber die Möglichkeit, ihre Ladungsträgerdichte
und damit ihre elektrische Leitfähigkeit durch Verunreinigung mit kleinsten Mengen von
Fremdatomen, man spricht hier von Dotierung, über mehrere Größenordnungen zu ändern.
Durch die Wahl der Fremdatome kann ferner festgelegt werden, ob die erzielte Leitfähigkeit
elektron- oder lochartig ist. Die meisten Halbleiterbauelemente basieren auf dieser spezifi-
schen Eigenschaft von Halbleitern. In diesem Zusammenhang könnten wir auch alle Isolato-
ren, deren spezifischer elektrischer Widerstand sich durch Dotierung in den oben genannten
Bereich zwischen etwa 10−2 und 109 Ωcm bringen lässt, als Halbleiter bezeichnen. Dazu ge-
hört z. B. auch Diamant, den wir ohne Dotierung, also als intrinsisches Material, aufgrund
seiner großen Energielücke von etwa 5.5 eV den Isolatoren zuordnen müssen.
Halbleiter haben heute eine enorme Bedeutung für die Informations- und Kommunikati-
onstechnik (integrierte Schaltkreise), aber auch für die Leistungselektronik (Transistoren,
Thyristoren, Triacs), die Sensorik (Hall-Sensoren, Thermistoren, Photo-Detektoren, Druck-
sensoren), die Beleuchtungstechnik (Leuchtdioden), die Lasertechnik (Injektionslaser) oder
die Photovoltaik (Solarzellen). Wir wollen in diesem Kapitel die spezifischen Eigenschaf-
ten von Halbleitern näher diskutieren. Dabei werden wir zunächst eine Klassifizierung von
Halbleitern vornehmen und die grundlegenden Eigenschaften von intrinsischen und dotier-
ten Halbleitern wie ihre Ladungsträgerdichte und ihren elektrischen Widerstand diskutie-
ren. Anschließend werden wir uns mit räumlich inhomogenen Halbleitern und ihrer An-
wendung in elektronischen Bauelementen beschäftigen. Zum Abschluss des Kapitels über
Halbleiter werden wir niedrigdimensionale Elektronengase diskutieren, die mit Halbleiter-
systemen einfach realisiert werden können und in der heutigen Grundlagenforschung von
großer Bedeutung sind. An einem mit einer Halbleiterstruktur realisierten zweidimensiona-
len Elektronengas wurde zum Beispiel der Quanten-Hall-Effekt entdeckt.
10.1 Grundlegende Eigenschaften 485
Bezüglich ihrer chemischen Zusammensetzung und ihrer Funktionalität können wir weite-
re Grundtypen von Halbleitern unterscheiden, die wir im Folgenden kurz vorstellen. Eine
Zusammenstellung der wichtigsten Halbleitertypen ist in Tabelle 10.1 gezeigt.
10.1.1.1 Element-Halbleiter
Der zweifelsfrei am besten bekannte und für unser Alltagsleben sehr wichtige Halbleiter ist
der Element-Halbleiter Silizium. Ohne den Halbleiter Si wäre unsere heutige Informations-
und Kommunikationstechnologie undenkbar. Si kristallisiert wie andere Element-Halbleiter
der IV. Hauptgruppe (C, Ge und α-Sn) in der Diamantstruktur (siehe Abb. 1.24). In dieser
Struktur ist jedes Atom von 4 nächsten Nachbaratomen umgeben, die einen Tetraeder bil-
den. Diamant ist wegen seiner großen Energielücke von etwa 5.5 eV als intrinsisches Material
486 10 Halbleiter
ein guter Isolator. Seine Leitfähigkeit kann aber durch Einbringen von Dotieratomen in den
Bereich von Halbleitern erhöht werden. Einige Elemente der V. und VI. Hauptgruppe des
Periodensystems (z. B. P, S, Se, Te) sind ebenfalls Halbleiter. Die Atome in den jeweiligen
Kristallstrukturen sind allerdings nur dreifach (P) oder zweifach (S, Se, Te) koordiniert.
Elementhalbleiter können heute in sehr großer Reinheit hergestellt werden. Die Herstellung
von hochreinem Silizium mit Hilfe des Zonenschmelzverfahrens1 wurde 1954 von einem
Team um Eberhard Spenke2 bei der Siemens & Halske AG ermöglicht. Dies brachte Mitte
der 1950er Jahre den Durchbruch von Silizium als Halbleitermaterial für die Elektronik-
industrie und in den 1980er Jahren auch für die ersten Produkte der Mikrosystemtechnik.
Für die Herstellung von integrierten Schaltkreisen wird aber heute aus Kostengründen fast
ausschließlich mit dem Czochralski-Verfahren3 , 4 hergestelltes Silizium verwendet.
10.1.1.2 Verbindungshalbleiter
Die wichtigsten Vertreter der Verbindungshalbleiter sind die III-V-Halbleiter (z. B. GaAs,
GaN, InP, InSb, GaSb, AlSb), die aus Elementen der III. und V. Hauptgruppe bestehen,
und die II-VI-Halbleiter (z. B. ZnS, CdS, CdSe, CdTe, HgTe), die aus Elementen der II.
und VI. Hauptgruppe aufgebaut sind. Die Eigenschaften der III-V-Halbleiter sind sehr
1
Beim Zonenschmelzverfahren wird ein mit Hilfe einer Induktionsheizung erzeugter, aufgeschmol-
zener Bereich durch einen Stab mit noch polykristalliner Kristallstruktur bewegt. Damit die Zone
gleichmäßig aufschmilzt, rotiert der Stab langsam. Die aufgeschmolzene Zone wird anfangs mit
einem Impfkristall in Berührung gebracht und wächst unter Annahme seiner Kristallstruktur an
ihm an. Diese Schmelzzone wird dann langsam durch den Stab bewegt, wobei die wieder erkalten-
de Schmelze mit einer einheitlichen Kristallstruktur über die gesamte Materialbreite erstarrt und
somit hinter der Schmelzzone den gewünschten Einkristall bildet. Das Zonenschmelzverfahren
beruht auf der Tatsache, dass Verunreinigungen in der Schmelze eine energetisch günstigere che-
mische Umgebung (niedrigeres chemisches Potenzial) haben als im Festkörper und darum vom
Festkörper in die Schmelze wandern. Die Menge, die im Kristall eingebaut wird, hängt u. a. von
der Art der Verunreinigung und der Erstarrungsgeschwindigkeit ab. Fremdatome verbleiben also
weitestgehend in der Schmelzzone und lagern sich schließlich am Ende der Säule an, die nach dem
Erkalten entfernt wird. Durch mehrmaliges Zonenschmelzen kann die Reinheit weiter gesteigert
werden.
2
Eberhard Spenke, geboren am 5. Dezember 1905 in Bautzen, gestorben am 24. November 1992
in Pretzfeld. Er studierte an den Universitäten Bonn, Göttingen und Königsberg Physik, die Pro-
motion erfolgte im Jahr 1929. Er war dann von 1929 bis 1946 als wissenschaftlicher Mitarbeiter
im Berliner Zentrallaboratorium der Siemens & Halske AG tätig. Zusammen mit Walter Schottky
(1886–1976) untersuchte er dort die Eigenschaften und Leitungsvorgänge von Halbleitermateria-
lien.
3
Das Czochralski-Verfahren ist auch unter dem Begriff Tiegelziehverfahren bekannt. Im Tiegel wird
die zu kristallisierende Substanz wenig über dem Schmelzpunkt gehalten. Darin taucht der Keim,
z. B. ein kleiner Einkristall der zu züchtenden Substanz ein. Durch Drehen und langsames nach
oben Ziehen wächst das erstarrende Material zu einem Einkristall, der das Kristallgitter des Keims
fortsetzt. Das Czochralski-Verfahren wurde 1916 im Metall-Labor der AEG vom polnischen Che-
miker Jan Czochralski (1885–1953, 1904–1929 in Deutschland) durch ein Versehen entdeckt: er
tauchte seine Schreibfeder in einen Schmelztiegel mit flüssigem Zinn anstatt ins Tintenfass. Darauf-
hin entwickelte und verbesserte er das Verfahren und wies nach, dass damit Einkristalle hergestellt
werden können.
4
J. Czochralski, Ein neues Verfahren zur Messung der Kristallisationsgeschwindigkeit der Metalle,
Zeitschrift für Physikalische Chemie 92, 219–221 (1918).
10.1 Grundlegende Eigenschaften 487
ähnlich zu denjenigen der Element-Halbleiter der IV. Hauptgruppe. Durch den Übergang
von Elementen der IV. Hauptgruppe zu III-V Verbindungen erhält die chemische Bindung
einen endlichen ionischen Charakter, da Ladung vom Gruppe-III zum Gruppe-V Element
transferiert wird. Dieser ionische Bindungsanteil führt üblicherweise zu einer Erhöhung
der Energielücke. Der Anteil und die Bedeutung der ionischen Bindung wird noch größer
für die II-VI-Halbleiter. Deshalb haben die meisten II-VI-Halbleiter Energielücken oberhalb
von 1 eV. Eine Ausnahme bilden hier die Systeme, die Hg enthalten. Diese haben kleine
Energielücken oder sind sogar Halbmetalle wie z. B. HgTe. II-VI-Halbleiter mit großen
Energielücken sind interessant für Displays und Laser, diejenigen mit kleiner Energielücke
finden Anwendung in Infrarotdetektoren.
Weitere Verbindungshalbleiter sind IV-IV-Halbleiter (SiC, SiGe), IV-VI-Halbleiter (PbS, Pb-
Te, PbSe, SnS) oder I-VII-Verbindungen (z. B. CuCl, AgBr). Letztere haben aufgrund des
sehr starken ionischen Charakters der Bindung große Energielücken (> 3 eV). Die binären
Verbindungen aus Gruppe-IV und Gruppe-VI Elementen haben dagegen sehr kleine Band-
lücken und kommen in Infrarotdetektoren zum Einsatz.
Zu den Verbindungshalbleitern zählen wir auch ternäre Systeme wie den I-III-VI-Halbleiter
CuInSe2 (CIS) oder das II-IV-V-System CdSnAs2 . CIS wird zusammen mit seinen komposi-
tionellen Abkömmlingen Cu(In,Ga)(S,Se)2 als Material für Dünnschichtsolarzellen benutzt,
wobei hier aber die begrenzte Verfügbarkeit von In ein Problem darstellt. Weitere ternäre
Systeme sind ZnCdTe oder HgCdTe (Anwendung in Infrarotdetektoren) sowie AlGaAs und
GaAsP (Anwendung in der Lasertechnik). Für die Herstellung von Lasern für die optische
Kommunikationstechnik bei Wellenlängen von 1.3 und 1.5 µm werden quaternäre Verbin-
dungshalbleiter wie (Ga,In)(As,P) verwendet.
Bis heute wurden viele organische Verbindungen gefunden, die Halbleiter sind. Organische
Halbleiter sind sehr viel versprechend für Anwendungen (z. B. für OLEDs – Organic Light
Emitting Diodes oder OFETs – Organic Field Effect Transistors), da sie billig herzustellen
sind, leicht hinsichtlich ihrer elektrischen und optischen Eigenschaften modifiziert werden
können und biegbar sind. Zur Zeit haben allerdings Bauelemente basierend auf organischen
Halbleitern häufig noch Haltbarkeitsprobleme.6
10.1.1.5 Schicht-Halbleiter
Materialien wie PbI2 , MoS2 oder GaSe besitzen eine ausgeprägte Schichtstruktur. Die Bin-
dung innerhalb der Schichten ist kovalent, während zwischen den Schichten nur eine schwa-
che van der Waals Bindung vorliegt. Die Materialsysteme haben Interesse gefunden, da sie
intrinsisch quasi-zweidimensionale Elektronensysteme bilden und die Wechselwirkung der
Schichten durch Einbringung von Fremdatomen (Interkalation) variiert werden kann.
0
Energielücke [111]
Energie (eV)
-2
-4
-6
[010]
-8
Si
[100]
-10
-12
2
Energielücke
[001]
0
-2
Energie (eV)
-4
[111]
-6
-8
Ge
[010]
-10
-12 [100]
L G X U,K G
Wellenvektor
Abb. 10.1: Berechnete Bandstrukturen von Si und Ge (nach J. R. Chelikowski und M. L. Cohen, Phys.
Rev. B 14, 556 (1976)). Die vier Valenzbänder (unteres sp3 -Subband) sind farbig hinterlegt. Rechts sind
die Flächen konstanter Energie in der Nähe des Minimums des Leitungsbandes und die Diamantstruk-
tur gezeigt. Beide Materialien haben Diamantstruktur mit einem kubisch flächenzentrierten Bravais-
Gitter, so dass die 1. Brillouin-Zone ein Rhombendodekaeder ist. Aus Gründen der Symmetrie treten
immer mehrere Bandminima in äquivalente Richtungen des k-Raums auf. Für Si sind dies die {001}-,
für Ge die {111}-Richtungen.
490 10 Halbleiter
Wir haben in Abschnitt 8.3 auch bereits diskutiert, welche Abhängigkeit wir für die Größe
der Energielücke vom Abstand der Atome im Gitter erwarten. Wir haben gesehen, dass mit
wachsendem Abstand der Atome die Aufspaltung zwischen den Bändern abnimmt (verglei-
che Abb. 8.15). Da sich Festkörper mit zunehmender Temperatur aufgrund von anharmoni-
schen Effekte ausdehnen, erhalten wir also eine Zunahme des Abstands der Atome und da-
mit eine Abnahme der Energielücke mit zunehmender Temperatur. Neben der thermischen
Ausdehnung wirkt sich auch die Temperaturabhängigkeit der Phononenverteilung auf die
Bandstruktur und die Größe der Energielücke aus, da Elektron-Phonon-Streuung zu einer
Erniedrigung des effektiven Potenzials führt. Beide Effekte zusammen resultieren in einer
Abnahme von E g mit zunehmender Temperatur, die phänomenologisch mit der Varshni-
Formel8
aT 2
E g (T) = E g (0) − . (10.1.1)
T +b
beschrieben werden kann (Si: a = 4.73 × 10−4 eV/K, b = 636 K; Ge: a = 4.774 × 10−4 eV/K,
b = 235 K, GaAs: a = 5.405 × 10−4 eV/K, b = 204 K). Bei tiefen Temperaturen (T ≪ b) er-
gibt sich ein etwa quadratischer, bei Raumtemperatur ein etwa linearer Temperaturverlauf
der Energielücke. In Tabelle 10.2 sind die Werte der Bandlücke für einige Halbleiter bei 0 K
und 300 K angegeben.
Die für die elektronischen Eigenschaften von Halbleitern relevanten Zustände liegen alle an
der Oberkante des Valenz- bzw. der Unterkante des Leitungsbandes. Wir haben in Kapitel 8
bereits gesehen, dass wir den Bandverlauf in der Nähe der Bandkante gut durch eine Parabel
annähern können:
ħ2 1
E(k) = E c + ∑ ki ( ∗ ) k j (Elektronen) (10.1.2)
2 ij m ij
ħ2 1
E(k) = E v + ∑ ki ( ∗ ) k j (Löcher) . (10.1.3)
2 ij m ij
Hierbei ist E c die Energie an der Unterkante des Leitungsbandes, E v diejenige an der Ober-
kante des Valenzbandes und (m∗ −1 ) i j der durch (9.1.13) gegebene effektive Massetensor.
Tabelle 10.2: Werte der Energielücken von einigen Halbleitern bei T = 0 K (extrapolierte Werte) und
bei 300 K. Quelle: Handbook Series on Semiconductor Parameters, Vol. 1 and 2, edited by M. Levinstein,
S. Rumyantsev and M. Shur, World Scientific, London (1996, 1999).
Halbleiter Typ E g (0 K) E g (300 K) Halbleiter Typ E g (0 K) E g (300 K)
Si indir. 1.17 1.12 GaP indir. 2.32 2.26
Ge indir. 0.742 0.661 InP direkt 1.421 1.344
GaAs direkt 1.519 1.424 ZnO direkt 3.44 3.2
InSb direkt 0.24 0.17 ZnS – 3.91 3.6
InAs direkt 0.415 0.354 CdS direkt 2.58 2.42
AlSb indir. 1.65 1.58 CdTe direkt 1.61 1.45
GaN (Wurzit) indir. 3.47 3.39 GaN (ZnS) direkt 3.28 3.20
8
Y.Ṗ. Varshni, Temperature dependence of the energy gap in semiconductors, Physica 34, 149 (1967).
10.1 Grundlegende Eigenschaften 491
Wir werden im Folgenden diese parabolische Näherung häufig verwenden. Es ist zu be-
achten, dass (10.1.3) eine nach unten geöffnete Parabel darstellt, da die effektive Masse der
Löcher am Γ-Punkt negativ ist.
Da der effektive Massetensor reell und symmetrisch ist, können wir einen Satz von orthogo-
nalen Hauptachsen finden, bezüglich der die Energien die diagonale Form
k2 k2 k2
E(k) = E c + ħ 2 ( 1 + 2 + 3 ) (Elektronen) (10.1.4)
2m 1 2m 2 2m 3
k 12 k2 k2
E(k) = E v + ħ 2 ( + 2 + 3 ) (Löcher) (10.1.5)
2m 1 2m 2 2m 3
haben. Die Flächen konstanter Energie sind somit Ellipsoide, die durch Angabe der drei
Hauptachsen, der drei effektiven Massen und der Position im k-Raum eindeutig definiert
sind. Auf der rechten Seite von Abb. 10.1 sind diese Ellipsoide für Si und Ge skizziert. Beide
Materialien haben Diamantstruktur mit einem kubisch flächenzentrierten Bravais-Gitter, so
dass die 1. Brillouin-Zone ein Rhombendodekaeder ist.
Für Si hat das Leitungsband aus Symmetriegründen sechs Minima, die entlang der {100}
Richtungen liegen und zwar bei etwa 80% des Abstandes zum Zonenrand. Jedes der sechs
äquivalenten Ellipsoide muss rotationssymmetrisch bezüglich einer Rotation um die Wür-
felachsen sein. Wie Abb. 10.1 zeigt, sind die Ellipsoide zigarrenförmig in Richtung der Wür-
felachse gestreckt. Wir können zwei effektive Massen definieren. Während die longitudinale
effektive Masse m∗el entlang der Achse etwa der freien Elektronenmasse entspricht, ist die
transversale effektive Masse m∗et senkrecht zur Achse wesentlich kleiner und beträgt nur et-
wa 0.2 m. Für Si gibt es zwei entartete Valenzbandmaxima bei k = 0, die kugelsymmetrisch
sind mit effektiven Massen m∗lh = 0.16 m (lh = light holes) und m∗hh = 0.49 m (hh = heavy
holes).
Für Ge ist die Kristallstruktur und die Brillouin-Zone identisch zu Si. Allerdings treten die
Minima des Leitungsbandes jetzt an den äquivalenten L-Punkten der Brillouin-Zone, das
heißt, an den Zonenrändern entlang der {111} Richtungen auf (siehe hierzu Abb. 10.1). Die
Flächen konstanter Energie sind wiederum Ellipsoide, die jetzt aber entlang der {111} Rich-
tungen gestreckt sind mit effektiven Massen m∗el = 1.57 m und m∗et = 0.081 m. Da die Ellip-
soide mit der jeweiligen Nachbarzelle geteilt werden, haben wir bei Ge nur 8⇑2 = 4 äquiva-
lente Ellipsoide. Wie bei Si liegen zwei entartete Valenzbandmaxima bei k = 0 mit effektiven
Massen m∗lh = 0.043 m und m∗hh = 0.33 m vor. Die verschiedenen effektiven Massen von Si
und Ge und einiger anderer Halbleiter sind in Tabelle 10.3 zusammengestellt.
Halbleiter m∗e ⇑m m∗et ⇑m m∗el ⇑m m∗lh ⇑m m∗hh ⇑m m∗soh ⇑m ∆ (eV) Tabelle 10.3: Effektive Massen
Si 0.19 0.98 0.16 0.49 0.24 0.044
von Elektronen und Löchern so-
wie Spin-Bahn-Aufspaltung ∆
Ge 0.081 1.59 0.043 0.33 0.084 0.295 für Si und Ge. Quelle: Handbook
GaAs 0.063 0.082 0.51 0.14 0.341 Series on Semiconductor Para-
GaSb 0.041 0.04 0.4 0.15 0.80 meters, Vol. 1 and 2, edited by
GaP 1.12 0.22 0.14 0.79 0.25 0.08 M. Levinstein, S. Rumyantsev
and M. Shur, World Scientific,
InAs 0.023 0.026 0.41 0.16 0.41
London (1996, 1999).
InP 0.073 0.089 0.58 0.17 0.11
InSb 0.014 0.015 0.43 0.19 0.81
492 10 Halbleiter
𝑬
𝒌
𝟑
𝚫/𝟑 𝑱=𝑳+𝑺=
leichte 𝟐
𝑬𝑽 𝝀 = 𝟎 Löcher 𝟑 𝟏 𝟏 𝟑
𝚫 ∗
𝒎𝐥𝐡 𝒎𝑱 = − , − , + , +
schwere 𝟐 𝟐 𝟐 𝟐
𝟐𝚫/𝟑
Abb. 10.2: Qualitativer Verlauf der Löcher 𝒎∗𝐡𝐡 hh lh hh
Bandstruktur von Si und Ge in der Nä- Spin-Bahn 𝟏
𝑱=𝑳−𝑺=
aufgespaltene 𝟐
he des Valenzbandmaximums beim 𝟏 𝟏
Löcher 𝒎∗𝐬𝐨𝐡 𝒎𝑱 = − , +
Γ-Punkt. ∆ ist die Spin-Bahn-Aufspaltung. 𝟐 𝟐
Im Gegensatz zu den Element-Halbleitern der IV. Hauptgruppe hat die chemische Bindung
in den III-V Halbleitern einen ionischen Anteil. Den gemischten Charakter der Bindung
können wir uns so vorstellen, dass ein Elektron vom Ga zum As Atom transferiert wird, so
dass eine Ga+ As− Konfiguration vorliegt. Diese führt natürlich zu einer ionischen Bindung.
Dieser überlagert ist eine kovalente Bindung, die zu keinem Ladungstransfer führt und bei-
de Atome mit vier Elektronen belässt. Es kann sich dann wie für Si und Ge eine sp3 -Hybri-
disierung ausbilden. Wir können davon ausgehen, dass die kovalente Bindung dominiert,
da der Kristall sonst nicht in der tetraedrisch koordinierten Zinkblende-Struktur vorliegen
würde. Wie bei der Diamantstruktur sitzen hier die einzelnen Gitteratome im Mittelpunkt
eines Tetraeders, das von vier nächsten Nachbarn gebildet wird. Die Zinkblende-Struktur
unterscheidet sich nur dadurch von der Diamantstruktur, dass bei ihr die Basis zwei ver-
schiedenartige Atome enthält (vergleiche Abschnitt 1.2.9).
Der wichtigste Unterschied zwischen GaAs und Si bzw. Ge ist die Tatsache, dass GaAs ge-
nauso wie InAs, InSb oder InP ein direkter Halbleiter ist. Wie Abb. 10.3 zeigt, liegt das Ma-
9
Die schweren und leichten Löcher resultieren dabei aus den π 2p - und σ2p -Bindungen zwischen den
beteiligten 2p-Orbitalen. Da der Überlapp bei der σ2p -Bindung größer ist, resultiert gemäß dem
Tight-Binding-Modell eine größere Bandbreite und damit größere Banddispersion, woraus sich
eine geringere effektive Masse ergibt.
10.1 Grundlegende Eigenschaften 493
6
4
2
Energielücke
0
Energie (eV)
-2
Ga
-4
-6 As Abb. 10.3: Berechnete Band-
GaAs strukturen von GaAs (nach
-8 J. R. Chelikowski und M. L. Co-
-10 hen, Phys. Rev. B 14, 556 (1976)).
Die vier Valenzbänder (unteres
-12 sp3 -Subband) sind farbig hinter-
L G X U,K G legt. Rechts ist die Zinkblende-
Wellenvektor struktur von GaAs gezeigt.
ximum des Valenzbandes genauso wie das Minimum des Leitungsbandes beim Γ-Punkt.
Ähnlich zu Si und Ge besitzt GaAs auch drei Valenzbänder ähnlicher Form mit den effekti-
ven Massen m∗lh = 0.08 m, m∗hh = 0.51 m und m∗soh = 0.14 m sowie der Spin-Bahn-Aufspal-
tung ∆ = 0.34 eV. Die effektive Masse der Elektronen im Leitungsband beträgt m∗e = 0.063 m.
gelten. Hierbei ist ∆k die Wellenvektordifferenz der beteiligten Zustände im Valenz- und Lei-
tungsband. Wegen des sehr kleinen Wellenvektors k γ = ω⇑c von Photonen muss für Über-
gänge, an denen nur Photonen beteiligt sind, ∆k sehr klein sein. Solche Übergänge müssen
im E(k) Diagramm quasi vertikal verlaufen. Übergänge mit größeren ∆k sind nur durch
die Beteiligung von weiteren Anregungen wie z. B. Phononen möglich. Da üblicherweise
𝑬 𝑬
Abb. 10.4: Schematische Darstellung
ℏΩ CB
von Interbandübergängen zwischen
𝑬𝒄 CB 𝑬𝒄
ℏΩ Valenzbandmaximum und Leitungs-
ℏΩ bandminimum in indirekten Halblei-
ℏΩ
tern bei (a) Emission und (b) Absorp-
𝑬𝑽 𝒒 𝑬𝑽 𝒒 tion eines Phonons mit Energie ħΩ
VB VB und Wellenvektor q. Der Wellenvektor
(a) 𝒌 (b) 𝒌 des Photons wurde vernachlässigt.
494 10 Halbleiter
(a) 4
InSb T = 300 K (b) 6 Si
10 T=5K 10
Absorptionskoeffizient (cm )
Absorptionskoeffizient (cm )
-1
-1
5
E 10 E
3
T = 300 K
10 4
10
T = 77 K
Ex 3
2 EL
10
10 Eg EG 1
X G L 2 Ex Eg G
10 X
[100] hh [111] D
D [100] [111]
lh 1 hh
1
10 10 lh
soh soh
0
10
0.2 0.4 0.6 0.8 1 2 4 6 8 10
Energie ћ (eV) Energie ћ (eV)
Abb. 10.5: (a) Schematische Bandstruktur und optische Absorption des direkten Halbleiters InSb bei 5
und 300 K. Der rote Pfeil markiert den Übergang mit kleinstmöglicher Energie. Bei höherer Photonen-
energie können auch höher liegende Elektronenzustände angeregt werden (gestrichelte Pfeile). Quelle:
E. J. Johnson, Semiconductors and Semimetals, R. K. Willardson und A. C. Beer, eds., Academic Press,
N. Y., Vol. 3, 153–258 (1967). (b) Schematische Bandstruktur und optische Absorption des indirekten
Halbleiters Si bei 77 und 300 K. Der rote Pfeil markiert wiederum den Übergang mit kleinstmöglicher
Energie, der allerdings nur unter der Beteiligung eines Phonons möglich ist. Die schwache indirekte
Absorption setzt bei ħω = E g − ħΩ ein und ist der bei höheren Photonenenergien (gestrichelte Pfeile)
möglichen, viel stärkeren direkten Absorption vorgelagert. Quelle: S. M. Sze, Physics of Semiconductor
Devices, John Wiley and Sons, N. Y. (1981).
die Phononenenergie ħΩ ≪ ħω und der Phononenimpuls ⋃︀q⋃︀ ≫ ⋃︀k⋃︀, liefert dabei das Pho-
ton die Energie und das Phonon den Impuls. Optische Übergänge in indirekten Halbleitern
mit Absorption und Emission eines Phonons sind in Abb. 10.4 schematisch dargestellt.
Abb. 10.5 zeigt typische Absorptionsspektren eines direkten (InSb) und indirekten Halblei-
ters (Si). Der Absorptionskoeffizient ist hierbei durch α = −I −1 (dI⇑dx) gegeben, also als die
relative Schwächung einer Lichtwelle mit Intensität I beim Durchlaufen eines Mediums in
x-Richtung. Bei direkten Halbleitern ist die Situation einfach. Da die Unterkante des Lei-
tungsbandes hier beim selben Wellenvektor wie die Oberkante des Valenzbandes liegt, sind
vertikale Übergänge ohne Beteiligung von Phononen möglich, sobald die Photonenener-
gie ħω ≥ E g wird. Die Absorption steigt deshalb bei ħω = E g stark an. Halbleiter sind des-
halb für Frequenzen ω ≤ E g ⇑ħ, die für viele Halbleiter im nahen Infraroten liegen, trans-
parent. Durch Messung der optischen Absorption als Funktion der Photonenenergie (siehe
Abb. 10.5a) kann der Wert der Energielücke einfach bestimmt werden. Bei höheren Tempe-
raturen steigt die Absorption an, da jetzt Prozesse unter Absorption eines Phonons häufiger
werden. Diese setzen bereits bei der Photonenenergie ħω = E g − ħΩ q ein.
Bei indirekten Halbleitern (siehe Abb. 10.4 und 10.5b) ist die Situation etwas komplizier-
ter. Da sich die Wellenvektoren für die Oberkante des Valenzbandes und die Unterkante des
Leitungsbandes um ∆k unterscheiden, ist für Übergänge zwischen diesen Bereichen zur Im-
pulserhaltung jetzt die Mitwirkung eines Phonons notwendig. Dies kann prinzipiell durch
Absorption oder Emission eines Phonons erfolgen. Führt man allerdings eine Absorptions-
messung bei tiefen Temperaturen durch, so sind aufgrund des Ausfrierens der Phononen
10.1 Grundlegende Eigenschaften 495
fast nur Phononenemissionsprozesse möglich. Das absorbierte Photon muss also zusätz-
lich zur Energie E g noch die Energie ħΩ zur Erzeugung des Phonons liefern. Die opti-
sche Absorption setzt deshalb nicht wie bei direkten Halbleitern bei ħω = E g , sondern erst
bei ħω = E g + ħΩ ein. Ferner ist die Absorptionsstärke im Vergleich zu direkten Halblei-
tern stark reduziert. Dies liegt an der reduzierten Wahrscheinlichkeit des jetzt notwendigen
Dreiteilchenprozesses. Dies ist in Abb. 10.5b gezeigt. Der Absorptionskoeffizient ist oberhalb
von ħω = E g + ħΩ zunächst klein und steigt erst dann stark an, wenn die Photonenenergie
ausreicht, um vertikale Übergänge ohne Beteiligung eines Phonons zu ermöglichen. Bei Si
ist dies bei ħω = E Γ1 = 3.4 eV der Fall. Bei höheren Temperaturen werden Prozesse unter Ab-
sorption eines Phonons häufiger. Diese setzen bereits bei der Photonenenergie ħω = E g − ħΩ
ein und erhöhen den Absorptionskoeffizienten. Für Übergänge vom Γ-Punkt zum X-Punkt
werden Phononen mit dem Wellenvektor q 0 benötigt. In der Nähe von q 0 verläuft die Di-
spersionskurve der in Frage kommenden transversal-akustisch (TA) und transversal-opti-
schen (TO) Phononen sehr flach, so dass ihre Energie in etwa konstant ist (TA: 18.7 meV,
TO: 58.1 meV).
Zur quantitativen Erklärung des Absorptionskoeffizienten müssen nach Fermis goldener Re-
gel die Übergangsmatrixelemente und die Zustandsdichten der Anfangs- und Endzustän-
de bekannt sein (vergleiche hierzu Abschnitt 11.6.4). Bei direkten Übergängen werden we-
gen k γ ≃ 0 Anfangs- und Endzustände mit quasi gleichem k-Wert verbunden, so dass
1 1 ħ2 k 2 ħ2 k 2
∆E i,f = ħω ≃ E c (k) − E v (k) = ( + ) = (10.1.8)
m∗e m∗h 2 2m∗komb
gilt. Hierbei ist m∗komb die so genannte kombinierte effektive Masse und wir können ∆E i,f (k)
als kombinierte Bandstruktur für den optischen Übergang betrachten, der wir die kombi-
nierte Zustandsdichte [vergleiche hierzu (7.1.18) sowie (10.1.15) und (10.1.16)]
V 2m∗komb
3⇑2
⌈︂
D komb (∆E i,f ) = ( ) ∆E i,f − E g (10.1.9)
2π 2 ħ2
zuordnen können. Wir erwarten deshalb einen in etwa wurzelförmigen Verlauf
⌉︂
α ∝ (m∗komb ) ħω − E g
3⇑2
(10.1.10)
des Absorptionskoeffizienten.
Bei indirekten Übergängen ist die Situation schwieriger, da hier über alle Zustände im
Valenz- und Leitungsband aufsummiert werden muss, die unter Phononenbeteiligung
mit ħω verbunden werden können. Im Allgemeinen ergibt sich ein quadratischer Ver-
lauf α ∝ (ħω − ħΩ − E g )2 , der sich aus der Faltung der Zustandsdichten der möglichen
Anfangs- und Endzustände ergibt. Eine weitergehende Diskussion der optischen Ei-
genschaften von Halbleitern erfolgt in Abschnitt 11.6.4 im Rahmen der Diskussion der
dielektrischen Eigenschaften von Festkörpern.
10.1.2.3 Zyklotron-Resonanz
Die effektiven Massen von Halbleitern können mit Hilfe der Zyklotron-Resonanz (siehe Ab-
schnitt 9.11.3) bestimmt werden. Hierzu wird eine Halbleiterprobe in ein statisches magne-
496 10 Halbleiter
tisches Feld gebracht und mit einem dazu senkrechten elektrischen Hochfrequenzfeld ange-
regt (siehe Abb. 10.6). Die Zyklotronresonanz tritt genau dann auf, wenn die Umlauffrequenz
der Ladungsträger um das statische Magnetfeld, d. h. die Zyklotronfrequenz ω c = eB⇑m c ,
mit der Frequenz des elektrischen Feldes übereinstimmt. Hierbei ist m c die Zyklotronmas-
se [vergleiche (9.2.31)]. Typischerweise liegen die Resonanzfrequenzen bei Magnetfeldern
von einigen 100 Gauss im Bereich von einigen GHz. Quantenmechanisch können wir uns
die Resonanzabsorption durch die Erzeugung von elektrischen Dipolübergängen zwischen
benachbarten Landau-Niveaus mit der Auswahlregel ∆n = ±1 vorstellen. Diese Übergänge
sollten nicht mit der Resonanzabsorption von magnetischen Dipolen in der Elektronenspin-
resonanz verwechselt werden. Hier werden Übergänge durch Umklappen der Spinrichtung
erzeugt.
Um die Zyklotronresonanz beobachten zu können, muss ferner ω c τ ≫ 1 gelten. Das heißt,
die Ladungsträger müssen innerhalb der Streuzeit mehrere Umläufe ausführen können. Dies
erreicht man durch Verwendung reiner Proben und tiefer Temperaturen. Da bei tiefen Tem-
peraturen allerdings nur ganz wenige bewegliche Ladungsträger vorhanden sind, müssen
diese durch Bestrahlung mit Licht (ħω ≥ E g ) erzeugt werden. Im Gegensatz zu Metallen
ist die Skin-Eindringtiefe des Hochfrequenzfeldes in Halbleitern aufgrund deren wesentlich
Elektronen
(a) Elektronen- f = 24 GHz
𝑩𝒛
orbit Si
T=4K
schwere Löcher
𝝎𝒄 = 𝒆𝑩/𝒎𝒄
Elektronen
leichte Löcher
Absorption
𝑬𝐫𝐟
schwere Löcher
Elektronen
𝑛=3
Elektronen
𝑛=2
Absorption
ℏ𝝎𝒄
leichte Löcher
𝑛=1
𝑛=0
det m∗ 1⇑2
mc = ( ) . (10.1.11)
m zz
Mit Hilfe der Eigenwerte und Hauptachsen des effektive Massetensors kann dies als
⟨
}︂ ⧸︂ cos2 θ sin2 θ −1
mc =
m1 m2 m3
= ⧸︂
⟩( + ) (10.1.12)
⧹︂2 m 1 + B
B ⧹︂2 m 2 + B
⧹︂2 m 3 m 2t mt ml
1 2 3
geschrieben werden. Hierbei sind B ⧹︂i die Komponenten des Einheitvektors in Feldrichtung
entlang der drei Hauptachsen. Das zweite Gleichheitszeichen gilt für Materialien, für die
die effektive Masse in einer Ebene senkrecht zu einer (longitudinalen) Hauptachsenrich-
tung gleich ist. Der Winkel θ ist dabei der Winkel zwischen der Magnetfeldrichtung und der
longitudinalen Hauptachse.
10.1.2.4 Ladungsträgerdichte
Wir bezeichnen Halbleiter als intrinsisch, wenn freie Elektronen und Löcher nur durch An-
regungen vom Valenzband ins Leitungsband erzeugt werden können. Wir wollen nun für
intrinsische Halbleiter die Dichte n c der Elektronen im Leitungsband und die Dichte pv der
Löcher im Valenzband ableiten. Diese Größen sind für die elektrischen Transporteigenschaf-
ten von Halbleitern von zentraler Bedeutung.
Wie in jedem Festkörper gehorcht die Besetzungswahrscheinlichkeit der elektronischen Zu-
stände in einem Halbleiter der Fermi-Statistik f (E, T), so dass wir schreiben können:
∞
1
nc = ∫ D c (E) f (E, T)dE (10.1.13)
V
Ec
Ev
1
pv = ∫ Dv (E)(︀1 − f (E, T)⌋︀dE . (10.1.14)
V
−∞
Hierbei sind Dv (E) und D c (E) die Zustandsdichten der Löcher im Valenzband und der
Elektronen im Leitungsband. In der Nähe der Bandkante können wir die Bandstruktur gut
durch eine Parabel annähern und erhalten [vergleiche (7.1.18)]
V 2m∗
3⇑2
⌈︂
D c (E) = 2 ( e,DOS ) E − Ec (E ≥ E c ) (10.1.15)
2π ħ2
∗
V 2m h,DOS
3⇑2
⌈︂
Dv (E) = ( ) Ev − E (E ≤ E v ) . (10.1.16)
2π 2 ħ2
498 10 Halbleiter
Die Zustandsdichte im Bereich der Energielücke, E v < E < E c ist natürlich null. Hierbei
sind m∗e und m∗h die Zustandsdichtemassen des Leitungs- und Valenzbandes, die in die
Berechnung der jeweiligen Zustandsdichten einfließen. Um die Form des isotropen Falls
beibehalten zu können, definieren wir die effektive Zustandsdichtemasse als
m∗DOS = p2⇑3 (m∗1 m∗2 m∗3 )
1⇑3
, (10.1.17)
wobei der Entartungsfaktor p die Zahl der äquivalenten Bandminima bzw. -maxima angibt
und m∗i die Eigenwerte des effektive Massetensors für die Elektronen und Löcher sind.
Für das Leitungsband ist p = 6 bzw. 4 für Si bzw. Ge, woraus sich m∗e,DOS = 1.08m e für
Si und m∗e,DOS = 0.55m e für Ge ergibt. Die Zustandsdichten der Valenzbänder (hh, l h,
soh) addieren sich, woraus sich m∗h,DOS 3⇑2 = m∗hh 3⇑2 + m∗lh 3⇑2 + m∗soh 3⇑2 ergibt. Wir erhalten
dann m∗h,DOS = 0.65m e für Si und m∗h,DOS = 0.34m e für Ge. Für Ge haben wir dabei nur
den Beitrag der hh- und l h-Bänder berücksichtigt. Das soh-Band kann meist vernachläs-
sigt werden, da es relativ weit (im Vergleich zu k B T bei Raumtemperatur) unterhalb der
Valenzbandkante liegt.
In einem intrinsischen Halbleiter stammen alle freien Elektronen im Leitungsband aus dem
Valenzband. Deshalb muss die Zahl der Elektronen im Leitungsband und die der Löcher im
Valenzband immer exakt gleich sein. Zur Veranschaulichung ist dies in Abb. 10.7 skizziert.
Falls die effektiven Zustandsdichtemassen der Elektronen und Löcher und damit ihre Zu-
standsdichten gleich sind, so liegt das chemische Potenzial µ in der Mitte der Energielücke.
Falls aber z. B. die Zustandsdichte der Elektronen im Leitungsband kleiner ist, so verschiebt
sich das chemische Potenzial in Richtung Leitungsbandkante, so dass die Besetzungsintegra-
le (10.1.13) und (10.1.14) gleich sind. Wir werden weiter unten den genauen Zusammenhang
zwischen µ und den effektiven Massen herleiten.
Da die Temperaturverschmierung der Fermi-Funktion (≈ 2k B T) üblicherweise klein gegen
die Energielücke E g des Halbleiters ist, können wir f (E, T) innerhalb des Valenzbandes und
(a) 𝑬 𝑬 (b) 𝑬 𝑬
𝑫𝒄 𝑬
𝑫𝒄 𝑬
𝑫𝒄 𝑬 𝒇 𝑬 𝑫𝒄 𝑬 𝒇 𝑬
𝑬𝒄 𝑬𝒄
𝝁
𝝁 𝒇 𝑬
𝒇 𝑬
𝑬𝑽 𝑬𝑽
𝑫𝑽 𝑬 𝟏 − 𝒇 𝑬 𝑫𝑽 𝑬 𝟏 − 𝒇 𝑬
𝑫𝑽 𝑬 𝑫𝑽 𝑬
𝑫 𝑬 ,𝒇 𝑬 𝒅𝒏/𝒅𝑬 𝑫 𝑬 ,𝒇 𝑬 𝒅𝒏/𝒅𝑬
𝒅𝒑/𝒅𝑬 𝒅𝒑/𝒅𝑬
Abb. 10.7: Fermi-Funktion, Zustandsdichten sowie Elektronen- und Löcherkonzentrationen für einen
intrinsischen Halbleiter für (a) Dv = D c und (b) Dv ≠ D c .
29
10.1 Grundlegende Eigenschaften 499
m∗e,DOS k B T
3⇑2
nc = 2 ( ) e−(E c −µ)⇑k B T = n eff
c e
−(E c −µ)⇑k B T
. (10.1.22)
2πħ 2
In analoger Weise erhalten wir für die Dichte der Löcher im Valenzband
m∗h,DOS k B T
3⇑2
pv = 2 ( ) e−(µ−E v )⇑k B T = peff
v e
−(µ−E v )⇑k B T
. (10.1.23)
2πħ 2
Die nur schwach temperaturabhängigen Faktoren vor den Exponentialfaktoren werden üb-
licherweise als effektive Ladungsträgerdichten n eff eff
c und p v bezeichnet. Lassen wir deren
Temperaturabhängigkeit außer Acht, so können wir (10.1.22) und (10.1.23) als Besetzungs-
dichten von zwei Energieniveaus interpretieren, die vom chemischen Potenzial die Abstän-
de E c − µ bzw. µ − E v haben.
Wir können jetzt die Tatsache n c = pv benutzten, um den Verlauf des chemischen Potenzials
zu bestimmen. Mit Hilfe von (10.1.22) und (10.1.23) erhalten wir:
1 3 m∗
µ = E v + E g + k B T ln h,DOS . (10.1.24)
2 4 m∗e,DOS
Wir sehen also, dass für m∗h,DOS = m∗e,DOS das chemische Potenzial genau in der Mitte zwi-
schen Valenz- und Leitungsbandkante liegt. Mit Gleichung (10.1.24) könnten wir nun das
chemische Potenzial aus (10.1.22) und (10.1.23) eliminieren. Wir erreichen dies aber auch
500 10 Halbleiter
einfach dadurch, dass wir die Ausdrücke für n c und pv miteinander multiplizieren. Wir er-
halten dadurch
kB T 3 ∗
n c ⋅ pv = 4 ( ) (m e,DOS m∗h,DOS )3⇑2 e−E g ⇑k B T . (10.1.25)
2πħ 2
Dieses Ergebnis entspricht dem Massenwirkungsgesetz der chemischen Reaktionskinetik.10
Bei seiner Herleitung müssen wir keinen Gebrauch von der Bedingung n c = pv machen. Wir
können diesen Ausdruck deshalb auch später bei der Diskussion der Störstellenleitung in do-
tierten Halbleitern benutzen. Eine direkte Folge aus dem Massenwirkungsgesetz (10.1.25) ist,
dass wegen n c ⋅ pv = const bei einer Änderung von n c (z. B. durch Dotierung) sich auch pv
ändern muss. Wichtig ist, dass dabei zwar n c ⋅ pv = const, sich aber n c + pv ändert. Da wir
wegen n c ⋅ pv = C für die Summe n c + pv = n c + C⇑n c erhalten, sehen wir durch Ableiten
dieses Ausdrucks sofort, dass n c + pv für n 2c = C und damit n c = pv minimal wird.
15 14 13
10 10 10
Ge Si 12
GaAs
14 10
10 13
10
11
10
Ladungsträgerdichte (cm )
-3
13
10
12
10 10
10
12
10
9
11 10
10
11
10
8
10
10
10
10
10 7
10
9 9 6
10 10 10
200 250 300 350 300 350 400 450 300 350 400 450
Abb. 10.8: Temperaturabhängigkeit der intrinsischen Ladungsträgerdichte von Si, Ge und GaAs.
10
Um die Analogie zu einer chemischen Reaktionsgleichung zu verdeutlichen, können wir die Ra-
tengleichung für die Wechselwirkung eines intrinsischen Halbleiters mit dem Photonenfeld eines
schwarzen Strahlers der Temperatur T betrachten. Die zeitliche Änderung der Dichten n c und pv
der Elektronen im Leitungs- und der Löcher im Valenzband erfolgt durch eine Generationsra-
te A(T) und eine Rekombinationsrate B(T) n c ⋅ pv . Das heißt, im Gleichgewicht können wir für
die Reaktionsgleichung schreiben
dn c d pv
= A(T) − B(T)n c ⋅ pv = =0
dt dt
und damit
A(T)
n c ⋅ pv = = const = h(T) .
B(T)
10.1 Grundlegende Eigenschaften 501
⌋︂ k B T 3⇑2 ∗
ni = n c pv = 2 ( ) (m e,DOS m∗h,DOS )3⇑4 e−E g ⇑2k B T . (10.1.26)
2πħ 2
Der Verlauf der intrinsischen Ladungsträgerdichte ist in Abb. 10.8 für Si, Ge und
GaAs dargestellt. Bei Raumtemperatur beträgt die intrinsische Ladungsträgerdichte von
Ge (E g = 0.67 eV) 2.4 × 1013 cm−3 , für Si (E g = 1.12 eV) 1.5 × 1010 cm−3 und für GaAs
(E g = 1.42 eV) 5 × 107 cm−3 .
me e4 1
E nH = . (10.1.27)
2(4πє 0 ħ)2 n 2
502 10 Halbleiter
Für den Grundzustand (n = 1) beträgt die Ionisierungsenergie 13.6 eV. Um von den Ener-
gietermen des Wasserstoffatoms zu denjenigen des Donatoratoms zu gelangen müssen wir
die freie Elektronenmasse m e durch die effektive Bandmasse m∗e eines Elektrons im Lei-
tungsband ersetzen. Ferner müssen wir die Abschirmung des Coulomb-Potenzials durch die
umgebenden Si-Atome berücksichtigen, indem wir im Ausdruck für die Energieniveaus des
Wasserstoffatoms die Dielektrizitätskonstante є des Halbleitermaterials einsetzen. Es ergibt
sich dann
m∗e e 4 1 m∗e H
En = = E . (10.1.28)
2
2(4πєє 0 ħ) n 2 m e є2 n
Für Si erhalten wir mit m∗e = (m∗et 2 m el )1⇑3 ≃ 0.3m e und є Si = 11.7 eine Ionisierungsener-
gie von E 1 ∼ 30 meV. Das heißt, der Donatorzustand E D befindet sich nur E d = E c − E D ≃
30 meV unterhalb der Leitungsbandkante, die wir mit dem Vakuumniveau des Wasserstoff-
atoms identifizieren. Da E d in der Größenordnung der thermischen Energie bei Raum-
temperatur (∼ 25 meV) liegt, kann der Donatorzustand leicht thermisch ionisiert werden.
Für Ge ist m∗e = (m∗et 2 m el )1⇑3 ≃ 0.2m e und є Ge = 15.8, so dass hier die Ionisierungsenergie
mit E 1 ∼ 10 meV noch kleiner ist.
In Abb. 10.9 ist die Bandstruktur von Si schematisch zusammen mit dem Grundzustands-
niveau (n = 1) des Donatoratoms gezeigt. Zwischen dem Grundzustand und der Unterkante
des Leitungsbandes befinden sich die angeregten Zustände (n > 1) des Donatoratoms, deren
Abstände mit zunehmender Quantenzahl stark abnehmen. Die Energieniveaus der angereg-
ten Zustände können z. B. mit optischer Spektroskopie bestimmt werden. Tut man dies, so
erkennt man, dass die Energieniveaus doch erheblich von denjenigen eines Wasserstoffspek-
trums abweichen. Dies wird durch das so genannte Kristallfeld der umgebenden Si-Atome
verursacht, das zu einer Aufhebung der Entartung der wasserstoffähnlichen Zustände führt.
Wir können mit Hilfe des Wasserstoffmodells eines Donatoratoms auch den Bohrschen Ra-
dius berechnen. In Analogie zum Wasserstoffatom erhalten wir
4πєє 0 ħ 2
rd = . (10.1.29)
m∗e e 2
(a) Si Si Si Si Si Si Si Si (b)
Si Si Si Si Si Si Si Si
Abb. 10.9: (a) Schematische e- Leitungsband
Darstellung der Wirkung Si Si Si Si Si Si Si Si
eines Phosphor-Atoms in 𝑬𝒅 𝑬𝒄
einem Si-Kristall. (b) La- Si Si Si P+ Si Si Si Si 𝑬𝑫
ge des Energieniveaus für 𝑬𝒈
Si Si Si Si Si Si Si Si
den Grundzustand des
Donatoratoms. E d ist die Si Si Si Si Si Si Si Si 𝑬𝑽
Ionisierungsenergie, die
Valenzband
aufgebracht werden muss, Si Si Si Si Si Si Si Si
um den Donatorzustand ins
Leitungsband anzuregen. Si Si Si Si Si Si Si Si
35
10.1 Grundlegende Eigenschaften 503
Wir sehen, dass der Bohrsche Radius des Donatorzustands um den Faktor єm e ⇑m∗e größer
als der Bohrsche Radius a B = 0.525 Å eines Wasserstoffatoms ist. Er beträgt für Si etwa 30 Å
und ist damit wesentlich größer als der Atomabstand der Siliziumatome von 2.35 Å. Das
bedeutet, dass das an das Donatoratom gebundene Elektron mehr als 10 Gitterabstände aus-
geschmiert ist. Dies rechtfertigt die Verwendung der Dielektrizitätskonstante von Silizium
zur Berücksichtigung der Abschirmung.
Verwenden wir als Verunreinigungsatom in einem Si oder Ge-Kristall ein dreiwertiges Ele-
ment wie z. B. B, Al, Ga oder In, so fehlt diesem für die tetraedrische Bindung ein Elektron.
Das heißt, das Dotieratom kann sehr einfach ein Elektron aufnehmen, das dann in seiner
Umgebung fehlt. Dieses fehlende Elektron können wir formal als Loch beschreiben, welches
das einfach negativ geladene Akzeptoratom umkreist. Dies ist in Abb. 10.10 schematisch
dargestellt.
(a) Si Si Si Si Si Si Si Si (b)
Si Si Si Si Si Si Si Si
e+ Leitungsband
Abb. 10.10: (a) Schemati-
Si Si Si Si Si Si Si Si sche Darstellung der Wir-
𝑬𝒄 kung eines Bor-Atoms in
Si Si Si B- Si Si Si Si einem Si-Kristall. (b) La-
𝑬𝒈 ge des Energieniveaus für
Si Si Si Si Si Si Si Si
𝑬𝑨 den Grundzustand des
𝑬𝒂
Si Si Si Si Si Si Si Si 𝑬𝑽 Akzeptoratoms. E a ist die
Ionisierungsenergie, die auf-
Valenzband
Si Si Si Si Si Si Si Si gebracht werden muss, um
den Akzeptorzustand ins
Si Si Si Si Si Si Si Si Valenzband anzuregen.
Die Beschreibung der Akzeptorniveaus können wir unter Verwendung des Lochkonzepts
formal gleich vornehmen. Wir müssen nur in Gleichung (10.1.28) die effektive Masse m∗h
eines Lochs im Valenzband verwenden. Eine Ionisierung des Akzeptoratoms
36 ist gleichbe-
deutend mit der Freisetzung eines Loches. Hierzu muss ein Elektron aus dem Valenzband
in ein Akzeptorniveau E A angehoben werden. Das Akzeptorniveau liegt also oberhalb der
Valenzbandkante, wobei sein Abstand von dieser Kante gerade der Ionisierungsenergie E a
entspricht (siehe Abb. 10.10). Der Wert von E a liegt in der gleichen Größenordnung wie der
von E d . In Tabelle 10.4 sind die Ionisierungsenergien einiger Donator- und Akzeptoratome
für Si und Ge zusammengestellt.
Tabelle 10.4: Ionisierungsenergien E d und E a einiger Donatoren und Akzeptoren in Si und Ge. Quelle:
Handbook Series on Semiconductor Parameters, Vol. 1 and 2, edited by M. Levinstein, S. Rumyantsev
and M. Shur, World Scientific, London (1996, 1999).
Enthält ein Halbleiter sowohl Donatoren als auch Akzeptoren, so kann das Elektron eines
Donators zu einem Akzeptor wandern und dort das fehlende Elektron ersetzen. Dadurch
heben sich die Wirkung von Donatoren und Akzeptoren gegenseitig auf, wir sprechen von
kompensierten Halbleitern. Überwiegt die Anzahl der Donatoren, so sprechen wir von ei-
nem n-Halbleiter, überwiegen die Akzeptoren, so sprechen wir von einem p-Halbleiter.
in der das chemische Potenzial µ nicht mehr auftaucht. Im Gegensatz zu intrinsischen Halb-
leitern können wir jetzt aber die Lage des chemischen Potenzials nicht mehr durch die ein-
fache Neutralitätsbedingung n c = pv herleiten, sondern müssen eine kompliziertere Bedin-
gung verwenden, die die Ladung der Verunreinigungen mit berücksichtigt.
Die Dichte der Donatoren lässt sich als
n D = n 0D + n+D (10.1.31)
schreiben, wobei n 0D die Dichte der neutralen und n+D diejenige der ionisierten Donatoren
ist. Äquivalent gilt für die Akzeptoren
n A = n 0A + n−A . (10.1.32)
Um diese Neutralitätsbedingung für die Bestimmung der Lage des chemischen Potenzials
verwenden zu können, benötigen wir noch Ausdrücke für n−A und n+D .
Die Wahrscheinlichkeit dafür, dass eine Störstelle nicht ionisiert ist, das heißt, die Wahr-
scheinlichkeit n 0D ⇑n D bzw. n 0A ⇑n A dafür, dass sie als neutrale Störstelle vorliegt, können wir
mit Hilfe der Fermi-Dirac-Verteilung angeben:
n 0D 1
= 2 (E −µ)⇑k T (10.1.34)
nD e D B +1
n 0A 1
= 4 (µ−E )⇑k T . (10.1.35)
nA e A B +1
10.1 Grundlegende Eigenschaften 505
Hierbei berücksichtigt der Faktor 2 der rechten Seite die zweifache Spin-Entartung des Do-
natorzustands, d. h. effektiv liegt die Donatordichte 2n D vor. Der Faktor 4 resultiert aus den
beiden hh- und l h-Valenzbandzuständen mit jeweils zweifacher Spin-Entartung, aus de-
nen die Akzeptorzustände aufgebaut sind, d. h. effektiv liegt die Akzeptordichte 4n A vor. Bei
der nachfolgenden Abschätzung vernachlässigen wir diese zusätzlichen Faktoren. Mit Hil-
fe von (10.1.34) und (10.1.35) können wir aus (10.1.31) und (10.1.32) Ausdrücke für n+D
und n−A ableiten und in die Neutralitätsbedingung (10.1.33) einsetzen. Wir erhalten dadurch
eine Bestimmungsgleichung für µ, die allerdings bei gleichzeitiger Berücksichtigung von
Donatoren und Akzeptoren nur numerisch lösbar ist.
Wir beschränken uns hier auf die Diskussion eines n-Halbleiters mit n D ≫ n A . Entsprechen-
de Ergebnisse können in analoger Weise für p-Halbleiter erhalten werden. Für n D ≫ n A fan-
gen alle Akzeptoren ein Elektron ein, das ursprünglich zu einem Donator gehörte. Das heißt,
es kommen praktisch keine neutralen Akzeptoren vor, so dass wir n 0A ≃ 0 und n−A ≃ n A set-
zen können. Außerdem soll die Temperatur so niedrig sein, dass wir die Zahl der Elektronen,
die aus dem Valenzband ins Leitungsband angeregt werden, gegenüber den durch Ionisie-
rung von Donatoratomen erzeugten Elektronen vernachlässigen können, d.h n+D ≫ n c , pv .
Aus (10.1.33) folgt dann
n c = pv + n+D − n−A ≃ n+D − n A = n D − n 0D − n A . (10.1.36)
Benutzen wir jetzt noch (10.1.34), so erhalten wir
1
n c ≃ n D (1 − ) − nA . (10.1.37)
e(E D −µ)⇑k B T +1
Durch Umformen von
m∗e k B T 3⇑2 −(E c −µ)⇑k B T −(E c −µ)⇑k B T
nc = 2 ( ) e = n eff
c e (10.1.38)
2πħ 2
erhalten wir
n c E c ⇑k B T
e = e µ⇑k B T (10.1.39)
n eff
c
und können damit in (10.1.37) das chemische Potenzial eliminieren. Wir erhalten
nc nD
n c ≃ n D (1 − −E d ⇑k B T + n
) − nA = n c E d ⇑k B T − n A . (10.1.40)
n eff
c e c 1 + n eff
e
c
Hierbei haben wir den Abstand E d = E c − E D des Donatorniveaus vom Leitungsband be-
nutzt. Durch weiteres Umformen von (10.1.40) erhalten wir das Ergebnis
n c (n c + n A ) −E d ⇑k B T
= n eff
c e , (10.1.41)
nD − nA − nc
aus dem wir den Temperaturverlauf von n c bestimmen können. Für eine verschwindend
kleine Akzeptorkonzentration n A ergibt sich näherungsweise die quadratische Gleichung
n 2c E d ⇑k B T
e + nc − nD ≃ 0 (10.1.42)
n eff
c
506 10 Halbleiter
Wir wollen im Folgenden die physikalische Bedeutung von (10.1.41) für verschiedene Tem-
peraturbereich diskutieren.
n D n eff
nc ≃ c
e−E d ⇑k B T . (10.1.44)
nA
Setzen wir dies in (10.1.39) ein, so erhalten wir für die Lage des chemischen Potenzials
nD
µ ≃ E c − E d + k B T ln ( ). (10.1.45)
nA
Wir sehen, dass für T → 0 die Lage von µ durch die Donatoren bestimmt wird. Durch die
endliche Akzeptordichte werden alle von den Donatoren abgegebenen Elektronen von
den Akzeptoren aufgenommen. Wir sprechen von einem Kompensationseffekt. Da mit
zunehmender Temperatur die Donatoren auch Ladungsträger ins Leitungsband abgeben
können, bewegt sich, wie Abb. 10.11 zeigt, für zunehmende Temperatur µ von E c − E d
nach oben in Richtung Leitungsbandkante. Gleichzeitig nimmt die Ladungsträgerdichte
exponentiell zu.
∎ Tiefe Temperaturen, k B T ≪ E d (Bereich der Störstellenreserve):
Wird die Temperatur weiter erhöht, so können immer mehr Donatoren ihre Ladungs-
träger ins Leitungsband abgeben, so dass schnell n c ≫ n A gilt. Die Temperatur ist aber
immer noch so gering, dass e−E d ⇑k B T ≪ 1 und somit n c ≪ n D . Mit diesen Näherungen
ergibt sich aus (10.1.41)
⌈︂
−E d ⇑2k B T
n c ≃ n D n eff
c e . (10.1.46)
Ed kB T n eff
µ ≃ Ec − − ln ( c ) . (10.1.47)
2 2 nD
Das chemische Potenzial liegt also etwa in der Mitte zwischen Leitungsbandunterkante
und Donatorniveau.
Gleichung (10.1.46) zeigt, dass im Temperaturbereich der Störstellenreserve die thermi-
sche Energie noch nicht ausreicht, um alle Donatoren zu ionisieren. Wie Abb. 10.11 zeigt,
nimmt mit sinkender Temperatur die Ladungsträgerdichte exponentiell ab, wie wir es
schon bei intrinsischen Halbleitern kennen gelernt haben. Wir sprechen von einem Aus-
frieren der Ladungsträger. Allerdings ist im Vergleich zu intrinsischen Halbleitern die
exponentielle Abnahme jetzt durch E d und nicht durch E g bestimmt. Wir sehen ferner,
10.1 Grundlegende Eigenschaften 507
𝒏𝑫
𝒏𝒄 ≃ 𝒏𝑫 𝐥𝐨𝐠 𝒏𝒄 ≃ −𝑬𝒅 /𝟐𝒌𝐁 𝑻
IV III II I
Eigenleitung Störstellenerschöpfung Störstellenreserve Kompensationsbereich
𝟏/𝑻
𝑬
Leitungsband
𝑬𝒄
𝑬𝒅
𝑬𝑫
𝝁 𝑻
𝑬𝒈
≃ 𝑬𝒈 /𝟐
𝑬𝑽
Valenzband
𝟏/𝑻
38
Abb. 10.11: Temperaturverlauf der Ladungsträgerdichte n c und des chemischen Potenzials µ in einem
dotierten n-Typ Halbleiter. Im Bereich I liegt Störstellenkompensation durch eine endliche Akzeptor-
dichte vor, im Bereich II dominiert reine Störstellenleitung, im Bereich III der Störstellenerschöpfung
sind sämtliche Störstellen ionisiert, so dass die Ladungsträgerdichte etwa konstant bleibt, und im Be-
reich IV tritt die Eigenleitung gegenüber der Störstellenleitung in den Vordergrund.
dass (10.1.46) formal dem Ausdruck (10.1.26) für die intrinsische Ladungsträgerdichte
entspricht, wenn wir E g durch E d und die Zustandsdichte im Leitungsband durch n D er-
setzen. Die thermische Anregung von Ladungsträgern direkt vom Valenz- ins Leitungs-
band kann im Bereich der Störstellenreserve vollkommen vernachlässigt werden.
∎ Mittlere Temperaturen, k B T ≳ E d (Bereich der Störstellenerschöpfung):
Bei genügend hohen Temperaturen k B T ≳ E d wird e−E d ⇑k B T ≃ 1 und wir erhalten
mit n c ≫ n A aus (10.1.41) die Beziehung n 2c ≃ n eff
c (n D − n c ). Da n c ≪ n c , folgt wei-
eff
nc ≃ nD (10.1.48)
und
n eff
µ ≃ E c − k B T ln ( c
). (10.1.49)
nD
Das Ergebnis ist einfach zu verstehen. Die Temperatur ist hoch genug, um alle Störstel-
len zu ionisieren, aber noch zu klein, um eine große Zahl von Ladungsträgern aus dem
Valenz- ins Leitungsband anzuregen. Wir sprechen deshalb vom Bereich der Störstellen-
erschöpfung. Das chemische Potenzial bewegt sich mit zunehmender Temperatur nach
unten in Richtung Bandmitte. Es sei hier noch erwähnt, dass sich für Si mit einer Phos-
508 10 Halbleiter
phor-Dotierung von n D = 3 × 1014 cm−3 der Bereich der Störstellenerschöpfung von et-
wa 45 bis 500 K erstreckt. Das heißt, bei Raumtemperatur sind alle Donatoratome ioni-
siert.
∎ Hohe Temperaturen, k B T ≫ E d (Bereich der Eigenleitung):
Wenn wir zu noch höheren Temperaturen gehen, müssen wir natürlich wieder die Dichte
der thermisch direkt aus dem Valenzband ins Leitungsband angeregten Ladungsträger
berücksichtigen, sobald diese in die Größenordnung von n D kommt. Die für (10.1.33)
gemachte Annahme n+D ≫ n c , pv ist dann nicht mehr zulässig.
In dem Bereich sehr hoher Temperaturen verläuft die Temperaturabhängigkeit der
Ladungsträgerdichte wieder wie bei intrinsischen Halbleitern. Es dominiert die Eigen-
leitung. Für die Ladungsträgerdichte und das chemische Potenzial gelten Gleichun-
gen (10.1.22) und (10.1.24).
Jq = e(n c µ e + pv µ p )E = σE (10.1.50)
schreiben können. Im Gegensatz zu Metallen, wo wir nur Elektronen bei der Fermi-Energie
berücksichtigen mussten, für deren Beweglichkeit µ e = µ e (E F ) gilt, sind die Beweglichkei-
ten µ e und µ p in einem Halbleiter die Mittelwerte für die Zustände, die Elektronen und
Löcher im Leitungsband bzw. Valenzband besetzen. Diese Mittelwerte können wie folgt aus-
gedrückt werden:
Streuzeit τ ist, d. h. µ e = eτ e ⇑m∗e bzw. µ h = eτ h ⇑m∗h . Da τ die mittlere Zeit zwischen zwei
Streuprozessen ist, können wir schreiben (vergleiche hierzu Abschnitt 9.3):
1 1
= ∝S. (10.1.52)
ℓ ∐︀ṽ︀τ
Hierbei ist S der Streuquerschnitt eines Streuzentrums für Elektronen bzw. Löcher. Im Ge-
gensatz zu Metallen, wo wir v = v F verwenden können, müssen wir für ∐︀ṽ︀ den thermischen
Mittelwert über alle Elektronen im Leitungsband bzw. Löcher im Valenzband benutzen.13
Gleichung (10.1.52) gibt dann die mittlere freie Weglänge von Elektronen bzw. Löchern an.
Da wir für Halbleiter⌈︂eine Boltzmann-Statistik verwenden dürfen, gilt für die mittlere Ge-
schwindigkeit ∐︀ṽ︀ = 3k B T⇑m∗ und wir erhalten
⌋︂
∐︀ṽ︀ ∝ T . (10.1.53)
Wir wollen im Folgenden verschiedene Streuprozesse diskutieren.
Streuung an akustischen Phononen: Wir beginnen mit der Streuung an akustischen Pho-
nonen. Wir haben in Abschnitt 9.3.2 abgeleitet, dass
S ph ∝ T für T ≫ ΘD . (10.1.54)
Aus (10.1.52) und (10.1.53) erhalten wir dann [vergleiche hierzu (9.3.28)]
µ ph ∝ T −3⇑2 . (10.1.55)
log µ
∝ 𝑻𝟑/𝟐 ∝ 𝑻−𝟑/𝟐
(1)
Si
(2)
2
Abb. 10.13: Temperaturabhän-
(3)
gigkeit der Beweglichkeit der La- 4
10
dungsträger in Si. (1) Hochreines Si,
n D < 1012 cm−3 ; (2) hochreines Si, (4)
n D < 4 × 1013 cm−3 ; (3) n D = 1.75 ×
1016 cm−3 , n A = 1.48 × 1015 cm−3 ; 10
3
Streuung an geladenen Störstellen: Als nächstes wollen wir die Streuung an geladenen
Defekten diskutieren. Solche Defekte sind z.B. ionisierte Donatoren und Akzeptoren. Für
dieses Rutherford-artige Streuproblem erhalten wir14
Mehrere Streuprozesse: Nach der Matthiessen-Regel erhalten wir 1⇑µ tot , indem wir die
reziproken Mobilitäten addieren. Das Ergebnis ist in Abb. 10.12 schematisch dargestellt.
14
Für die Streuung an einer geladenen Störstelle mit Z = 1 erhalten wir den Wirkungsquerschnitt
[vergleiche (9.3.12) und (9.3.14)]
2
e2
σ(v, ϑ) = ( ) sin−4 (ϑ⇑2) ,
2єє 0 m∗ ∐︀ṽ︀2
woraus sich eine vom Streuwinkel ϑ abhängige Streurate 1⇑τ(ϑ) ∝ ∐︀ṽ︀σ(ϑ) ergibt. Die gesamte
Streurate erhalten wir durch Integration über alle Streuwinkel. Das Ergebnis dieser Integration ist
die Conwell-Weißkopf-Formel
⎨ ∗ 2 1⇑3 2 ⎬
1 2n D,A πe 4 ⎝
⎝1 + ( єє 0 m ∐︀ṽ︀ (3⇑4πn D,A ) ) ⎠ .
⎠
τ∝ = ln
µ (єє 0 m∗ )2 ∐︀ṽ︀3 ⎝ ⎝ 2e 2 ⎠
⎠
⎪ ⎮
Hierbei ist n D,A die Dichte der geladenen Donatoren bzw. Akzeptoren.
10.1 Grundlegende Eigenschaften 511
Tabelle 10.5: Beweglichkeiten von einigen Halbleitern bei 300 K. Quelle: Handbook Series on Semicon-
ductor Parameters, Vol. 1 and 2, edited by M. Levinstein, S. Rumyantsev and M. Shur, World Scientific,
London (1996, 1999).
Die Beweglichkeit nimmt bei tiefen Temperaturen mit ansteigender Temperatur zunächst
proportional zu T 3⇑2 zu, durchläuft ein Maximum und nimmt dann proportional zu T −3⇑2
ab. Dies ist am Beispiel von Si in Abb. 10.13 gezeigt. In polaren Halbleitern nimmt die Be-
weglichkeit bei hohen Temperaturen aufgrund der hier dominierenden Streuung an LO-
Phononen deutlich stärker ab. Als weitere Streuprozesse kommen die Streuung an neutralen
Störstellen und die Streuung an transversal-akustischen (TA) Phononen hinzu, die in Vieltal-
Halbleitern wie Si und Ge wichtig ist. Diese sind aber in den meisten Fällen nicht dominant
und werden deshalb hier nicht näher erläutert. Die Beweglichkeiten von einigen Halbleitern
bei 300 K sind in Tabelle 10.5 aufgelistet.
Der in Abb. 10.12 gezeigte charakteristische Verlauf der Beweglichkeit spiegelt sich auch häu-
fig in der elektrischen Leitfähigkeit σ wider, da die Ladungsträgerdichte in dem Bereich der
Ladungsträgersättigung über ein großes Temperaturintervall konstant bleibt. Nur bei sehr
hohen und sehr tiefen Temperaturen dominiert die exponentielle Temperaturabhängigkeit
der Ladungsträgerdichte (vergleiche Abb. 10.11) die Leitfähigkeit.
10.1.5 Hall-Effekt
Bei Halbleitern erfolgt der Ladungstransport sowohl durch die Elektronen im Leitungsband
als auch durch die Löcher im Valenzband. Für den Hall-Koeffizienten müssen wir deshalb
den Zweiband-Ausdruck [vergleiche (9.9.18)]
σ1 emτ11 + σ2 emτ22
RH = . (10.1.58)
(σ1 + σ2 )2
verwenden, den wir in Abschnitt 9.9.2 für ein Zweiband-Modell hergeleitet haben. Hier-
bei müssen wir berücksichtigen, dass die Elektronen die Ladung −e und die Löcher die
Ladung +e transportieren. Unter Benutzung von σ1 = n c e µ e und σ2 = pv e µ h , sowie µ e =
eτ e ⇑m∗e und µ h = eτ h ⇑m∗h erhalten wir den Ausdruck
pv µ 2h − n c µ 2e
RH = . (10.1.59)
e(pv µ h + n c µ e )2
Bei reiner Eigenleitung ist n c = pv = n i und für die Hall-Konstante ergibt sich
1 µh − µe
R H,i = . (10.1.60)
ni e µh + µe
Wir sehen, dass die Hall-Konstante positiv oder negativ sein kann, je nachdem ob µ h > µ e
oder µ h < µ e .
512 10 Halbleiter
∎ Zur Bestimmung der Energielücke E g messen wir R H,i als Funktion der Temperatur im
Bereich hoher Temperaturen, wo die Eigenleitung dominiert. Für die Temperaturabhän-
gigkeit der intrinsischen Ladungsträgerdichte gilt
n i (T) ∝ T 3⇑2 e−E g ⇑2k B T . (10.1.62)
µ h −µ e
Der Term in (10.1.60) zeigt keine Temperaturabhängigkeit, da sich diese durch die
µ h +µ e
Quotientenbildung heraushebt. Wir erhalten dann
Eg 1
ln(⋃︀R H,i ⋃︀T 3⇑2 ) = const + . (10.1.63)
2k B T
Tragen wir also ln(⋃︀R H,i ⋃︀T 3⇑2 ) gegen 1⇑T auf, so erhalten wir eine Gerade mit der Stei-
gung E g ⇑2k B .
∎ Zur Bestimmung der Ionisierungsenergie E d in einem n-Halbleiter mit Hilfe des Hall-
Effekts müssen wir den Hall-Effekt in dem Temperaturbereich messen, der durch das
Ausfrieren der Ladungsträger dominiert wird (Störstellenreserve). Wir dürfen für n c
dann den Ausdruck (10.1.46)
⌈︂
−E d ⇑2k B T
n c ≃ n D n eff
c e ∝ T 3⇑4 e−E d ⇑2k B T (10.1.64)
verwenden und erhalten
Ed 1
ln(⋃︀R H,e ⋃︀T 3⇑4 ) = const + . (10.1.65)
2k B T
Tragen wir wiederum ln(⋃︀R H,e ⋃︀T 3⇑4 ) gegen 1⇑T auf, so erhalten wir eine Gerade mit der
Steigung E d ⇑2k B . Eine analoge Betrachtung gilt für die Bestimmung der Ionisierungs-
energie E a in einem p-Halbleiter.
∎ In einem n-Halbleiter, der keine Akzeptoren enthält, ist in einem weiten Temperatur-
bereich die Ladungsträgerdichte n c = n D = const (Bereich der Störstellenerschöpfung).
Nach (10.1.61) gilt für diesen Bereich dann
1
nD = − . (10.1.66)
R H,e e
Für einen p-Halbleiter ohne Donatoren gilt entsprechend
1
nA = + . (10.1.67)
R H,h e
10.1 Grundlegende Eigenschaften 513
∎ Die Beweglichkeiten µ e und µ h hängen über die Streuzeiten τ e und τ h von der Tempera-
tur ab. Für den Temperaturbereich, in dem reine Eigenleitung vorliegt, erhält man die Be-
weglichkeiten durch eine kombinierte Messung von R H,e bzw. R H,h und σ. Aus (10.1.61)
folgt
µ e = R H,e σ und µ h = R H,h σ , (10.1.68)
Bei reiner Eigenleitung gilt ferner
σ = e(n c µ e + pv µ p ) , (10.1.69)
woraus sich mit Hilfe von (10.1.60) die Beziehung
R H,i σ = µ h − µ e (10.1.70)
ergibt. Um aus den beiden Gleichungen (10.1.69) und (10.1.70) die Beweglichkeiten µ e
und µ h zu berechnen, benötigen wir außer den gemessenen Größen R H,i und σ noch die
Elektronendichte n i bei Eigenleitung. Diese können wir nach (10.1.26) berechnen, wenn
wir neben der Energielücke E g noch die effektiven Massen m∗e und m∗h kennen. Letztere
können z. B. mit Hilfe der Zyklotron-Resonanz bestimmt werden.
Insgesamt sehen wir, dass wir durch Messung der elektrischen Leitfähigkeit und des Hall-
Effekts sowie durch die Bestimmung der effektiven Massen mit Hilfe der Zyklotron-Reso-
nanz alle relevanten Halbleiterparameter wie E g , E a , E d , n D , n A , µ e oder µ h bestimmen
können.
J h = n c (E c − µ + 32 k B T) v e,D (10.1.71)
J h = pv (µ − E v + 32 k B T) v h,D . (10.1.72)
Hierbei sind v h,D = µ h E und v e,D = −µ e E die Driftgeschwindigkeiten der Löcher und Elek-
tronen. Damit erhalten wir mit J h = ΠJq die Peltier-Koeffizienten
E c − µ + 32 k B T
Πe = − (10.1.73)
e
µ − E v + 32 k B T
Πh = + . (10.1.74)
e
514 10 Halbleiter
muss. Diese Anforderung bedeutet, dass die Übergangsbreite im Bereich von 10 nm und
mehr sein darf.
Um die Reaktion eines inhomogenen Halbleiters auf ein äußeres elektrostatisches Potenzial
zu beschreiben oder um einfach die Ladungsverteilung in Abwesenheit eines elektrostati-
schen Potenzials zu berechnen, wird üblicherweise ein semi-klassisches Modell benutzt. Wie
wir in Kapitel 9 ausführlich diskutiert haben, dürfen wir eine semi-klassische Beschreibung
immer dann vornehmen, wenn sich das elektrostatische Potenzial ϕ(r) auf einer Längen-
skala ändert, die groß gegenüber dem Gitterabstand der Atome ist, also groß gegenüber der
Längenskala auf der sich das periodische Potenzial des Festkörpers ändert (vergleiche hierzu
Abschnitt 9.1.2).
(a) 𝑬 𝑬𝒄 𝑬𝒄
p 𝑬𝑫
𝝁 𝝁
𝑬𝑨 n
𝑬𝑽 𝑬𝑽
(b) 𝝓
𝝓 ∞ − 𝝓 −∞ = 𝑽𝑫
𝒙
(c) 𝑬 𝒑
𝑬𝒄 𝒆𝑽𝑫
𝝁 −𝒆𝑽𝒑
p 𝑬𝒈 ++ 𝑬𝒏𝒄
𝑬𝑨 𝑬𝑫
𝒑 −𝒆𝑽𝒏 𝝁
𝑬𝑽 n
𝑬𝒏𝑽
(d) 𝝆 n-Diffusions- oder n-Drift- oder
Rekombinationsstrom Generationsstrom
+
𝒙
p-Drift- oder p-Diffusions- oder
Generationsstrom Rekombinationsstrom
(e) 𝒏−
𝐥𝐨𝐠 𝒏, 𝒑
𝑨
𝒑𝒑 𝒏+
𝑫
𝒏𝒏
𝒏𝒊 𝒏𝒊
𝒏𝒑 𝒑𝒏
𝟎 𝒙 46
Abb. 10.14: Schematische Darstellung eines p-n Übergangs im thermischen Gleichgewicht: (a) Bän-
derschema im p- und n-Halbleiter bei völliger Trennung, (b) Potenzialverlauf und (c) Bandverlauf im
p-n Übergang im thermischen Gleichgewicht nach Herstellung des Kontakts, (d) Verlauf der Raum-
ladungszone ρ(x) im Bereich des p-n Übergangs und (e) qualitativer Verlauf der Konzentration der
Donatoren n+D und Akzeptoren n−A sowie der Elektronen im Leitungsband und Löcher im Valenzband.
Wir nehmen an, dass alle Donatoren und Akzeptoren ionisiert sind, so dass n D = n+D und n A = n−A .
Auf der n-Seite ist VD positiv, so dass die potenzielle Energie der Elektronen auf der n-Seite um -eVD
abgesenkt ist.
können, erhalten wir eine Konzentration n p von Elektronen im p-Gebiet und p n von Lö-
chern im n-Gebiet. Wir bezeichnen diese Ladungsträger als Minoritätsladungsträger.21
Durch das Abwandern von Elektronen aus der Grenzschicht des n-Halbleiters entsteht dort
eine positive Raumladungszone, da die ortsfesten ionisierten Donatoren dort zurückbleiben.
Umgekehrt entsteht durch das Abwandern von Löchern aus der Grenzschicht des p-Halb-
leiters dort eine negative Raumladungszone, da die ortsfesten ionisierten Akzeptoren dort
zurückbleiben. Die resultierende Raumladungszone ρ(x) ist in Abb. 10.14c gezeigt. Auf die-
se Weise wird in der Grenzschicht ein elektrisches Feld erzeugt, welches dem von dem Kon-
zentrationsgradienten der Elektronen und Löcher verursachten Diffusionsstrom entgegen-
wirkt. Die gesamte zwischen dem p- und n-Bereich resultierende Potenzialdifferenz ϕ(∞) −
ϕ(−∞) wird als Diffusionsspannung VD bezeichnet. Sie führt zu einem Driftstrom, der im
21
Generell geben wir mit dem Index an, in welchem Halbleitertyp sich der jeweilige Ladungsträger
befindet.
518 10 Halbleiter
E cn (∞) − µ eVn
n n (∞) = n eff
c exp (− ) = n eff
c exp (− ) (10.2.3)
kB T kB T
µ − E v (−∞)
p
eVp
p p (−∞) = peff
v exp (− ) = peff
v exp (− ). (10.2.4)
kB T kB T
Hierbei sind −eVn = E cn (∞) − µ und −eVp = µ − E v (−∞) die Abstände der Leitungs- und
p
Valenzbandkante vom chemischen Potenzial und (siehe Abb. 10.14b) und es gilt
Wir können (10.2.3) und (10.2.4) nach Vn und Vp auflösen und erhalten
nn
eVn = k B ln ( ) (10.2.6)
n eff
c
pp
eVp = k B ln ( ). (10.2.7)
peff
v
nn p p
eVD = E g + k B T ln ( ). (10.2.8)
n eff
c pv
eff
nn p p
eVD = k B T ln ( ). (10.2.9)
n 2i
Für Si mit n i = 1.5 × 1010 cm−3 bei Raumtemperatur erhalten wir zum Beispiel für
n n = 1015 cm−3 und p p = 1018 cm−3 eine Diffusionspannung von eVD = 0.75 eV.
10.2 Inhomogene Halbleiter 519
Die Ladungsträgerdichte für einen beliebigen Ort x erhalten wir, indem wir in (10.2.3)
und (10.2.4) die ortsabhängigen Werte E cn (x) = E c − eϕ(x) und E v (x) = E v − eϕ(x) für
p
die Bandkanten einsetzen. Alternativ können wir ein ortsabhängiges elektrochemisches Po-
tenzial ̃
µ(x) = µ + eϕ(x) verwenden. Mit ̃µ(x) werden die Ausdrücke (10.2.3) und (10.2.4)
äquivalent zu den Ausdrücken (10.1.22) und (10.1.23) für die Ladungsträgerdichten in
einem homogenen Halbleiter:
E c − eϕ(x) − µ ̃(x)
Ec − µ
n(x) = n eff
c exp (− ) = n eff
c exp (− ) (10.2.10)
kB T kB T
µ − E v + eϕ(x) ̃
µ(x) − E v
p(x) = peff
v exp (− ) = peff
v exp (− ). (10.2.11)
kB T kB T
Wir haben oben bereits qualitativ argumentiert, dass sich im thermischen Gleichgewicht die
Diffusions- und Driftströme an der Grenzfläche kompensieren müssen. Wir wollen diesen
Zusammenhang jetzt quantitativ diskutieren. Mit den Diffusionskonstanten D n und D p für
die Elektronen und Löcher erhalten wir für die Ströme
∂n ∂p
J diff = J ndiff + J diff
p = e (D n − Dp ) (10.2.12)
∂x ∂x
J drift = J ndrift + J drift
p = e (nµ n + pµ p ) E x . (10.2.13)
Aus J diff + J drift = 0 folgt, dass die Beiträge der Elektronen und Löcher einzeln verschwin-
den müssen, da sich weder Elektronen noch Löcher in irgendeinem Teilgebiet ansammeln
können. Es muss deshalb sowohl für Elektronen als auch für Löcher gelten:
∂n ∂ϕ(x) ∂p ∂ϕ(x)
Dn = nµ n − Dp = pµ p . (10.2.14)
∂x ∂x ∂x ∂x
Hierbei haben wir E x = −∂ϕ⇑∂x verwendet. Mit den durch (10.2.10) und (10.2.11) gegebe-
nen Ladungsträgerdichten erhalten wir
∂n e ∂ϕ(x) ∂p e ∂ϕ(x)
=n = −p (10.2.15)
∂x k B T ∂x ∂x k B T ∂x
und damit nach Substitution in (10.2.14)
kB T kB T
Dn = µn Dp = µp . (10.2.16)
e e
Diese Beziehungen werden Einstein-Relationen genannt und gelten immer dann, wenn Dif-
fusions- und Driftströme durch denselben Ladungsträgertyp getragen werden.
Wir können nun die Poisson-Gleichung (10.2.2) dazu benutzen, eine Beziehung zwi-
schen ϕ(x) und ρ(x) herzustellen. Nehmen wir an, dass alle Akzeptoren und Donatoren
ionisiert sind (n A = n−A und n D = n+D ), so ergibt sich die Ladungsdichte durch die Dotiera-
tome und die Ladungsträgerdichte zu
Setzen wir die entsprechenden Ausdrücke (10.2.1), (10.2.10) und (10.2.11) in diese Glei-
chung ein und substituieren das Ergebnis in die Poisson-Gleichung, so erhalten wir eine
nichtlineare Differentialgleichung für ϕ(x), die sich nur numerisch lösen lässt. Wir wollen
im Folgenden eine näherungsweise Betrachtung machen, die als Schottky-Modell der Raum-
ladungszone bekannt ist.
Mit der Voraussetzung eines abrupten p-n-Übergangs können wir die Ladungsträgerdichte
schreiben als
Hierbei geben die Längen d p und d n die Ausdehnung der Raumladungszone im p- und
n-Halbleiter an. Mit dieser stückweise konstanten Raumladungsdichte erhalten wir die Pois-
son-Gleichung zu
)︀
⌉︀ für x < −d p
⌉︀
⌉︀
⌉︀
0
⌉︀
⌉︀
∂ ϕ ⌉︀ +eєєn0 A
2 für − d p < x < 0
= ⌋︀ −e n D . (10.2.21)
∂x 2 ⌉︀
⌉︀
⌉︀ für 0 < x < d n
⌉︀
⌉︀
⌉︀
єє 0
⌉︀
]︀0 für x > d n
)︀
⌉︀ x < −d p
⌉︀
⌉︀
⌉︀
ϕ(−∞) für
⌉︀
⌉︀
⌉︀ϕ(−∞) + ( 2єєA0 )(d p + x)
en 2
für − dp < x < 0
ϕ(x) = ⌋︀ . (10.2.22)
⌉︀
⌉︀
⌉︀ ϕ(+∞) − ( 2єє
e nD
)(d n − x)2 für 0 < x < dn
⌉︀
⌉︀
⌉︀
0
⌉︀
]︀ϕ(+∞) für x > dn
Der Verlauf von ϕ(x) sowie seiner 1. (elektrisches Feld) und 2. Ableitung (Raumladungs-
dichte) sind in Abb. 10.15 dargestellt.
10.2 Inhomogene Halbleiter 521
(a) 𝝆
+𝒆𝒏𝑫
p + n
−𝒅𝒑
𝟎
+𝒅𝒏 𝒙
−𝒆𝒏𝑨
(b) 𝑬𝒙 −𝒅𝒑 𝟎 +𝒅𝒏
0
𝒙 Abb. 10.15: Schottky-Modell der
Raumladungszone eines p-n-Über-
gangs: (a) Raumladungsdichte ρ(x)
(gestrichelt ist die realistische Form
(c) 𝝓 von ρ(x) angegeben, die im Rah-
𝝓(∞) men des Schottky-Modells durch eine
Stufenfunktion approximiert wird).
(b) Verlauf des elektrischen Feldes und
𝑽𝑫 = 𝝓 ∞ − 𝝓 −∞
(c) Verlauf des Makropotenzials ϕ(x).
Die potenzielle Energie der Elektronen
𝟎
𝟎 𝒙 (Ladung −e) beträgt −eϕ(x).
50
Die Randbedingungen (Stetigkeit von ϕ(x) und seiner 1. Ableitung) werden von der Lösung
bei x = d n und x = −d p explizit erfüllt. Damit die 1. Ableitung von ϕ(x) auch bei x = 0 stetig
ist, muss
nD dn = nAd p (10.2.23)
gelten. Diese Forderung stellt sicher, dass die negative Raumladung im p-Halbleiter mit der
positiven im n-Halbleiter übereinstimmt. Damit ϕ(x) bei x = 0 stetig ist, muss
e
(n D d n2 + n A d 2p ) = ϕ(+∞) − ϕ(−∞) = VD (10.2.24)
2єє 0
gelten.
Aus (10.2.23) und (10.2.24) können wir bei bekannten Verunreinigungskonzentrationen die
Ausdehnung der Raumladungszone berechnen. Wir erhalten
2єє 0 VD n A ⇑n D
1⇑2
dn = ( ) (10.2.25)
e nA + nD
2єє 0 VD n D ⇑n A
1⇑2
dp = ( ) . (10.2.26)
e nA + nD
Üblicherweise ist für die meisten Halbleitermaterialien eVD ≃ E g . Mit E g ∼ 1 eV und typi-
schen Verunreinigungskonzentrationen im Bereich von 1014 bis 1018 cm3 liegen d p und d n
zwischen 10 und 1000 nm. Die Feldstärke innerhalb der Raumladungszone ist VD ⇑(d p + d n )
und liegt bei einer Energielücke von 1 eV im Bereich zwischen 106 und 108 V/cm.
522 10 Halbleiter
U 1⇑2
d n = d n (U = 0) (1 − ) (10.2.28)
VD
U 1⇑2
d p = d p (U = 0) (1 − ) . (10.2.29)
VD
Wir sehen, dass die Raumladungszone für positive Spannungen, wir nennen diese Richtung
die Durchlassrichtung, abnimmt, während sie für negative Spannungen, wir nennen diese
Richtung die Sperrrichtung, zunimmt.
Mit der Ausdehnung d n der Raumladungszone ändert sich auch die in dieser Zone gespei-
cherte Ladung
Q R = en D d n (U)A . (10.2.30)
Um die Kapazität der Raumladungszone bei einer angelegten Gleichspannung U 0 abzuschät-
zen, müssen wir überlegen, welche Ladungsmenge durch eine kleine Wechselspannung δU
an den Rändern der Verarmungszone hinzugefügt und entfernt wird. Die Ladungsmenge ist
gegeben durch
d dn d dp
δQ R = en D A ⨄︀ δU + en A A ⨄︀ δU . (10.2.31)
dU U 0 dU U 0
Hierbei können wir δQ R als diejenige Ladungsmenge betrachten, die durch die Wechsel-
spannung mit Amplitude δU auf einen Plattenkondensator der Fläche A geschoben wird.
Wir können dann die spannungsabhängige Kapazität des p-n-Übergangs schreiben als
dQ R d U 1⇑2
C R (U 0 ) = ⋀︀ ⋀︀ = )︀en D Ad n (0) + en A Ad p (0)⌈︀ ⋁︀ (1 − ) ⋁︀ . (10.2.32)
dU dU VD U0
10.2 Inhomogene Halbleiter 523
Mit den Ausdrücken (10.2.25) und (10.2.26) sowie (10.2.28) und (10.2.29) erhalten wir
1⇑2
nAnD eєє 0
C R (U 0 ) = A ( ) . (10.2.33)
n A + n D (VD − U 0 )
Messen wir die Raumladungskapazität C R als Funktion der angelegten Spannung, so kön-
nen wir Informationen über die Verunreinigungskonzentrationen gewinnen. Ferner können
wir durch Auftragung von 1⇑C R2 gegen U und Extrapolation auf U = 0 die Diffusionsspan-
nung VD bestimmen. Für n A ≫ n D erhalten wir
1 1 1 (VD − U 0 )
= . (10.2.34)
C R2 A2 n D eєє 0
10.2.2.1 Strom-Spannungs-Charakteristik
Wir wollen jetzt die Strom-Spannungs-Charakteristik eines p-n Kontakts diskutieren. Im
letzten Abschnitt haben wir gesehen, dass für U = 0 die Drift- und Diffusionsströme sich
gegenseitig kompensieren, so dass der Gesamtstrom verschwindet. Im Fall einer von außen
angelegten Spannung trifft dies nicht mehr zu. Wir betrachten im Folgenden den Elektro-
nenstrom. Wir müssen einerseits den Driftstrom der Minoritätsladungsträger (Elektronen
im p-Material) berücksichtigen, der vom p- in den n-Bereich fließt. Da die Minoritätsla-
dungsträger im p-Bereich durch thermische Aktivierung ständig neu erzeugt werden müs-
gen
sen, nennen wir diesen Strom auch den Generationsstrom I n . Für eine genügend dünne
Raumladungszone wird jedes Elektron, das aus dem p-Material in den Raumladungsbereich
gelangt, durch das elektrische Feld innerhalb der Raumladungszone in den n-Bereich ge-
trieben. Dieser Strom wird in erster Näherung unabhängig von der Größe des elektrischen
Feldes und damit auch von der angelegten Spannung sein.
Andererseits müssen wir den Diffusionsstrom der Majoritätsladungsträger (Elektronen im
n-Bereich) berücksichtigen, der vom n- in den p-Bereich fließt. Diesen Strom nennen wir
Rekombinationsstrom I nrec , da die Elektronen nach Diffusion in den p-Bereich mit den dort
vorhandenen zahlreichen Löchern rekombinieren. In der Richtung von n nach p bewegen
sich die Elektronen gegen die Potenzialschwelle der Diffusionsspannung. Je nach Vorzei-
chen wird diese Potenzialschwelle durch die angelegte Spannung erhöht oder erniedrigt.
Der Anteil der Elektronen, der die Potenzialschwelle überwinden kann, wird durch einen
Boltzmann-Faktor exp(−e(VD − U)⇑k B T) bestimmt und hängt somit stark von der ange-
legten Spannung ab. Aufgrund unserer Diskussion können wir folgende Spannungsabhän-
gigkeit der Rekombinationsstromdichte angeben:
J n = J nrec − J n = J n (e eU⇑k B T − 1) .
gen gen
(10.2.37)
524 10 Halbleiter
p n
6
+
Sperrrichtung
J / (Jn +Jp )
4
gen
gen
Durchlass-
2 richtung
Die gleiche Analyse können wir für den Löcherstrom durchführen und erhalten
J p = J rec
p − Jp = J p (e eU⇑k B T − 1) .
gen gen
(10.2.38)
Für den Gesamtstrom aus Elektronen und Löchern ergibt sich somit
J(U) = (J p + J n ) (e eU⇑k B T − 1) .
gen gen
(10.2.39)
Die entsprechende Strom-Spannungs-Charakteristik ist in Abb. 10.16 dargestellt. Sie ist be-
züglich der beiden Polaritäten der angelegten Spannung extrem asymmetrisch und resultiert
in einem gleichrichtenden Verhalten des p-n Kontakts.
𝟎 𝒙 𝟎 𝒙
(b)
𝐥𝐨𝐠 𝒏, 𝒑
𝐥𝐨𝐠 𝒏, 𝒑
𝒑𝒑 𝒑𝒑
𝒏𝒏 𝒏𝒏
𝒏𝒊 𝒏𝒊
𝒏𝒊 𝒏𝒊
𝒏𝒑 pn 𝒏𝒑 pn
Abb. 10.17: p-n-Kontakt in Durchlass- (links) und Sperrrichtung (rechts). (a) Verlauf der Leitungs-
und Valenzbandkante sowie des elektrochemischen Quasi-Potenzials für Elektronen (gepunktet) und
Löcher (gestrichelt). In Durchlassrichtung ist U negativ auf der n-Seite, so dass die potenzielle Ener-
gie (−e)(−U) der Elektronen positiv ist. (b) Räumliche Variation der Elektronenkonzentration n
und der Löcherkonzentration p im Fall einer anliegenden Spannung (durchgezogene Linien) und
im Fall U = 0 (gepunktete Linien). Die Konzentrationen weit weg von der Raumladungszone werden
mit p p , n p , n n und p n bezeichnet.
stationäre Zustand nicht stark vom Gleichgewichtszustand abweicht (dieses wollen wir im
Folgenden annehmen), können wir nach wie vor die Situation näherungsweise mit Hilfe der
Boltzmann-Statistik beschreiben.
In der Näherung, dass wir die Rekombination von Elektronen und Löchern im Bereich der
Raumladungszone vernachlässigen können, ist es ausreichend, die Änderung der Diffusi-
onsstromdichten am Rand der Raumladungszonen bei −d p und +d n zu betrachten. Da die
Berechnung für Elektronen und Löcher völlig analog ist, beschränken wir uns im Folgenden
auf die Berechnung der Löcherstromdichte.
Für den Diffusionsstrom bei x = d n folgt aus (10.2.12)
∂p
p (x = d n ) = −eD p
J diff ⋀︀ . (10.2.40)
∂x x=d n
Wir werden im Folgenden zeigen, dass die Diffusionstheorie einen einfachen Ausdruck
∂p
zwischen dem Konzentrationsgradienten ∂x und der Zunahme der Lochkonzentration
bei x = −d n liefert. Die Lochkonzentration p(x = d p ) und p(x = d n ) können wir mit
Hilfe der Boltzmann-Statistik erhalten. Wir benutzen hierzu Gleichung (10.2.11) und
526 10 Halbleiter
µ − E v + e(VD − U)
p(x = −d p ) = peff
v exp (− )
kB T
µ − Ev e(VD − U) e(VD − U)
= peff
v exp (− ) exp (− ) = p p exp (− )
kB T kB T kB T
(10.2.41)
sowie
µ − E v − eU
p(x = d n ) = peff
v exp (− )
kB T
µ − Ev eU eU
= peff
v exp (− ) exp ( ) = p n exp ( ). (10.2.42)
kB T kB T kB T
Hierbei sind d p und d n die Breiten der Raumladungszonen im thermischen Gleichge-
wicht (U = 0). Die für die Durchlassrichtung um den Faktor e eU⇑k B T erhöhte Löcherkon-
zentration im n-Bereich führt zu einer erhöhten Rekombinationsrate, so dass diese schnell
abklingt. Fern vom p-n-Übergang wird der Strom deshalb im n-Gebiet von Elektronen und
umgekehrt im p-Gebiet von Löchern getragen.
Um das Abklingen der Löcherkonzentration im n-Gebiet zu berechnen, benutzen wir die
Kontinuitätsgleichung. Diese erfordert, dass die Löcherkonzentration in einem bestimm-
ten Volumenelement sich nur durch Zu- oder Abfluss, durch thermische Generation sowie
durch Rekombination ändert. Die Rekombinationsrate beschreiben wir mit Hilfe einer Re-
kombinationszeit τ p und erhalten damit
∂p 1 p − pn
= − ∇ ⋅ Jdiff
p − . (10.2.43)
∂t e τp
Hierbei beschreibt der 1. Term auf der rechten Seite den Zu- bzw. Abfluss und der 2. Term die
Rekombination (p > p n ) bzw. die Generation (p < p n ). Im stationären Zustand ist ∂t = 0, so
∂p
∂p ∂2 p p − p n
= Dp 2 − =0 (10.2.44)
∂t ∂x τp
und somit
∂2 p 1
2
= (p − p n ) (10.2.45)
∂x Dpτp
Für die Ableitung des Diffusionsprofils an der Stelle x = d n erhalten wir unter Benutzung
von (10.2.42):
∂p p(x = d n ) − p n p n (e eU⇑k B T − 1)
⋀︀ =− =− . (10.2.47)
∂x x=d n Lp Lp
Setzen wir diesen Ausdruck in (10.2.40) ein, so ergibt sich
eD p
p (x = d n ) =
J diff p n (e eU⇑k B T − 1) . (10.2.48)
Lp
Eine völlig analoge Rechnung können wir für den Diffusionsstrom der Elektronen im p-Ge-
biet durchführen:
eD n
J ndiff (x = −d p ) = n p (e eU⇑k B T − 1) . (10.2.49)
Ln
Wie oben bereits diskutiert wurde, müssen wir die Driftströme nicht berücksichtigen. Ih-
re Komponenten bleiben in der gemachten Näherung unverändert gegenüber dem thermi-
schen Gleichgewicht und kompensieren gerade die Gleichgewichtsanteile der Diffusions-
ströme. Der gesamte Strom über den p-n-Kontakt ergibt sich aus der Summe der beiden
Diffusionsströme (10.2.48) und (10.2.49) zu
eD p eD n
J(U) = ( pn + n p ) (e eU⇑k B T − 1) . (10.2.50)
Lp Ln
Wir sehen, dass wir jetzt die Generationsströme in Gleichung (10.2.39) als Funktionen der
Diffusionskonstanten und Diffusionslängen der Elektronen und Löcher sowie der Minori-
tätsladungsträgerdichten p n und n p ausgedrückt haben.
10.2.3 Schottky-Kontakt
Wir wollen in diesem Abschnitt einen Kontakt zwischen einem Halbleiter und einem Metall
diskutieren, den wir als Schottky-Kontakt bezeichnen.22 Solche Kontakte sind wichtige Ele-
mente von elektronischen Schaltkreisen. Bei der Diskussion eines solchen Kontakts können
wir konzeptionell ähnlich vorgehen, wie bei der Behandlung eines p-n-Kontakts. Abb. 10.18
und 10.19 zeigen, was passiert, wenn wir einen n-Halbleiter und ein Metall in Kontakt brin-
gen. Da die Abstände Φ H und Φ M zwischen chemischem Potenzial und Vakuumniveau für
einen Halbleiter und ein Metall nicht gleich sein müssen, sind die chemischen Potenziale im
Halbleiter und Metall um den Betrag Φ M − Φ H gegeneinander verschoben. Im Metall ent-
spricht eΦ M gerade der Austrittsarbeit. Im Halbleiter ist eΦ H = e χ + eVn der Abstand des
chemischen Potenzials vom Vakuumniveau. Der Abstand e χ der Leitungsbandkante vom
Vakuumniveau ist die Elektronenaffinität.
Wir betrachten zuerst den Fall Φ M > Φ H . Bringen wir die beiden Materialien in Kontakt,
so muss im thermischen Gleichgewicht das chemische Potenzial horizontal verlaufen, was
22
Walter H. Schottky, siehe Kasten auf Seite 530.
528 10 Halbleiter
𝒆𝑽𝒏 𝒆𝝌 𝒆𝚽𝑯
𝒆𝚽𝑴
𝑬𝒏𝒄
𝑬𝑫
µ 𝒆 𝚽𝑯 − 𝚽𝑴
µ
𝑬𝒏𝒗
(b) 𝑬 𝑬𝐯𝐚𝐜
𝑬𝐯𝐚𝐜
𝒆𝑽𝒏
𝒆 𝚽𝑯 − 𝚽𝑴 + 𝒆𝚽𝑩 = 𝒆 𝚽𝑯 − 𝚽𝑴 + 𝒆𝑽𝒏
𝑬𝒏𝒄 +
+
𝑬𝑫 µ
µ
𝑬𝒏𝒗
−𝒅𝒏 𝟎 𝒙
Abb. 10.18: Schematische Darstellung eines Schottky-Kontakts im thermischen Gleichgewicht
für Φ M > Φ H : (a) Bänderschema im Metall (rechts) und n-Halbleiter (links) bei völliger Trennung,
54
(b) Bandverlauf im Schottky-Kontakt im thermischen Gleichgewicht nach Herstellung des Kontakts.
(b) 𝑬 𝑬𝐯𝐚𝐜
𝒆𝝌 𝑬𝐯𝐚𝐜
𝒆𝑽𝒏
+ 𝒆𝚽𝑴
𝑬𝒏𝒄 +
+
𝑬𝑫 𝝁
𝝁 𝒆 𝚽𝑯 − 𝚽𝑴 𝒆𝚽𝑩 = 𝒆 𝚽𝑯 − 𝚽𝑴 + 𝒆𝑽𝒏
𝑬𝒏𝒗
−𝒅𝒏 𝟎 𝒙
Abb. 10.19: Schematische Darstellung eines Schottky-Kontakts im thermischen Gleichgewicht
für Φ M < Φ H : (a) Bänderschema im Metall (rechts) und n-Halbleiter (links) bei völliger Trennung,
55
(b) Bandverlauf im Schottky-Kontakt im thermischen Gleichgewicht nach Herstellung des Kontakts.
Im Halbleiter bildet sich an der Grenzfläche eine starke Anreicherung von Elektronen.
10.2 Inhomogene Halbleiter 529
zu der in Abb. 10.18 gezeigten Bandverbiegung führt. Aus den gleichen Gründen wie beim
p-n-Kontakt erhalten wir auch beim Schottky-Kontakt eine Raumladungszone. In dem in
Abb. 10.18 gezeigten Beispiel ist die Raumladungszone im Halbleiter positiv und im Me-
tall negativ geladen. Aufgrund der hohen Ladungsträgerdichte im Metall ist allerdings ihre
räumliche Ausdehnung im Metall verschwindend klein (typischerweise kleiner als 1 nm).
Die Entstehung der Raumladungszone können wir qualitativ dadurch verstehen, dass ein
Teil der im n-Halbleiter vorhandenen Elektronen in das Metall diffundiert. In der Grenz-
schicht des n-Halbleiters entsteht dann eine positive Raumladungszone, da die ortsfesten
ionisierten Donatoren dort zurückbleiben. Umgekehrt können aber die Elektronen aus dem
Metall nicht in den Halbleiter diffundieren, da dort auf der Höhe des chemischen Potenzials
keine Zustände vorhanden sind.
Im Rahmen des auch für den p-n-Kontakt verwendeten Schottky-Modells erhalten wir im
Bereich −d n < x < 0 [vergleiche (10.2.21)]
∂2 ϕ en D
=− . (10.2.51)
∂x 2 єє 0
en D
ϕ(x) = (Φ M − Φ H ) − (x + d n )2 . (10.2.52)
2єє 0
Abb. 10.20: Schematische Darstellung eines Schottky-Kontakts mit angelegter Spannung. Oben:
Durchlassrichtung, unten: Sperrrichtung. In Durchlassrichtung ist die Spannung am Metall positiv,
so dass die potenzielle Energie −eU der Elektronen auf der Seite des Metalls abgesenkt ist.56
wird. Für eine negative Spannung (Sperrrichtung) ist es genau umgekehrt. In Durchlassrich-
tung wird die Potenzialschwelle, welche die Elektronen im Leitungsband des n-Halbleiters
überwinden müssen, um ins Metall zu gelangen, abgesenkt, so dass der Strom exponentiell
mit der Spannung ansteigt. Umgekehrt wird in Sperrichtung die Potenzialschwelle vergrö-
ßert, so dass der Strom mit zunehmender negativer Spannung einen Sättigungswert erreicht,
weil die Elektronen die Potenzialschwelle nicht mehr überwinden können. Der Wert des Sät-
tigungsstroms I s wird durch den Tunnelstrom durch die Potenzialbarriere bestimmt und soll
hier nicht näher diskutiert werden.
Mit der gleichen Argumentation wie in Abschnitt 10.2.2 erhalten wir für die Strom-
Spannungs-Charakteristik den Ausdruck [vergleiche (10.2.39)]
Die Dicke der Raumladungszone (Schottky-Randschicht) wird durch die angelegte Span-
nung verkleinert (Durchlassrichtung) bzw. vergrößert (Sperrrichtung). Analog zu (10.2.53)
erhalten wir
1⇑2
2єє 0
dn = ( (Φ M − Φ H ± eU)) . (10.2.55)
en D
Die spannungsabhängige Dicke der Schottky-Randschicht führt wie beim p-n-Kontakt zu
einer spannungsabhängigen Kapazität
}︂
1 en D 1
CR ∝ ∝ . (10.2.56)
dn 2єє 0 Φ M − Φ H ± eU
Tragen wir 1⇑C R2 als Funktion von U auf, so können wir durch Extrapolation auf U = 0 den
Wert von Φ M − Φ H bestimmen. Der gemessene Wert weicht allerdings oft von dem erwar-
532 10 Halbleiter
teten Ergebnis ab. Die Ursache dafür sind Oberflächenladungen, die wir in unserer Analyse
nicht berücksichtigt haben, in der Praxis aber meistens nicht zu vermeiden sind.
10.3 Halbleiter-Bauelemente
Wir wollen in diesem Abschnitt einige einfache Halbleiter-Bauelemente diskutieren, die auf
dem p-n-Übergang basieren. Im Einzelnen werden dies die Zener-Diode, die Esaki-Diode,
die Solarzelle und der bipolare Transistor sein.
10.3.1 Zener-Diode
In Sperrrichtung eines p-n-Kontakts kann keine beliebig hohe Spannung angelegt werden.
Aufgrund der bei hohen Spannungen auftretenden hohen elektrischen Feldstärken treten
neue Effekte auf:
∎ Lawinendurchbruch:
Falls die elektrische Feldstärke in der Verarmungszone groß genug wird, können die La-
dungsträger durch die Beschleunigung im elektrischen Feld so viel Energie gewinnen,
dass sie in der Verarmungszone Elektron-Loch-Paare durch einen Ionisationsprozess er-
zeugen. Da diese zusätzlich erzeugten Ladungsträger wiederum selbst beschleunigt wer-
den und Elektron-Loch-Paare erzeugen können, kommt es zu einem lawinenartigen An-
stieg der Ladungsträgerdichte und damit des Stroms, den wir Lawinendurchbruch nen-
nen.
∎ Zener-Tunneln:
Falls die Breite der Verarmungszone nicht allzu groß ist, können Elektronen aus dem
Valenzband des p-Halbleiters direkt ins Leitungsband des n-Halbleiters tunneln. Man
spricht vom Zener-Effekt bzw. vom Zener-Tunneln.23 , 24 , 25 Die effektive Breite d eff der Zo-
ne, die durchtunnelt werden muss, ist durch den Abstand des Valenzbandes des p-Halb-
leiters vom Leitungsband des n-Halbleiters gegeben. Da d eff mit wachsender Sperrspan-
nung immer dünner wird, tritt dieser Effekt ab einer genügend hohen Spannung auf (sie-
he Abb. 10.21). Die Tunnelwahrscheinlichkeit durch die Verarmungszone der Breite d eff
ist
23
Clarence Melvin Zener, US-amerikanischer Physiker und Elektrotechniker, geboren am 1. De-
zember 1905 in Indianapolis, Indiana, USA; gestorben am 2. Juli 1993 in Pittsburgh, USA.
24
C. M. Zener Non-adiabatic Crossing of Energy Levels, Proceedings of the Royal Society of Lon-
don A 137 (6), 696–702 (1932).
25
E. C. G. Stückelberg, Theorie der unelastischen Stöße zwischen Atomen, Helvetica Physica Acta 5,
369–422 (1932).
10.3 Halbleiter-Bauelemente 533
p n
𝑬
Abb. 10.21: Schematischer Band-
𝒑 + verlauf bei einer Zener-Diode. Bei
𝑬𝒄
𝝁 p Zener-Tunneln
genügend hoher Spannung in Sperr-
richtung können die Ladungsträger
𝒑
𝑬𝒗 die grün hinterlegte Verarmungszone
−𝒆𝑼 durchtunneln, was zu einem starken
𝒅𝐞𝐟𝐟 𝑬𝒏𝒄 Anstieg des Sperrstroms führt. In
𝝁 Sperrrichtung liegt der Pluspol der
Verarmungszone n Spannungsquelle am n-Gebiet, so dass
d 𝑬𝒏𝒗
dort die potenzielle Energie der Elek-
𝒙 tronen um (−e)U abgesenkt wird.
von der Barrierenhöhe V0 und der Energie E der Ladungsträger abhängt. Wir sehen, dass
die Dicke der Barriere exponentiell in die Tunnelwahrscheinlichkeit eingeht, so dass auf-
grund der Abnahme der effektiven Barrierendicke d eff mit zunehmender Sperrspannung
die Tunnelwahrscheinlichkeit und damit der Strom exponentiell ansteigt.26
Es stellt sich die Frage, unter welchen Bedingungen bei hohen Sperrspannungen ein Lawi-
nendurchbruch und wann Zener-Tunneln auftritt. Um diese Frage zu diskutieren, nehmen
wir an, dass der p- und n-Halbleiter die gleiche Konzentration von Verunreinigungen haben,
so dass n D = n A = n. In diesem Fall erhalten wir nach (10.2.25) und (10.2.26)
}︂
єє 0 VD
dn = d p = . (10.3.3)
en
Wir sehen, dass bei schwacher Dotierung d = d n + d p groß und damit die Tunnelwahr-
scheinlichkeit sehr klein wird. In diesem Fall werden wir bei großen Spannungen einen
Lawinendurchbruch erhalten. Mit zunehmender Dotierung wird d = d n + d p immer klei-
ner und die Tunnelrate wird irgendwann bereits bei Spannungen, die kleiner als die für
einen Lawinendurchbruch erforderliche Spannung sind, stark ansteigen. Wir nennen diese
Spannung Zener-Spannung. Wir erwarten also, dass bei hoher Dotierung der Sperrstrom
durch das Zener-Tunneln und nicht durch den Lawinendurchbruch ansteigt. Dies ist in
Abb. 10.22 gezeigt. Mit abnehmender Dotierung verschiebt sich der Zener-Durchbruch
zu höheren Spannungswerten und es tritt dann wieder ein Lawinendurchbruch auf. Für
Silizium kann die Zener-Spannung bei der Herstellung durch Variation der Dotierung im
Bereich zwischen etwa 2 bis 600 V eingestellt werden. Die Zener-Diode wird bei Anwen-
dungen überwiegend in Sperrrichtung betrieben. In Durchlassrichtung arbeitet sie wie ein
normale Diode.
26
The Physics of Semiconductor Devices, S. M. Sze and K. Ng Kwok, John Wiley & Sons, New York
(1981).
534 10 Halbleiter
Backward-Diode
Lawinendurchbruch
Zener-Durchbruch
2
J / Js
0
-2
Abb. 10.22: Strom-Spannungs-
Charakteristiken für den Fall des
Lawinen- und des Zener-Durch- -4
bruchs. Ebenfalls gezeigt ist die Strom-
Spannungs-Charakteristik einer -8 -6 -4 -2 0 2
Rückwärtsdiode (Backward Diode). U (bel. Einheiten)
10.3.1.1 Rückwärtsdiode
Bei extrem hoher Dotierung nähert sich das chemische Potenzial im p-Halbleiter der Valenz-
bandkante und im n-Halbleiter der Leitungsbandkante an. Außerdem wird die Breite der
Verarmungszone extrem klein. Diese Situation ist in Abb. 10.23 gezeigt. Wir sehen, dass be-
reits bei sehr kleinen Spannungen in Sperrrichtung ein starker Tunnelstrom einsetzen kann.
Dieser Tunnelstrom kann größer sein als der Strom bei der entsprechenden Spannung in
Durchlassrichtung, d. h. I(U < 0) > I(U > 0). Wir sprechen in diesem Fall von einer Rück-
wärtsdiode (engl.: Backward Diode).
𝑬 p n
𝑬𝒄
𝒑 +
Abb. 10.23: Schematischer Bandver-
lauf bei einer Rückwärtsdiode. Der
𝝁
p
Tunnelstrom in Sperrrichtung setzt
𝒑
bereits bei sehr kleinen Spannungen 𝑬𝒗 −𝒆𝑼
𝑬𝒏𝒄
ein und führt zu I(U < 0) > I(U > 0).
𝝁
Für die gezeigte Sperrrichtung liegt
der Pluspol der Spannungsquel- n
𝑬𝒏𝒗
le am n-Gebiet an, so dass die po- Verarmungszone
d
tenzielle Energie der Elektronen
dort um (−e)U abgesenkt wird. 𝒙
entartet. Das chemische Potenzial liegt typischerweise einige k B T von der Leitungs- bzw.
Valenzbandkante entfernt und die Breite der Verarmungszone beträgt aufgrund der extrem
hohen Dotierung nur etwa 10 nm.
10.3 Halbleiter-Bauelemente 535
𝒑
𝑬𝒄 1 𝑼=𝟎 𝒑
𝑬𝒄 3 𝑼>𝟎
klein
p p
𝒑 𝝁 +𝒆𝑼 𝝁
𝑬𝒗 𝒑
𝑬𝒗
𝝁 𝑬𝒏𝒄 𝑬𝒏𝒄
𝝁
n n
𝑬𝒏𝒗 𝑬𝒏𝒗
𝒑
𝑬𝒄 2 𝑼<𝟎 4
𝒑
𝑬𝒄 klein
p +𝒆𝑼 𝝁
𝒑
𝑬𝒗 p
−𝒆𝑼 𝝁 𝒑
𝑬𝒗 𝑬𝒏𝒄
𝝁
𝑬𝒏𝒄 𝝁 n
n 𝑬𝒏𝒗
𝑬𝒏𝒗
I 5 𝑼>𝟎
5 groß
3 𝝁
4
1 p 𝑬𝒏𝒄
+𝒆𝑼
U n
p n 𝝁 𝑬𝒏𝒗
2
+
63
Abb. 10.24: Schematischer Bandverlauf bei einer Esaki-Diode für verschiedene Spannungen und die
daraus resultierende Strom-Spannungs-Kennlinie. In Durchlassrichtung ist der Plus-Pol der Span-
nungsquelle mit dem p-Halbleiter verbunden. Dadurch wird für eine positive Spannung die poten-
zielle Energie der Elektronen im p-Gebiet um (−e)U abgesenkt, oder äquivalent im n-Gebiet um eU
angehoben.
Wie bei der Rückwärtsdiode tritt bei der Esaki-Diode für die Sperrrichtung ein hoher Tun-
nelstrom auf (siehe Abb. 10.24(2)). Aufgrund der Tatsache, dass das chemische Potenzial auf
der p- bzw. der n-Seite im Valenz- bzw. Leitungsband liegt, erhalten wir im Gegensatz zur
Rückwärtsdiode auch für die Durchlassrichtung bei kleinen Spannungen einen hohen Tun-
nelstrom (siehe Abb. 10.24(3)). In diesem Spannungsbereich können Elektronen aus dem
Leitungsband des n-Halbleiters direkt in freie Zustände des p-Halbleiters tunneln. Für grö-
ßere Spannungen in Durchlassrichtung ist dies nicht mehr der Fall, so dass der Strom zu-
nächst wieder abnimmt und erst bei höheren Spannungswerten aufgrund der Abnahme der
Breite der Potenzialbarriere für den Strom der Elektronen aus dem n- in den p-Bereich wie-
der exponentiell ansteigt. Der daraus resultierende negativ differentielle Widerstand wird
in vielen Bauelementen ausgenutzt. Insbesondere erlaubt er die einfache Realisierung von
Mikrowellenoszillatoren. Dabei wird die Esaki-Diode z. B. parallel zu einem LC-Schwing-
kreis geschaltet. Die Verluste des Schwingkreises, die mit einem ohmschen Widerstand cha-
rakterisiert werden können, werden dabei durch den negativ differentiellen Widerstand der
Esaki-Diode gerade kompensiert.
536 10 Halbleiter
10.3.3 Solarzelle
Die Solarzelle wurde erstmals von Chapin, Fuller und Pearson im Jahr 1954 entwickelt.27
Sie verwendeten diffundierte Si p-n-Kontakte. Bis heute wurden Solarzellen aus verschiede-
nen anderen Halbleitermaterialien hergestellt, wobei verschiedene Bauelementkonfiguratio-
nen auf der Basis von einkristallinen, polykristallinen und amorphen Dünnschichtstruktu-
ren verwendet wurden. Solarzellen werden seit vielen Jahren erfolgreich für die Energiever-
sorgung von Satelliten und Raumfahrzeugen eingesetzt. Aufgrund des weltweit steigenden
Energiebedarfs und den knapper werdenden fossilen Brennstoffen werden Solarzellen auch
zunehmend für terrestrische Anwendungen interessant. Für eine breite Anwendung ist aber
eine kostengünstigere und mit geringerem Energieaufwand auskommende Herstellung not-
wendig.
Die klassische Silizium-Solarzelle besteht aus einer ca. 1 µm dicken n-Schicht, welche in
das ca. 0.6 mm dicke p-leitende Si-Substrat eingebracht wurde. Bei der monokristallinen
Silizium-Solarzelle wird die n-Schicht durch oberflächennahes Einbringen (Dotieren) von
ca. 1019 Phosphor-Atomen pro cm3 in das p-leitende Si-Substrat erzeugt. Die n-Schicht ist
so dünn, damit das Sonnenlicht hauptsächlich in der Raumladungszone am p-n-Übergang
27
D. M. Chapin, C. S. Fuller, G. L. Pearson, A New Silicon p-n Junction Photocell for Converting Solar
Radiation into Electrical Power, J. Appl. Phys. 25, 676 (1954).
10.3 Halbleiter-Bauelemente 537
p
𝝁 𝑬𝒏𝒄
𝒑
n-Halbleiter 𝑼
𝑬𝒗 𝝁
n p-Halbleiter
+
𝑬𝒏𝒗 Rückseitenkontakt
(b)
𝒑
𝑬𝒄
𝑬𝒏𝒄
p 𝝁
𝝁 +𝒆𝑼𝒐𝒄
𝒑
𝑬𝒗 n
d 𝑬𝒏𝒗
Abb. 10.25:
positiv
Zuraufgeladen:
Funktionsweise einer negativ aufgeladen:
Solarzelle. In (a) ist der schematische Bandverlauf vor Einstrah-
𝐸𝑝𝑜𝑡 der
lung von Licht Elektronen
gezeigt. 𝐸𝑝𝑜𝑡 der Elektronen
um Lichteinstrahlung
Durch um in der positive
werden Spannung Uoc des
Verarmungszone über p-n-Übergangs
pn-Kontakt
(−𝑒)(+𝑈) abgesenkt
Elektron-Loch-Paare erzeugt. Diese (−𝑒)(−𝑈)
werden im angehoben
elektrischen Feld der Verarmungszone getrennt,65 wobei
die Löcher ins p- und die Elektronen ins n-Material driften. Dies führt zu einer positiven bzw. nega-
tiven Aufladung des p- bzw. n-Gebiets (b) und damit zu einer Spannung U oc (open circuit), die von
außen abgegriffen werden kann. Rechts ist schematisch der Aufbau und ein Bild einer monokristalli-
nen Si-Solarzelle gezeigt (Photo: Stephan Kambor).
absorbiert wird. Das p-leitende Si-Substrat muss dick genug sein, um die tiefer eindringen-
den Sonnenstrahlen absorbieren zu können und um der Solarzelle mechanische Stabilität zu
geben.
Eine Solarzelle ist nichts anderes als ein p-n-Kontakt, in dessen Verarmungszone durch
Lichteinstrahlung Elektron-Loch-Paare erzeugt werden. Die Funktionsweise einer Solarzel-
le können wir uns anhand von Abb. 10.25 veranschaulichen. Ohne Bestrahlung liegt das in
Abb. 10.25a gezeigte Bandschema vor. Wird die Solarzelle nun beleuchtet, werden in dem in
der Verarmungszone des p-n-Kontakts existierenden elektrischen Feld die durch die Licht-
einwirkung erzeugten Elektron-Loch-Paare getrennt, wobei die Löcher ins p- und die Elek-
tronen ins n-Material driften. Dadurch lädt sich das p-Gebiet positiv und das n-Gebiet ne-
gativ auf. Die potenzielle Energie der Elektronen im n-Gebiet wird um (−e)(−U), diejenige
der Löcher im p-Gebiet ebenfalls um (+e)(+U) angehoben. Dies führt zu einer positiven
Spannung über den p-n-Kontakt, die wir von außen abgreifen können. Ohne äußere Last
baut sich die „open circuit“ Spannung U oc auf.
Prinzipiell können nicht mehr Elektron-Loch-Paare erzeugt werden, als Lichtquanten auf die
Zelle treffen. Von den Lichtquanten kann auch nur der Anteil genutzt werden, dessen Ener-
gie hν größer als der Bandabstand E g , also groß genug ist, ein Elektron-Loch-Paar durch
Anregung eines Elektrons aus dem Valenzband ins Leitungsband zu erzeugen. Weiterhin
kann ein Lichtquant relativ hoher Energie nur den Teil in nutzbare elektrische Energie um-
wandeln, der dazu benötigt wird, das Elektron-Loch-Paar zu erzeugen. Daraus resultiert für
kommerziell verfügbare, mit vertretbarem Aufwand herstellbare Solarzellen – z. B. polykris-
538 10 Halbleiter
talline Siliziumzellen – ein Wirkungsgrad von etwa 15%. Von den maximal etwa 1000 W
Sonneneinstrahlung pro Quadratmeter können also nur 150 W in Form elektrischer Leis-
tung verfügbar gemacht werden. Die Angabe des Wirkungsgrades kann auf zwei Flächenan-
gaben bezogen werden: einmal auf die Zellenfläche, zum anderen auf die Modulfläche. Im
ersten Fall wird nur die Zellentechnik berücksichtigt, im zweiten Fall zusätzlich die durch
die Zellengeometrie benötigte Fläche.28 Eine grobe Einteilung von Solarzellen können wir
nach dem in Tabelle 10.6 gezeigten Schema vornehmen.
Um den Wirkungsgrad einer Solarzelle abzuschätzen, betrachten wir das in Abb. 10.26 ge-
zeigte Ersatzschaltbild. Die durch das Generieren von Elektron-Loch-Paaren erzeugte elek-
trische Stromdichte J L kann durch eine Stromquelle beschrieben werden, die zum p-n-Kon-
takt parallel geschaltet ist und einen Strom erzeugt, der parallel zum Sperrstrom gerichtet ist.
Ohne äußere Last (R L → ∞) ist der Strom im äußeren Kreis null und wir können den Span-
nungsabfall U oc dadurch bestimmen, dass wir die Stromdichte des p-n-Kontakt der durch
𝑱𝑳 U RL Um
0
Uoc
-5
𝑷𝒎 = 𝑱𝒎 𝑼𝒎
J / Js
-10
𝑱𝒎
J = 0 = J s (e eU oc ⇑k B T − 1) − J L . (10.3.4)
J = J s (e eU⇑k B T − 1) − J L . (10.3.6)
Die maximale Flächenleistung, die aus der Solarzelle gewonnen werden kann, ergibt sich aus
der maximalen Fläche Pm = ⋃︀J m ⋃︀ ⋅ U m des in Abb. 10.26 eingezeichneten Rechtecks. Setzen
wir dP⇑dU = 0, so erhalten wir
⎛ 1 − JJLs eU
kB T ⎞
m
⋃︀J m ⋃︀ = J L 1 − (10.3.7)
⎝ 1 + eU m
kB T
⎠
kB T ⎛ J S + 1 ⎞
L J
kB T eU m
Um = ln eU m = U oc − ln ( + 1) (10.3.8)
e ⎝ k T + 1⎠ e kB T
B
diejenige Energie, die pro erzeugtem Ladungsträger maximal an die Last abgegeben wird.
Die Gleichungen (10.3.7) bis (10.3.9) zeigen, dass wir ein großes Verhältnis J L ⇑J s benötigen,
um E m groß zu machen. Für ein bestimmtes Halbleitermaterial kann die Sättigungsstrom-
dichte nach Gleichung (10.2.50) berechnet werden. Bei 300 K liegt für Silizium die kleinste
erreichbare Sättigungsstromdichte im Bereich J s ∼ 10−15 A/cm2 . Eine Erhöhung von J L ⇑J s
bei vorgegebenem Material und Beleuchtungsstärke kann durch Erniedrigung der Tempe-
ratur oder Verwendung von Konzentratorzellen erzielt werden.
Um den Wirkungsgrad einer Solarzelle anzugeben, müssen wir überlegen, wie effizient die
ankommende Strahlungsleistung in elektrische Leistung umgesetzt wird. Dabei gehen un-
ter anderem folgende Faktoren ein: (i) Photonen mit hν < E g können keine Elektron-Loch-
Paare anregen und tragen deshalb nicht zur elektrischen Leistung bei. (ii) Photonen mit hν >
E g regen zwar Elektron-Loch-Paare an, die pro absorbiertes Photon an die Last abgegebene
Energie ist aber E m < hν. (iii) Photonen können an der Oberfläche der Zelle reflektiert wer-
den und tragen dann nicht zur elektrischen Leistung bei. (iv) Durch Kontaktierungsschich-
ten und Montagevorrichtungen ist die effektive Zellfläche kleiner als 100 %. Um den Ein-
fluss der Bandlücke E g zu diskutieren, betrachten wir die Kurzschlussstromdichte J L . Diese
540 10 Halbleiter
6000 K Schwarzkörperstrahlung
Strahlungsfluss (10 Jm s µm )
-1
2.0
AM0 (1366.1 W/m²)
-2 -1
AM0
1.5 GaAs
3
Atmosphäre
AM0 q AM1
1.0 Si cos q
Erdoberfläche
0.5 Ge
AM1.5
(1000 W/m²)
0.0
0.0 0.4 0.8 1.2 1.6 2.0
(m)
Abb. 10.27: Von der Sonne abgestrahlter Strahlungsfluss als Funktion der Wellenlänge. Die Pfeile mar-
kieren die maximale Wellenlänge λ g = hc⇑E g , bis zu der bei den verschiedenen Halbleitern Band-Band-
Übergänge möglich sind. Das langwellige Spektrum rechts der Pfeile kann in Solarzellen aus dem jewei-
ligen Material nicht ausgenutzt werden. Das extraterrestrische Spektrum ohne Abschwächung durch
die Erdatmosphäre wird mit AM0 (air mass zero) bezeichnet. Es besitzt eine integrierte Strahlungsleis-
tung von 1366.1 W/m2 . Der Strahlungsfluss ist in J/m2 s µm angegeben und kann in einen Photonen-
fluss d J ph ⇑d(hν) pro Energieintervall umgerechnet werden, der üblicherweise in Photonen/eV m2 s
angegeben wird. Im Maximum der AM0-Kurve hat man etwa 4 × 1021 Photonen/eV m2 s. Durch die
Drehung der Erde um die Sonne ändert sich der Einfallswinkel der Strahlung und damit auch die Länge
des Weges durch die Atmosphäre. Um diese Änderung zu charakterisieren, wurde der Begriff der „Air
Mass“ (AM) eingeführt. AM1 kennzeichnet den Strahlungsfluss auf der Erdoberfläche (Meereshöhe)
bei senkrechtem Einfall des Sonnenlichtes und besitzt durch die Absorption der Atmosphäre eine in-
tegrierte Strahlungsleistung von nur etwa 925 W/m2 (AM1). Für einen Zenitwinkel θ der Sonne ergibt
sich ein entsprechendes AMX-Spektrum mit X = 1⇑ cos θ, z. B. AM1.5 für θ = 48.19○ . Für Testzwecke
wurde das AM1.5 Spektrum (ISO 9845-1) definiert. Es besitzt die typische spektrale Verteilung auf der
Erdoberfläche mit einer integrierten Strahlungsleistung von 1000 W/m2 . Diese ist höher als der Wert
von 844 W/m2 , der für die tatsächliche terrestrische Sonnenstrahlung bei einer Luftmasse von 1.5 ge-
messen wird.
hängt davon ab, wie der von der Sonne kommende Photonenfluss (Photonen pro Fläche
und Zeit) mit spektraler Verteilung J ph (ν) (siehe Abb. 10.27) in eine elektrische Stromdich-
te J L umgesetzt wird. Dazu müssen wir berücksichtigen, dass nur Photonen mit Frequen-
zen ν ≥ ν g = E g ⇑h Elektron-Loch-Paare generieren können. Um die vom Photonenfluss er-
zeugte elektrische Stromdichte zu erhalten, integrieren wir den Photonenfluss der Sonne
von v g bis ∞ und erhalten
∞
d J ph (ν)
J L (ν g ) = eJ ph (ν g ) = e ∫ dν . (10.3.10)
dν
ν=ν g
Das Ergebnis der Integration ist in Abb. 10.28 gezeigt. Nachdem wir die Sättigungs-
stromdichten J s und J L kennen, können wir E m durch numerische Lösung der Gleichun-
gen (10.3.5), (10.3.8) und (10.3.9) erhalten. Da J s und damit E m von den Materialeigenschaf-
10.3 Halbleiter-Bauelemente 541
4 64
Ge
3 48
Jph (10 m s )
-2 -1
JL (mA / cm )
2
Si
21
2 GaAs 32
𝑱𝑳 (𝒉𝝂𝐠 )
31 %
1 𝑬𝒎 (𝒉𝝂𝐠 ) 16
𝑬𝒎 𝑬𝒈 -𝑬𝒎
𝑬𝒈 =
𝑬𝒎 = 𝟎. 𝟗 eV 𝟏. 𝟑𝟓 eV
0 0
0 1 2 3
hg (eV)
76
Abb. 10.28: Schematische Darstellung des Photonenflusses J ph bzw. äquivalent von J L = eJ ph als Funk-
tion der Photonenenergie hν g = E g berechnet nach (10.3.10) für AM1.5. J ph (hν g ) gibt die Anzahl der
Photonen mit ν ≥ ν g an, die pro Fläche und Zeit auf die Erdoberfläche einfallen. Ebenfalls gezeigt ist die
zu J L gehörende charakteristische Energie E m als Funktion der Photonenenergie hν g . Die eingezeich-
neten Rechtecke veranschaulichen die grafische Bestimmung der Konversionseffizienz η. Die Pfeile
markieren die Bandlücke von Ge, Si und GaAs.
ten des Halbleiters abhängt, müssen zum Erreichen der optimalen Effizienz einer Solarzelle
die Materialparameter so optimiert werden, dass J s minimal wird.
Die charakteristische Energie E m ist ebenfalls in Abb. 10.28 als Funktion von hν g = E g ge-
zeigt. Die ideale Konversionseffizienz einer Solarzelle ist gegeben durch
E
Pm J L em
η= = , (10.3.11)
Pin Pin
das heißt, durch das Verhältnis der maximalen Ausgangsleistung Pm und der einfallenden
Strahlungsleistung Pin pro Fläche. Da Pm durch die maximal mögliche Rechtecksfläche un-
ter der Kurve E m (E g ) und Pin durch die gesamte Fläche unter der Kurve J L (E g ) gegeben
ist, kann die ideale Konversionseffizienz grafisch mit Hilfe von Abb. 10.28 ermittelt werden.
Für E g → 0 geht die rote Fläche und damit η gegen null, da zwar alle ankommenden Pho-
tonen Elektron-Loch-Paare erzeugen können, die pro absorbiertes Photon an die Last abge-
gebene Energie E m aber gegen null geht. Für sehr große E g Werte wird zwar E m groß, aber
nur wenige Photonen können jetzt noch Elektron-Loch-Paare anregen und damit wird η
auch hier klein. Die maximal mögliche Rechtecksfläche ergibt sich für E g ≃ 1.35 eV, was
dem Energielückenwert von GaAs nahe kommt. Man erhält für diesen Wert eine maximale
Effizienz von etwa 31 %. Die ideale Konversionseffizienz besitzt ein breites Maximum zwi-
schen E g = 1 und 1.5 eV, hängt also über einen weiten Bereich nicht kritisch von E g ab. Glück-
licherweise gibt es mehrere Halbleitermaterialien mit Energielücken in diesem Bereich. Die
Effizienz, die in der Praxis erhalten wird, liegt mehr oder weniger weit unter der erreichba-
542 10 Halbleiter
ren idealen Effizienz. Einige Ursachen dafür wurden oben bereits genannt, sollen hier aber
nicht im Einzelnen diskutiert werden.
Aufgrund der großen Bedeutung des Wirkungsgrades von Solarzellen für die Anwendung
wurden verschiedene Strategien entwickelt, mit denen die Effizienz von Solarzellen optimiert
werden kann:
29
Miguel Contreras et al., 19.9%-efficient ZnO/CdS/CuInGaSe2 solar cell with 81.2% fill factor, Pro-
gress in Photovoltaics: Research and Applications 16, 235 (2008).
30
J-Y. Kim et al., Efficient tandem polymer solar cells fabricated by all-solution processing, Science 317,
222 (2007).
31
R. R. King et al., 40% efficient metamorphic GaInP/GaInAs/Ge multijunction solar cells, Applied
Physics Letters 90, 183516 (2007).
32
John Bardeen, geboren am 23. Mai 1908 in Madison Wisconsin, gestorben am 30.01.1991 in Bos-
ton.
10.3 Halbleiter-Bauelemente 543
Der schematische Aufbau und der Bandverlauf eines bipolaren npn-Transistors ist in
Abb. 10.30 gezeigt. Ein bipolarer Transistor besteht aus zwei p-n-Übergängen, wobei der ei-
ne (Emitter-Basis-Kontakt) in Durchlassrichtung und der andere (Basis-Kollektor-Kontakt)
in Sperrrichtung geschaltet ist. Bei dem in Durchlassrichtung geschalteten Emitter-Basis-
Kontakt bewirkt eine kleine Änderung δU EB der Emitter-Basis-Spannung eine große Ände-
rung des Emitter-Basis-Stroms I EB . Bei dem in Sperrrichtung geschalteten Basis-Kollektor-
Kontakt bewirkt dagegen eine Veränderung δU BC der Basis-Kollektor-Spannung kaum
eine Veränderung des Basis-Kollektor-Stroms I BC . Der über den Emitter-Basis-Kontakt in
die Basisschicht injizierte Strom (in dem in Abb. 10.30 gezeigten npn-Transistor sind dies
überwiegend Elektronen) kann entweder über die Basis oder den Kollektor abfließen. Da
die Breite der Basis viel kleiner als die Diffusionslänge der Ladungsträger im Basismaterial
ist, werden fast alle über den Emitter-Basis-Kontakt injizierten Ladungsträger über den
Basis-Kollektor-Kontakt abgesaugt. Das bedeutet, dass der Emitterstrom I EB etwa gleich
33
Walter H. Brattain, geboren am 10. Februar 1902 in Amoy, China, gestorben am 13. Oktober 1987
in Seattle.
34
William Bradford Shockley, geboren am 13. Februar 1910 in London, gestorben am 12. August
1989 in London.
35
Die Erfindung des bipolaren Transistors wird allgemein auf Dezember 1947 in den Bell Labora-
tories datiert. Beteiligt an der Erfindung waren William B. Shockley, John Bardeen und Walter
Brattain, die 1956 den Nobelpreis dafür erhielten. In den 1950er Jahren gab es einen Wettlauf zwi-
schen Röhre und Transistor, in dessen Verlauf die Chancen des Transistors häufig eher skeptisch
beurteilt wurden.
Zuerst wurden Transistoren aus Germanium hergestellt und ähnlich wie Röhren in winzige Glas-
röhrchen eingeschmolzen. Das Germanium wurde später durch Silizium ersetzt. Es werden auch
Mischmaterialien benutzt, diese sind aber seltener vertreten.
Wenn man alle Transistoren in sämtlichen bislang hergestellten Schaltkreisen (Speicher, Prozesso-
ren usw.) zusammenzählt, ist der Transistor inzwischen diejenige technische Funktionseinheit, die
bis heute von der Menschheit mit der höchsten Gesamtstückzahl produziert wurde. Heute werden
pro Jahr weit mehr als eine Trillion Transistoren produziert.
544 10 Halbleiter
n++ p+ n+
+ 𝑰𝑩 +
𝑼𝑬𝑩 𝑼𝑩𝑪
𝑬𝒏𝒄
𝝁 +𝒆𝑼𝑬𝑩 p
n
𝑬𝒏𝒗 +
+ −𝒆𝑼𝑩𝑪
𝑬𝒏𝒄
𝝁
n
𝑬𝒏𝒗
+
Abb. 10.30: Schematischer Aufbau (oben) eines npn-Transistors und Bandverlauf für die Situation,
90
dass der Emitter-Basis-Kontakt in Durchlass- und der Basis-Kollektor-Kontakt in Sperrrichtung ge-
schaltet ist (unten). Die Breite der Basisschicht ist klein gegenüber der Diffusionslänge der Ladungs-
träger im Basismaterial, so dass die über die Emitter-Basis-Diode injizierten Ladungsträger fast alle
zum Basis-Kollektor-Übergang diffundieren können und dort durch die anliegende Sperrspannung
abgesaugt werden. Mit den dicken blauen Pfeilen bzw. dünnen roten Pfeilen wird der Majoritätsla-
dungsträger- bzw. Minoritätsladungsträgerstrom angedeutet.
I EB ≃ I BC ⇒ IB ≃ 0 (10.3.12)
gilt. Wir können daraus sofort ersehen, dass die Leistung im Eingangskreis PEB = I B ⋅ U EB ≃ 0
und die Leistung im Ausgangskreis aufgrund der großen Basis-Kollektor-Spannung PBC =
I BC ⋅ U CB ≫ 0.
Auf der Basis der bisherigen Diskussion können wir einfach verstehen, wie wir einen bi-
polaren Transistor als verstärkendes Bauelement verwenden können. Das zu verstärkende
Spannungssignal wird an die Emitter-Basis-Diode angelegt und resultiert in einer großen
Änderung δI EB des Emitter-Basis-Stroms. Da der injizierte Strom fast vollständig über die
Basis-Kollektor-Diode abgesaugt wird, d. h. δI EB ≃ δI BC , erfolgt die Steuerung im Eingangs-
kreis wegen I B ≃ 0 quasi leistungslos. Im Ausgangskreis erhalten wir dagegen eine große
Leistungsänderung δPBC = δI EB ⋅ U BC .
Für eine optimale Funktion des bipolaren Transistors sollte die Basisschicht möglichst dünn
sein (typischerweise 5–25 µm), damit in dieser keine Rekombination der injizierten Elek-
tronen mit den dort in großer Dichte vorhandenen Löchern erfolgt. Bei einer endlichen Re-
kombinationsrate wird I B > 0, das heißt, wir erhalten eine endliche Verlustleistung im Ein-
gangskreis. Die Dicke d B der Basis bestimmt ferner die obere Grenzfrequenz des Transistors.
Mit der charakteristischen Driftgeschwindigkeit v D der Ladungsträger kann die Größenord-
10.3 Halbleiter-Bauelemente 545
nung der Grenzfrequenz zu f G = v D ⇑d B abgeschätzt werden. Durch Reduktion der Dicke der
Basisschicht kann deshalb auch die Grenzfrequenz des Bauelements erhöht werden.
10.3.4.1 Dreitor-Bauelemente
Der bipolare Transistor gehört zu den so genannten Dreitor-Baulementen, die in sehr allge-
meiner und anschaulicher Weise mit dem Landauerschen Flüssigkeitsmodell36 beschrieben
werden können (siehe Abb. 10.31). In diesem Modell wird eine Flüssigkeit A, die sich ent-
lang einer Röhre bewegt (z. B. Elektronenflüssigkeit vom Emitter zum Kollektor) durch einen
Kolben gesteuert (z. B. durch Emitter-Basis-Spannung). Falls der Kolben dicht ist, d. h. falls
die Steuerflüssigkeit B sich nicht mit der in der Röhre strömenden Flüssigkeit A vermischen
kann, ist der Fluss der Steuerflüssigkeit null und die Steuerung erfolgt leistungslos.
Als Flüssigkeit kann eine gewöhnliche Flüssigkeit wie Wasser, aber auch Elektronen, wie z. B.
in Halbleiter-Transistoren oder Elektronenröhren, oder Flussquanten, wie z. B. in den flu-
xonischen Bauelementen der Supraleitungselektronik verwendet werden. Entscheidend für
die gute Funktionsweise und die maximale Geschwindigkeit eines Dreitor-Bauelements ist,
dass sich die Flüssigkeit gut steuern lässt und sich die Flüssigkeitsteilchen schnell bewegen.
Wie oben bereits diskutiert wurde, ist die obere Grenzfrequenz des Bauelements durch f G =
v D ⇑d B gegeben, wobei v D die Driftgeschwindigkeit der Flüssigkeitsteilchen und d B die Ka-
nallänge unter dem Kolben ist. Beide Voraussetzungen sind für elektronische Bauelemente
gut erfüllt. Elektronen können durch elektrische Felder leicht beeinflusst werden und besit-
zen ferner hohe Geschwindigkeiten. Das gleiche gilt für Fluxonen in supraleitenden Bau-
elementen, die sich gut mit Magnetfeldern steuern lassen und sich mit Geschwindigkeiten
bis etwa 1/10 der Lichtgeschwindigkeit bewegen können. Hinsichtlich der Geschwindigkeit
wären Photonen ideal, die sich mit Lichtgeschwindigkeit bewegen. Allerdings lassen sich
E C
Flüssigkeit A
𝒅𝑩 𝒗𝑫
36
Rolf Landauer, geboren am 4. Februar 1927 in Stuttgart, gestorben am 27. April 1999 in Briarcliff
Manor, New York.
Landauer musste aufgrund seiner jüdischen Herkunft Deutschland bereits in früher Jugend ver-
lassen. Er studierte Physik an der Havard University. Nach seinem Studium arbeitete er für etwa
91
2 Jahre bei dem National Advisory Committee for Aeronautics (der späteren NASA) bevor er 1952
zu IBM ans Thomas J Watson Research Center in Yorktown Heights, New York wechselte. Dort
arbeitete er 47 Jahre lang, im Jahr 1967 wurde er zum IBM Fellow ernannt. Landauer interessierte
sich unter anderem für die Grenzen der Datenverarbeitung. Bereits 1961 zeigte er, dass Rechenope-
rationen im Prinzip keine Energie verbrauchen, dass allerdings das Löschen von Information mit
einer Dissipation verbunden ist. Landauer beschäftigte sich außerdem intensiv mit dem Verhalten
von Elektronen in Festkörpern, insbesondere in Halbleitern und Nanostrukturen.
546 10 Halbleiter
Photonen nur schwer beeinflussen, d. h. es ist schwierig, einen einfachen Kolben zur Steue-
rung des Photonenflusses zu realisieren.
37
Von Epitaxie spricht man allgemein, wenn eine definierte Beziehung zwischen der kristallogra-
phischen Ausrichtung eines Substrats und einer Beschichtung vorliegt. Bei der Homoepitaxie sind
Substrat- und Schichtmaterial gleich, bei der Heteroepitaxie unterschiedlich.
38
L. Esaki und R. Tsu, Superlattice and Negative Differential Conductivity in Semiconductors, IBM
J. Res. Develop. 14, 61 (1970).
39
L. Esaki, Compositional Superlattices, in The Technology and Physics of Molecular Beam Epitaxy,
herausgegeben von E. H. C. Parker, Plenum Press, New York (1985).
10.4 Realisierung von niedrigdimensionalen Elektronengassystemen 547
𝑬𝐈𝐈
𝒗
(a) (b) (c)
normale
Abb. 10.32: Banddiskontinuität
Prinzipielle gebrochene (a) normale
gestapelte in Halbleiter-Heterostrukturen:
Typen von Banddiskontinuitäten
(z.B. GaAs/(Al,Ga)As,
(z. B. GaAs/(Al,Ga)As), (b) gestapelte und Banddiskontinuität Banddiskontinuität
(c) gebrochene Banddiskontinuität (z. B. GaSb/InAs).
GaAs/Ge) (z.B. GaSb/InAs)
elementen ausgenutzt und wird in Zukunft sicherlich an Bedeutung gewinnen. Sowohl die
Gitterfehlanpassung als auch der Unterschied in der elektronischen Bandstruktur wird da-
bei häufig kontinuierlich durch Verwendung von ternären oder quaternären Legierungen
98
eingestellt.
Um die grundlegenden Aspekte von Halbleiter-Heterostrukturen zu veranschaulichen,
betrachten wir eine Struktur aus Ge und GaAs. Beide Halbleiter haben etwa die gleiche
Gitterkonstante von 5.65 Å (siehe Abb. 4.5), wobei Ge in der Diamant- und GaAs in der
Zinkblende-Struktur kristallisiert. Es besteht aber ein großer Unterschied bezüglich ihrer
Energielücken, die 0.67 eV für Ge und 1.43 eV für GaAs betragen. Es ist insbesondere dieser
Energielückenunterschied, der die Kombination der beiden Materialien in Heterostrukturen
interessant macht.
Neben der Größe der Energielücke ist auch die Elektronenaffinität der Materialien wichtig,
da der Unterschied der Elektronenaffinität die Größe der Banddiskontinuität
bestimmt. Je nach Größe von ∆χ erhalten wir die in Abb. 10.32 gezeigten prinzipiellen Ty-
pen von Banddiskonuitäten in Halbleiter-Heterostrukturen. Für Ge/GaAs Heterostrukturen
erwartet man aufgrund von Bandstrukturrechnungen, dass die Valenzbandkante von Ge et-
wa 0.42 eV oberhalb und die Leitungsbandkante etwa 0.35 eV unterhalb der von GaAs liegt.
Dies entspricht dem mit „normal“ bezeichneten Typ einer Banddiskontinuität.
Die Banddiskontinuitäten wirken als Potenzialbarrieren für Elektronen und Löcher und
zwar mit entgegengesetztem Vorzeichen. Dies führt an den Grenzflächen zu einer Diffusion
von Elektronen und Löchern in den jeweiligen Halbleitertyp, in dem ihre Energie niedriger
ist. Da die ionisierten Störstellen zurückbleiben, führt dies zu einer Raumladungszone und
40
Two-dimensional Systems: Physics and New Devices, herausgegeben von G. Bauer, F. Kuchar,
H. Heinrich, Springer Series on Solid Sate Science, Vol. 67, Springer Berlin, Heidelberg (1986).
548 10 Halbleiter
zu Bandverbiegungen, wie wir sie für den p-n-Übergang bereits diskutiert haben. Wollen
wir den Bandverlauf in einer Halbleiter-Heterostruktur berechnen, so müssen wir im Prin-
zip die beiden folgenden Probleme lösen:
∎ Wie sieht die Verschiebung ∆E c der Leitungsbandkante und die Verschiebung ∆E v der
Valenzbandkante aus?
∎ Welche Bandverbiegung resultiert bei einem Kontakt der beiden Halbleiter?
In den meisten Fällen können wir diese beiden Probleme getrennt behandeln, da sie mit
unterschiedlichen Energie- und Längenskalen verbunden sind. Die Anpassung der beiden
Bandstrukturen geschieht auf einer atomaren Längenskala. Hier sind atomare Kräfte und
Energieskalen maßgebend und die resultierenden elektrischen Felder sind in der Größen-
ordnung atomarer Felder (∼ 108 V/cm). Die Verbiegung der Bandstruktur erfolgt dagegen
auf einer Längenskala von einigen 10 nm und wird durch die Konzentration der Dotierato-
me in den beteiligten Halbleitern bestimmt. Die aus den Raumladungszonen resultierenden
elektrischen Felder sind nur in der Größenordnung von 105 V/cm.
Bei der Bestimmung der Banddiskontinuitäten spielen Oberflächen- bzw. Grenzflächenef-
fekte eine große Rolle. Wir können deshalb zur Bestimmung der Banddiskontinuitäten nicht
einfach die Bulk-Werte der Elektronenaffinitäten heranziehen. Eine theoretische Beschrei-
bung ist bei einer Berücksichtigung von Grenzflächenzuständen und Ladungstransfervor-
gängen schwierig.41 In Tabelle 10.7 sind die experimentell bestimmten Diskontinuitäten der
Valenzbandkante für einige Paare von Halbleitern aufgelistet. Mit Hilfe von ∆E v kann bei
bekannter Energielücke der Halbleitermaterialien die Diskontinuität ∆E c der Leitungsband-
kante einfach berechnet werden.
41
G. Margaritondo, P. Perfetti, The Problem of Heterojunction Band Discontinuities, in Heterojunc-
tion Band Discontinuities, Phasics and Device Applications, herausgegeben von F. Capasso und
G. Margaritondo, North-Holland, Amsterdam (1987).
10.4 Realisierung von niedrigdimensionalen Elektronengassystemen 549
𝑬 𝑬𝐈𝒄
𝝁 𝚫𝑬𝐜
I 𝑬𝐈𝐈
𝒄
II 𝝁
𝚫𝑬𝐯 𝑬𝐈𝐈
𝒗
𝑬𝐈𝒗
Abb. 10.33: Schemati-
zweidimensionales scher Verlauf der Leitungs-
Elektronengas und Valenzbandkanten in
𝚫𝑬𝐜 einer isotypische Halblei-
𝑬𝐈𝒄 + 𝑬𝐈𝐈
𝒄 ter-Heterostruktur ohne
+ II 𝝁
+ Kontakt (oben) und im
𝝁
𝑬𝐈𝐈
𝒗 thermischen Gleichgewicht
I
𝚫𝑬𝐯 (unten). Im Material II bil-
det sich eine Randschicht
𝑬𝐈𝒗
mit einem zweidimensiona-
−𝒅𝒏 𝟎 +𝒅𝒏 𝒛 len Elektronegas aus.
42
In einigen Materialsystemen liegt eine intrinsische Modulationsdotierung vor. Als Beispiel sollen
isotypische
hier Halbleiter-Heterostruktur
die Kuprat-Supraleiter (z.B. AlAbschnitt
genannt werden (vergleiche xGa1-xAs/GaAs)
13.9.2). In101diesen Materialien
findet die elektrische Leitung in den zweidimensionalen CuO2 -Ebenen statt, wobei die Ladungs-
träger von zwischen den CuO2 -Ebenen liegenden Ladungsreservoirschichten in diese Ebenen do-
tiert werden.
550 10 Halbleiter
den Masten getragen wird, mit Strom versorgt wird. Der Zug kann sich ungestört auf den
Schienen bewegen, ohne mit den Masten zusammenzustoßen.
Die Elektronenmobilität in homogen dotiertem GaAs hat bei einer Donatorkonzentration
von n D ≃ 1017 cm−3 ein Maximum von etwa 8 × 103 cm2 /Vs bei einer Temperatur von et-
wa 150 K. Oberhalb und unterhalb dieser Temperatur nimmt die Beweglichkeit aufgrund der
Streuung an Phononen und Verunreinigungen ab (vergleiche Abb. 10.12). In einer modula-
tionsdotierten Heterostruktur beobachtet man dagegen keine Abnahme der Beweglichkeit
bei tiefen Temperaturen. Die Beweglichkeit steigt mit sinkender Temperatur weiter an und
erreicht unterhalb von 10 K Werte oberhalb von 106 cm2 /Vs. Eine weitere Steigerung kann
durch Einbringen einer undotierten Alx Ga1−x As-Trennschicht zwischen die hochdotierte
AlGaAs- und die schwach dotierte GaAs-Schicht erzielt werden, da dadurch Streuprozesse
an Verunreinigungen in der unmittelbaren Nähe zur Grenzschicht vermieden werden.
Für eine n-Dotierung in AlGaAs im Bereich von 1018 cm−3 liegt die Dicke der Anreiche-
rungsschicht im Bereich zwischen 50 und 100 Å. Die Elektronen sind dadurch in z-Richtung
in einen schmalen, dreieckförmigen Potenzialwall eingesperrt und können sich nur noch in
der x y-Ebene frei bewegen. Wir erhalten somit in der Randschicht ein zweidimensionales
Elektronengas.
10.4.1.2 Kompositionsübergitter
Ähnliche Effekte zu denjenigen in einer einfachen isotypischen Heterostruktur werden in so
genannten Kompositionsübergittern gefunden. Diese erhält man durch heteroepitaktisches
Wachstum von Übergittern, die aus zwei Halbleitermaterialien (z. B. AlGaAs und GaAs) be-
stehen. Wählen wir Materialien ähnlich zu denen in Abb. 10.33, so erhalten wir eine Serie
von so genannten Quantentrögen, in denen sich die Leitungselektronen ansammeln (sie-
he Abb. 10.34). Wir erhalten wiederum eine Modulationsdotierung, da die hohe Dichte der
Leitungselektronen in Material II wiederum von der hohen Dichte der Dotieratome in Mate-
rial I räumlich getrennt ist. Dadurch wird Streuung an Verunreinigungen stark unterdrückt
𝑬 𝑬𝐈𝒄
𝝁 𝚫𝑬𝐜
I I I 𝑬𝐈𝐈
𝒄
II II II 𝝁
𝚫𝑬𝐯 𝑬𝐈𝐈
𝒗
𝑬𝐈𝒗
zweidimensionale
Abb. 10.34: Schematischer Elektronengase
Verlauf der Leitungs- und 𝑬𝐈𝒄 𝚫𝑬𝐜
Valenzbandkanten in einem 𝝁 + + + + + + µ
Kompositionsübergitter oh- 𝑬𝐈𝐈
ne Kontakt (oben) und im I II I II I II 𝒄
und wir erhalten senkrecht zur Wachstumsrichtung der Übergitter (z-Richtung) bei tiefen
Temperaturen eine sehr hohe Elektronenbeweglichkeit. Falls die Breite der einzelnen Schich-
ten des Übergitters sehr klein wird (kleiner als etwa 10 nm), erhalten wir Quantisierungsef-
fekte in den einzelnen Quantentrögen.
Das in Abb. 10.34 gezeigte Übergitter stellt eine Serie von aneinandergrenzenden Potenzial-
wällen endlicher Höhe dar. Da die Wellenfunktionen bei einer endlichen Höhe der Poten-
zialwälle mit einer charakteristischen Abklinglänge 1⇑κ in den verbotenen Zonen abklingen
[vergleiche (7.4.15)], erhalten wir bei einer kleinen Breite der Potenzialwälle eine endliche
Überlagerung der Wellenfunktionen der einzelnen Potenzialmulden. Ähnlich wie die Über-
lagerung von Atomorbitalen zu Bändern führt (vergleiche hierzu Abschnitt 8.3), wenn wir
die Atome einander annähern, spalten die Energieniveaus E n der einzelnen Potenzialtöpfe
durch die Überlagerung in Bänder auf. Wir nennen die entstehenden Bänder Minibänder.
10.4.1.3 Dotierungsübergitter
Wachsen wir eine große Anzahl von zum Beispiel n- und p-dotiertem GaAs epitaktisch
aufeinander auf, so erhalten wir so genannte Dotierungsübergitter. Diese bestehen also aus
dem gleichen Halbleitermaterial, wobei aber die einzelnen Schichten einen unterschiedli-
chen Dotierungstyp haben. In diesen Übergittern erhalten wir dann eine große Zahl von
p-n-Übergängen. Da an den p-n-Übergängen eine Verarmungszone mit einer quasi-intrin-
sischen Ladungsträgerdichte auftritt, werden diese Strukturen auch als ni pi-Strukturen be-
zeichnet.
In den Dotierungsübergittern nähert sich das chemische Potenzial alternierend der Lei-
tungsbandkante (n-Halbleiter) und der Valenzbandkante (p-Halbleiter) an. Da im thermi-
schen Gleichgewicht das chemische Potenzial horizontal verläuft, werden die Leitungsband-
bzw. Valenzbandkante periodisch nach unten und oben gebogen. Dies ist in Abb. 10.35
dargestellt. Wir erhalten durch die periodische Modulation der Leitungs- und Valenzband-
kante eine periodische Modulation der Ladungsträgerdichte. Interessant ist dabei die Tat-
sache, dass die Elektronen und Löcher räumlich getrennt sind, was zu einer längeren Re-
𝑬 𝑬𝐈𝒄 𝑬𝐈𝐈
𝒄
𝝁
I II I II I II
𝝁
𝑬𝐈𝒗 𝑬𝐈𝐈
𝒗
𝑬𝐈𝒄 𝑬𝐈𝐈
𝒄
𝑬𝐞𝐟𝐟
𝒈
𝝁 𝝁 Abb. 10.35: Schematischer
Verlauf der Leitungs- und
𝑬𝐈𝒗 +++ +++ +++ 𝑬𝐈𝐈 Valenzbandkanten in einem
𝒗
Dotierungsübergitter ohne
Kontakt (oben) und im
Modulationsperiode thermischen Gleichgewicht
𝒛 (unten).
Dotierungsübergitter
104
552 10 Halbleiter
kombinationslebensdauer führt. Trotz dieser Trennung liegt aber immer noch ein gewisser
Überlapp der Wellenfunktionen im i-Gebiet vor. Die effektive Bandlücke E geff kann über
die Dotierung gezielt eingestellt werden, wodurch optische Übergänge abgestimmt werden
können.
10.4.1.4 MOSFET
Eine weitere Möglichkeit, ein zweidimensionales Elektronengas zu erhalten, ist der MOSFET
(Metal-Oxide-Semiconductor Field Effect Transistor). Historisch gesehen ist das MOSFET-
Prinzip wesentlich länger bekannt als der Bipolartransistor. Die ersten Patentanmeldungen
stammen aus den Jahren 192643 und 1934.44 Die ersten MOSFETs wurden allerdings erst
1960 gefertigt, als mit Silizium/Siliziumdioxid ein Materialsystem zur Verfügung stand, mit
dem sich reproduzierbar eine gute Halbleiter-Isolator-Grenzfläche herstellen ließ.45 , 46 Damit
verbunden war die Abkehr vom Germanium als Basismaterial und steigende Anforderun-
gen an die Fertigungsbedingungen. Der Feldeffekt-Transistor ist ein unipolarer Transistor.
Unipolar daher, weil im Gegensatz zum bipolaren Transistor, je nach Typ, entweder nur De-
fektelektronen (Löcher) oder Elektronen am Stromtransport beteiligt sind.
𝒑
𝝐𝟐 𝑬𝒄
𝝁
𝝐𝟏
𝟎 𝒅𝒑 𝒛
Abb. 10.36: (a) Schematischer Aufbau eines Si-MOSFET. (b) Verlauf der Leitungs- und Valenzband-
kanten in einem MOSFET bei einer positiven Gate-Spannung U g , was einer Absenkung der poten-
ziellen Energie der Elektronen um (−e)U g in der metallischen Gate-Elektrode entspricht. Aufgrund
der angelegten Gate-Spannung entsteht an der Grenzfläche zwischen p-Halbleiter und Oxidschicht ei-
ne zweidimensionale Ladungsträgerschicht in einem dreieckförmigen Potenzialtopf. In dem gezeigten
Fall ist nur das unterste Subband besetzt. 105
43
Julius Edgar Lilienfeld, U.S. Patent 1 745 175, Method and apparatus for controlling electric currents
(1930); eingereicht 1926.
44
Oskar Heil, British Patent 439 457, Improvements in or relating to electrical amplifiers and other
control arrangements and devices (1935); zuerst eingereicht in Deutschland am 2. März 1934.
45
D. Kahng, M. M. Atalla, Silicon-silicon dioxide field induced surface devices, IRE Solid State Res.
Conf., Pittsburgh (1960).
46
D. Kahng, A Historical Perspective on the Development of MOS Transistors and Related Devices,
IEEE Trans. El. Dev. ED-23, 655 (1976).
10.4 Realisierung von niedrigdimensionalen Elektronengassystemen 553
Der schematische Aufbau eines Si-MOSFETs ist in Abb. 10.36a gezeigt. Wird keine Span-
nung an die Gate-Elektrode angelegt, so wirkt das darunterliegende, leicht p-dotierte Sili-
zium (Substrat) aufgrund der beiden p-n-Kontakte im Source-Drain-Kanal sperrend. Der
einzige Strom, der zwischen den beiden Kontakten Source und Drain fließen kann, ist der
Sperrstrom des p-n-Kontakts. Wenn über dem Gate eine positive Spannung angelegt wird,
wandern Minoritätsladungsträger (bei p-Silizium Elektronen) im Substrat an die Grenz-
schicht und rekombinieren dort mit den Majoritätsladungsträgern (bei p-Silizium Löcher).
Dies wirkt sich wie eine Verdrängung der Majoritätsladungsträger aus und wird Verarmung
genannt. Ab einer bestimmten Spannung U th (=Threshold-Spannung) ist die Verdrängung
der Majoritätsladungsträger so groß, dass diese nicht mehr für die Rekombination zur Ver-
fügung stehen. Es kommt zu einer Ansammlung der Minoritäten an der Grenzfläche zur
Oxidschicht, die einen n-leitenden Kanal erzeugen, so dass jetzt Ladungsträger zwischen
Source und Drain fließen können. Dieser Zustand wird starke Inversion genannt.
Der Verlauf der Leitungs- und Valenzbandkanten in einem MOSFET bei einer angelegten
positiven Gate-Spannung U g ist in Abb. 10.36b gezeigt. Ab einer bestimmten Spannung U th
sinkt die Leitungsbandkante an der Grenzfläche zur Oxidschicht unter das chemische Po-
tenzial ab und wir erhalten eine sehr hohe Elektronenkonzentration unmittelbar an der
Grenzfläche. Wir sprechen von einem Inversionskanal. Falls die Breite des Inversionskanals
sehr klein ist (kleiner als etwa 10 nm) erhalten wir Quantisierungseffekte in dem dreieck-
förmigen Potenzialtrog. Die Elektronen befinden sich also in z-Richtung in einem Poten-
zialtopf (siehe Abb. 10.36) und können sich nur noch in der x y-Ebene frei bewegen. Die
Eigenenergien sind dann durch E n = E∥ + є n gegeben.47 Auf jeden Energieeigenwert є n baut
sich ein Quasi-Kontinuum, ein so genanntes Subband auf, das durch die kinetische Energie
der Elektronen parallel zur Grenzfläche bedingt ist. Bei genügend tiefen Temperaturen lässt
sich erreichen, dass nur noch das unterste Subband besetzt ist. In diesem Fall haben wir in
der Randschicht ein zweidimensionales Elektronengas vorliegen. An einem derartigen Elek-
tronengas hat Klaus von Klitzing im Jahr 1980 den Quanten-Hall-Effekt entdeckt.48 , 49 Für
die Elektronenzahl in der Randschicht gilt n 2D ∝ U g − U th , wobei U g die angelegte Gate-
Spannung ist.
Die Kanallänge L von MOSFETs wurde durch die immer höhere Packungsdichte von
Transistoren in integrierten Schaltungen seit 1960 von einigen 10 µm bis auf heute weit
unter 100 nm reduziert. Diese dem Mooreschen Gesetz 50 folgende exponentielle Abnahme
der Kanallänge L mit der Zeit wird wohl aber in einigen Jahren an eine physikalische Grenze
stoßen.
47
Die Ausdrücke für є n weichen natürlich für einen dreieckförmigen Potenzialtopf von den
durch (7.4.12) gegebenen Werten für einen rechteckförmigen Potenzialtopf ab.
48
K. von Klitzing, G. Dorda, M. Pepper, New Method for High-Accuracy Determination of the Fine-
Structure Constant Based on Quantized Hall Resistance, Phys. Rev. Lett. 45, 494–497 (1980).
49
K. von Klitzing, G. Dorda, M. Pepper, High-magnetic-field transport in a dilute two-dimensional
electron gas, Phys. Rev. B 28, 4886–4888 (1983).
50
Als Mooresches Gesetz wird die empirische Beobachtung bezeichnet, dass bei der technologischen
Entwicklungen von integrierten Schaltkreisen sich die Komplexität eines integrierten Schaltkreises
etwa alle 2 Jahre verdoppelt. Diese Gesetzmäßigkeit wurde erstmals von Gordon E. Moore, einem
der Mitbegründer der Firma Intel, im April 1965 formuliert und wird deshalb heute nach ihm
benannt: „The complexity for minimum component costs has increased at a rate of roughly a factor of
554 10 Halbleiter
𝒑
𝑬𝒄 optisch aktiver
Bereich
𝑬𝒏𝒄
I
µn
p
ℏ𝜔 𝑬𝒈 𝒆𝑼
µp n (Al,Ga)As
GaAs
p
𝒉𝝂
𝒑
𝑬𝒗
(Al,Ga)As n
+ optisch
raue glatt
𝑬𝒏𝒗
Oberfläche
(Al,Ga)As GaAs (Al,Ga)As
Abb. 10.37: Double Heterostructure Injection Laser: Elektronen fließen von rechts in die grün hin-
terlegte optisch aktive Zone, Löcher von links. Beide werden dort eingefangen und bilden entartete
Elektronen- bzw. Lochgase.
GaAs als optisch aktive Schicht: 𝐸𝑔 = 1.43 eV 𝜆 = 838 nm
two per year . . . Certainly over the short term this rate can be expected to continue, if not to increase.
Over the longer term, the rate of increase is a bit more uncertain, although there is no reason to believe
it will not remain nearly constant for at least 10 years. That means by 1975, the number of components
per integrated circuit for minimum cost will be 65,000. I believe that such a large circuit can be built
109
on a single wafer.“
51
Herbert Kroemer (Herbert Krömer), geboren am 25. August 1928 in Weimar. Er wurde im
Jahr 2000 zusammen mit Schores Iwanowitsch Alfjorow mit der Hälfte des Nobelpreises für Physik
für die Entwicklung von Halbleiterheterostrukturen für Hochgeschwindigkeits- und Optoelektro-
nik ausgezeichnet, die andere Hälfte ging an Jack Kilby für die Entwicklung Integrierter Schalt-
kreise.
10.5 Zweidimensionales Elektronengas: Quanten-Hall-Effekt 555
Valenzband. Das heißt, Elektronen und Löcher erreichen jeweils getrennt sehr schnell einen
Gleichgewichtszustand, aber nicht untereinander. Wir können dann sowohl den Elektronen
als auch den Löchern getrennte chemische Potenziale µ n und µ p (Quasi-Potenziale) zuord-
nen. Diese Quasi-Potenziale verlaufen horizontal, da jeweils die Elektronen und Löcher im
Gleichgewicht sind. Um eine Besetzungsinversion zu erhalten, muss
µ n − µ p > Eg (10.4.2)
gelten.52 Das heißt, um den Laserbetrieb zu erhalten, muss der Abstand der Quasi-Potenziale
größer als die Energielücke sein. Diese Bedingung wird in Abb. 10.37 dadurch erreicht, dass
eine Spannung eU > E g angelegt wird, wobei E g die Energielücke der optisch aktiven Zone
ist.
Die in Abb. 10.37 gezeigte Diodenstruktur bildet gleichzeitig einen optischen Resonator, da
die Reflektivität an der Halbleiterkristall-Luft Grenzfläche groß ist. Die Halbleiterkristalle
werden planparallel poliert und die Strahlung wird parallel zur Ebene des Heterokontakts
emittiert. Verwendet man GaAs als optisch aktive Schicht, so erhält man Laserstrahlung im
nahen Infrarotbereich bei einer Wellenlänge von 838.3 nm oder 1.43 eV. Der Wirkungsgrad
solcher GaAs-Laserdioden ist sehr groß. Das Verhältnis von Lichtleistung zu elektrischer
Leistung beträgt fast 50 %. Die Wellenlänge dieser Laser kann über einen weiten Bereich
durch Verwendung von Legierungen des Typs Gax In1−x P y As1−y variiert werden und da-
durch dem Minimum der optischen Absorption von Glasfasern angepasst werden. Die Kom-
bination von Double Heterostructure Injection Lasern mit Glasfasern bildet das Kernstück
unserer heutigen optischen Datenkommunikation.53
52
siehe z. B. The Physics of Semiconductor Devices, S. M. Sze, John Wiley & Sons, New York (1981).
53
Heute wird eine Vielzahl von unterschiedlichen Halbleiterlasern mit unterschiedlichen Wellenlän-
gen hergestellt, die wichtige Anwendungsgebiete haben. Neben der optischen Datenkommunika-
tion sind vor allem die Anwendung in Blu-ray-Disc- und in HD-DVD-Laufwerken (405 nm, blau-
violett, basierend auf dem Halbleitermaterial InGaN), der Einsatz als Pumplaser für Nd:YAG-Laser
z. B. bei grünen Laser-Pointern oder bei Diodenlasern (808 nm, infrarot, basierend GaAlAs) sowie
die Verwendung in kostengünstigen roten Laser-Pointern oder Barcode-Lesegeräten (670 nm, rot,
basierend auf InGaAlP). Der erreichbare Wirkungsgrad von Laserdioden lag im Jahr 2012 zwi-
schen 10% (grün, 530 bis 540 nm), 20% (blau, 440 nm) und 70% (rot und IR, ab 650 nm). Blaue
Laserdioden erreichen mittlerweile einen Wirkungsgrad von 27% und Lebensdauer von 10 000
Stunden. Die Herstellung geeigneter InGaN-Halbleitermaterialien für leistungsfähige grüne Laser
ist noch immer schwierig. Für Beleuchtungszwecke ist es deshalb preiswerter, mit kurzwelligem
blauem Licht geeignete Leuchtstoffe im langwelligeren Bereich anzuregen
556 10 Halbleiter
E n = є 1 + (n + 12 ) ħω c + g s µ B sB . (10.5.1)
Hierbei ist є 1 die Energie des untersten Subbandes. Wir haben zusätzlich berücksichtigt,
dass wir zwei mögliche Spin-Einstellungen s = ± 12 vorliegen haben und die Zustände deshalb
im Magnetfeld aufspalten (µ B ist das Bohrsche Magneton und g s ist der Landé-Faktor für
Elektronen). Den Spin-Freiheitsgrad werden wir bei der nachfolgenden Diskussion nicht
berücksichtigen.
Die Quantisierung der Elektronenenergien in Landau-Niveaus mit Abstand ħω c führt
zu einer Aufspaltung des parabelförmigen Subbandes in diskrete Energieniveaus (siehe
Abb. 10.38). Der in Abb. 7.21 für B = 0 gezeigte stufenförmige Verlauf der Zustandsdich-
te spaltet in einem angelegten Magnetfeld in eine Reihe von δ-funktionsartigen Peaks
auf, die einen Abstand ħω c voneinander haben. Wir können sagen, dass die Zustände in
scharfe Landau-Niveaus „kondensieren“. Da keine Zustände verloren gehen, müssen die
Landau-Niveaus den Entartungsgrad
m eB
p = ħω c D 2D = ħω c 2
Lx L y = Lx L y (10.5.2)
2πħ h
haben, den wir bereits in Abschnitt 9.10 hergeleitet haben [vergleiche (9.10.17)]. Hierbei
ist D 2D = 2πħ
m
2 L x L y die zweidimensionale Zustandsdichte für eine Spin-Richtung [verglei-
che (7.1.20) oder (7.4.13)]. Setzen wir Zahlenwerte ein, so erhalten wir
eB
p= L x L y = 2.42 × 1010 cm−2 × B(︀T⌋︀ × L x L y (︀cm2 ⌋︀ . (10.5.3)
h
Wir können die Entartung p auch schreiben als
Lx L y 2πħ
p= mit ℓ 2B = . (10.5.4)
ℓ 2B eB
Die magnetische Landau-Länge ℓ B entspricht dabei dem Radius des klassischen Elektronen-
orbits für das Niveau n = 1. Sie beträgt etwa 25 nm für B = 1 T. Entsprechend können wir im
reziproken Raum p schreiben als
k B2
p= , (10.5.5)
kx k y
10.5 Zweidimensionales Elektronengas: Quanten-Hall-Effekt 557
(a) 𝑬 (b) 𝑬
𝜺𝟐 𝜺𝟐
ℏ𝝎𝒄
𝜺𝟏 𝜺𝟏
1. Subband
𝟎 𝒌|| 0 1 2
𝑫𝟐𝑫 𝑳𝒙 𝑳𝒚 𝒎⋆ /𝟐𝝅ℏ𝟐
(c) 𝒌𝒚
n=3
n=2
n=1
n=0
𝑩>𝟎
𝒌𝒙
115
Abb. 10.38: Qualitative Darstellung der Zustandsquantisierung in einem zweidimensionalen Elektro-
nengas. (a) Energieparabeln des 1. und 2. Subbandes. Das chemische Potenzial liegt zwischen 1. und
2. Subband. Durch Anlegen des Magnetfeldes erhalten wir eine zusätzliche Quantisierung in Landau-
Niveaus (Punkte). (b) Zustandsdichte des zweidimensionalen Elektronengases ohne (gestrichelte Li-
nie) und mit Magnetfeld (schraffierte Flächen). (c) Quantisierung der ohne Feld gleichförmig im zwei-
dimensionalen k-Raum verteilten Zustände auf Landau-Kreise.
wobei k B2 = (2π⇑ℓ B ) = S = 2πeB⇑ħ die Fläche pro Zustand im k-Raum ist und k x, y =
2
2π⇑L x, y .
Mit dem magnetischen Fluss Φ = BL x L y , der die Probe durchsetzt, und dem Fluss-
̃ 0 = h⇑e können wir die Entartung auch als
quant Φ
eB Φ
p= Lx L y = = NΦ (10.5.6)
h ̃
Φ0
schreiben. Der Entartungsgrad entspricht also der Zahl N Φ der magnetischen Flussquanten
in der Probe. Liegt das chemische Potenzial zwischen zwei Landau-Niveaus, so ist die Ge-
samtzahl der Elektronen N e = n ⋅ p = n ⋅ N Φ und damit N e ⇑N Φ = n = ganzzahlig. Allgemein
bezeichnen wir das Verhältnis ν = N e ⇑N Φ als den Füllfaktor. Liegt also das chemische Po-
tenzial zwischen zwei Landau-Niveaus, so ist ν = n, d. h. der Füllfaktor ist ganzzahlig und
entspricht dem obersten besetzten Landau-Niveau.
Die Gesamtenergie des Elektronensystems als Funktion des angelegten Feldes haben wir be-
reits ausführlich im Zusammenhang mit dem de Haas-van Alphen-Effekt in Abschnitt 9.11.1
558 10 Halbleiter
diskutiert. Wir haben gesehen, dass die freie Energie als Funktion des Magnetfeldes oszil-
liert und zwar periodisch in 1⇑B. Dies führt zu charakteristischen Oszillation der Magne-
tisierung (de Haas-van Alphen-Effekt) oder des elektrischen Widerstands (Shubnikov-de
Haas-Effekt).
Gehen wir von freien Elektronen zu Kristallelektronen über, so müssen wir Folgendes be-
achten:
1. Wir müssen in den Ausdrücken für die Zustandsdichte, die Energieeigenwerte oder die
Zyklotronfrequenz die freie Elektronenmasse m durch die effektive Bandmasse m∗ er-
setzen.
2. Durch das Magnetfeld wird nicht nur die Spin-Entartung aufgehoben, sondern in Si auch
noch die durch die Struktur des Leitungsbandes bedingte zweifache Valley-Entartung
aufgehoben. Das bedeutet, dass jedes Landau-Niveau insgesamt in vier Niveaus aufspal-
tet.
3. Durch die Streuung der Ladungsträger an Gitterdefekten und Phononen werden die
Landau-Niveaus verbreitert. Aus der Unschärferelation ergibt sich für eine mittlere
Streuzeit τ eine Energieverschmierung ∆E = ħ⇑τ. Effekte, die mit der Aufspaltung in
die Landau-Niveaus verbunden sind, können nur dann experimentell gut beobachtet
werden, wenn ∆E ≪ ħω c , also
ωc τ ≫ 1 oder µB ≫ 1 . (10.5.7)
Wir benötigen also hohe Felder und lange Streuzeiten τ bzw. hohe Beweglichkeiten µ.
Letzteres erreichen wir durch tiefe Temperaturen und saubere Proben.
J σ0 1 +ω c τ E x
( x) = ( )( ) (10.5.8)
Jy 1 + ω 2c τ 2 −ω c τ 1 Ey
mit
n 2D e 2 τ
σ0 = . (10.5.9)
m∗
Hierbei ist n 2D die Zahl der Elektronen pro Flächeneinheit.
10.5 Zweidimensionales Elektronengas: Quanten-Hall-Effekt 559
Da der Leitfähigkeitstensor und der Widerstandstensor invers zueinander sind, können wir
durch Invertieren der obigen Matrix folgende Beziehungen ableiten:
ρx x −ρ x y
σx x = σx y =
ρ 2x x + ρ 2x y + ρ 2x y
ρ 2x x (10.5.10)
σ y y = σx x σ yx = −σx y
σx x −σx y
ρx x = ρx y =
σx2x + σx2 y σx2x + σx2 y . (10.5.11)
ρ y y = ρx x ρ yx = −ρ x y
Im Experiment wird ein Strom in Längsrichtung (x-Richtung) vorgegeben und die Längs-
und Querspannung gemessen. Es gilt
Ux
Ux = ρx x Lx ⋅ Jx ⇒ ρx x = (10.5.12)
Jx Lx
Uy
U y = ρx y L y ⋅ Jx ⇒ ρx y = . (10.5.13)
Jx L y
𝑼𝒈 Gate-Elektrode
𝑼𝒚
Isolator Abb. 10.39: Schematische Darstel-
lung der für die Messung der elek-
𝑳𝒚 trischen Transporteigenschaften von
𝑱𝒙 zweidimensionalen Elektronengasen
verwendeten „Hall-Bar“-Geometrie.
𝑳𝒙
Die Elektronendichte n 2D im Elek-
2D-Elektronengas tronengas kann durch Variation der
𝑼𝒙 Gate-Spannung U g variiert werden.
54
Dies gilt für Löcher mit Ladung +e. Für Elektronen ist die Kraft durch das Hall-Feld −eU H ⇑L y . Die
Lorentz-Kraft behält ihr Vorzeichen, da wir e durch −e, aber auch v x durch −v x ersetzen müssen,
weil sich die Elektronen bei gleicher Stromrichtung in die entgegengesetzte Richtung bewegen.
55
Aus (10.5.10) und (10.5.11) folgt, dass für σx x = 0 auch ρ x x = 0. Das heißt, J x kann ohne E x fließen,
so dass die effektive Leitfähigkeit gegen unendlich geht. Paradoxerweise erhalten wir diesen Grenz-
116
560 10 Halbleiter
𝑫𝟐𝐃 𝑬
𝑫𝟐𝐃 𝑬
𝑫𝟐𝐃 𝑬
ℏ𝜔𝑐
𝟎 𝝁 𝑬 𝟎 𝝁 𝑬 𝟎 𝝁 𝑬
Abb. 10.40: Besetzung der Landau-Niveaus für unterschiedliche Magnetfelder. Das Magnetfeld nimmt
von links nach rechts zu. Mit zunehmendem B nimmt die Entartung der Landau-Niveaus zu, was durch
zunehmende Flächen der Zustandsdichtepeaks berücksichtigt ist.
Abb. 10.40 zeigt, dass die Zustandsdichte beim chemische Potenzial µ als Funktion des ange-
legten Magnetfeldes variiert. Sie wird null, wenn der Füllfaktor ν = n, also ganzzahlig ist und
hat ein Maximum für ν ≃ n + 12 . Diese Variation kann in vielen physikalischen Eigenschaften
beobachtet werden. So zeigt der elektrische Widerstand starke Oszillationen als Funktion
120 des
angelegten Magnetfeldes, die Shubnikov-de Haas Oszillationen genannt werden. Die elek-
trische Leitfähigkeit σx x wird null für ν = n, wenn die Zustandsdichte bei µ verschwindet,
und maximal für ν ≃ n + 12 , wenn die Zustandsdichte bei µ maximal ist. Nach (10.5.11) wird
für σx x = 0 auch ρ x x = 0.
fall gerade dann, wenn σx x , σ y y → 0. Wir können aber leicht zeigen, dass die effektive Leitfähigkeit
immer noch endlich ist. Es gilt nämlich
J x = σx x E x + σx y E y
J y = σ y y E y + σ yx E x
und aus geometrischen Gründen gilt J y = 0, so dass
σx y
Ey = Ex .
σy y
Hierbei haben wir σ yx = −σx y verwendet. Setzen wir dies in den Ausdruck für J x ein, so erhalten
wir
σx2y
J x = (σx x + ) E x = σeff E x .
σy y
Wir sehen, dass σeff → ∞ für σx x , σ y y → 0.
56
K. von Klitzing, G. Dorda, M. Pepper, New Method for High-Accuracy Determination of the Fine-
Structure Constant Based on Quantized Hall Resistance, Phys. Rev. Lett. 45, 494–497 (1980).
10.5 Zweidimensionales Elektronengas: Quanten-Hall-Effekt 561
30 3.0
25 2.5
20 2.0
Ux (mV)
Uy (mV)
15 1.5
Ux
10 1.0
5 Uy 0.5
messen werden. Er wird deshalb von den Eichanstalten als Widerstandsnormal verwendet.
Der heutige Wert der von Klitzing-Konstante lautet
h
RK = = 25 812.807 4555(59)Ω . (10.5.15)
e2
Außerdem kann die Messung von R K zur Präzisionsbestimmung der Sommerfeldschen Fein-
struktur-Konstanten
}︂
µ0 c e 2 1 µ0 e 2
α= = = 7.297 352 5664(17) × 10−3 (10.5.16)
2 h 2 є0 h
herangezogen werden.
Wir wollen zunächst eine stark vereinfachte Erklärung für das Auftreten der Oszillationen
im Längswiderstand und der Plateaus im Querwiderstand geben. Wir setzen k B T ≪ ħω c
voraus und nehmen an, dass wir die Gate-Spannung auf einen Wert eingestellt haben, dass
die Dichte der Elektronen gerade N e = n ⋅ p ist. Das bedeutet, dass das chemische Potenzial
zwischen dem n-ten und (n + 1)-ten Landau-Niveau liegen muss. Für die Elektronendichte
gilt dann
Ne n⋅p eB
n 2D = = =n . (10.5.17)
Lx L y Lx L y h
Formal entspricht die Situation derjenigen eines Isolators, bei dem das chemische Poten-
zial zwischen einem vollständig gefüllten und einem vollkommen leeren Band liegt. Da in
einem vollständig gefüllten Band die Transportstromdichte verschwindet (vergleiche hier-
zu die Diskussion in Abschnitt 9.2), und auch wegen k B T ≪ ħω c Anregungen ins nächst
höhere Landau-Niveau sehr unwahrscheinlich sind, erwarten deshalb
σx x = σ y y → 0 , ρx x → 0 , (10.5.18)
B h 1
ρx y = = . (10.5.19)
n 2D e e 2 n
Das heißt, wir haben das beobachtete Ergebnis erklärt, aber eben nur für eine bestimm-
te Gate-Spannung. Würden wir die Gate-Spannung nur infinitesimal ändern, so hätten wir
ein teilweise gefülltes Landau-Niveau vorliegen. Die elektrische Leitfähigkeit σx x wäre dann
endlich und die Beziehungen (10.5.18) und (10.5.19) würden nicht mehr gelten. Wir würden
damit keine Plateaus im Querwiderstand erhalten, die Länge der Plateaus als Funktion der
Gate-Spannung würde vielmehr gegen null gehen.
Auch eine detailliertere Betrachtung zeigt, dass für eine perfekte Probe die Breite der
Quanten-Hall-Plateaus in der Tat null sein sollte. Allerdings besitzen reale Proben immer
Defekte und diese resultieren in einer Verbreiterung der Landau-Niveaus. Wie Abb. 10.42
zeigt, liegen in der Zustandsdichte keine δ-Funktionen bei (n + 12 )ħω c , sondern stark ver-
breiterte Glockenkurven vor. In den Flanken dieser Kurven sind die Zustände an Störstellen
lokalisiert und tragen deshalb nicht zum Transport bei. Nur im zentralen Bereich liegen
delokalisierte Zustände vor. Das Vorliegen lokalisierter und delokalisierter Zustände ist für
die Erklärung der endlichen Breite der Hall-Plateaus von essentieller Bedeutung.
10.5 Zweidimensionales Elektronengas: Quanten-Hall-Effekt 563
ausgedehnte lokalisierte
Zustände Zustände
DOS
In Abb. 10.43 ist das Gesamtpotenzial eines zweidimensionalen Elektronengases mit Unor-
dung (z. B. durch Verunreinigungen, Kristalldefekte) gezeigt. Das Unordnungspotenzial ϕ dis
führt zu räumlichen Fluktuationen des Landau-Niveaus.125Für eine räumlich eingeschränk-
te Probe müssen wir noch das Einschlusspotenzial hinzufügen, das im Probeninneren ver-
schwindet und am Probenrand steil zum Vakuumniveau ansteigt. Da die Landau-Niveaus
am Probenrand durch das Einschlusspotenzial steil nach oben gebogen werden, schneidet
das chemische Potenzial die Landau-Niveaus am Probenrand. Um die Auswirkung von Un-
ordnung auf die Bewegung von Elektronen im Magnetfeld qualitativ zu diskutieren, nehmen
wir an, dass ϕ dis räumlich nur langsam variiert. Nehmen wir ⋃︀∇ϕ dis ⋃︀ ⋅ ℓ B ≪ ħω c an, so kön-
nen wir die Bewegung der Elektronen in zwei Anteile zerlegen. Erstens eine schnelle Zyklo-
tronbewegung und zweitens eine langsame Driftbewegung des Schwerpunkts der Zyklotron-
bahn entlang der Äquipotenziallinien des Gesamtpotenzials ϕ = ϕ dis + ϕ el , wobei ϕ el das an-
gelegte elektrische Potenzial ist. Dies ist schematisch in Abb. 10.43 gezeigt. Die Bewegung der
Elektronen erfolgt in so genannten Skipping Orbits entlang der Äquipotenziallinien von ϕ.
Die Bewegungsrichtung der Driftbewegung wird durch die Lorentz-Kraft bestimmt, die pro-
portional zu ∇ϕ × B ist. Am Probenrand stoßen die Elektronen an das Einschlusspotenzial
und werden elastisch reflektiert. Dabei unterdrückt das starke Magnetfeld die Rückstreuung.
Die Elektronen können sich auf ihren Skipping Orbits nur in eine Richtung bewegen, die auf
den gegenüberliegenden Probenseiten entgegengesetzt gerichtet ist. Wir können uns leicht
überlegen, dass selbst Streuprozesse an Defekten diese bevorzugte Bewegungsrichtung nicht
ändern können. Am Probenrand bilden sich also durch die Skipping Orbits eindimensionale
Randkanäle aus. Jedes Elektron, das in den Randkanal eintritt, wird mit der Transmissions-
wahrscheinlichkeit t = 1 durch den Kanal transmittiert. Aufgrund der in Abschnitt 7.5.1 ge-
führten Diskussion können wird diesem Transportkanal den Leitwert e 2 ⇑h zuordnen. Wir
werden auf die Randkanäle weiter unten nochmals zurückkommen. Wir wollen noch dar-
auf hinweisen, dass die Elektronen, die um Erhebungen des Unordnungspotenzials über das
chemische Potenzial umlaufen, räumlich lokalisiert sind (siehe hierzu Abb. 10.43, links).
Benutzen wir die Bohr-Sommerfeld-Quantisierung, so können wir das gerade vorgestell-
te klassische in ein quantenmechanisches Bild überführen. Wie in Abschnitt 9.10 diskutiert
wurde, ist eine Konsequenz der Bohr-Sommerfeld-Quantisierung die Quantisierung der von
einem Zyklotronorbit im k-Raum umschlossenen Fläche in ganzzahligen Vielfachen der Flä-
che S = (2πe⇑ħ)B. Im Ortsraum umschließen die Bahnen ganzzahlige Vielfache eines Fluss-
564 10 Halbleiter
Einschlusspotenzial 𝑬
Skipping
Orbits (c)
𝝓𝐝𝐢𝐬
𝑩
(b)
𝝁
𝐸
𝑥 (a)
𝝁
𝑦
𝝁 𝑦
Abb. 10.43: Links: Schematische Darstellung des Potenzialverlaufs in einem zweidimensionalen Elek-
tronengas. Aus Gründen der Übersichtlichkeit ist nur ein Landau-Niveau gezeigt. Das endliche Unord-
nungspotenzial ϕ dis bewirkt räumliche Fluktuationen des Gesamtpotenzials, die durch zwei Potenzial-
126
hügel angedeutet sind. Am Rand der Probe steigt das Gesamtpotenzial durch das Einschlusspotenzial
stark an. Rechts sind Schnitte des Gesamtpotenzials für zwei benachbarte Landau-Niveaus n und n + 1
senkrecht zur Probe (y-Richtung) gezeigt. Von (a) nach (c) wird die Ladungsträgerdichte erhöht und
damit das chemische Potenzial µ nach oben geschoben. Dies entspricht den in Abb. 10.44(a) bis (c)
gezeigten Situationen. Die gelben Punkte markieren die Randkanäle.
beitragen. In Abb. 10.44 haben wir die Droplets als schattierte Flächen eingezeichnet und die
Randelektronen sind durch die durchgezogenen Ränder der Droplets gekennzeichnet. Wir
haben oben bereits diskutiert, dass wir die Bewegung der Randelektronen mit so genannten
Skipping Orbits beschreiben können. Elektronen weit weg vom Rand des Droplets können
Kreisbahnen ausführen. Am Rand wird aber die Kreisbewegung durch die Streuung mit dem
Rand unterbrochen und wir erhalten eine springende Bewegung entlang des Randes.
Abb. 10.44(a) zeigt, dass wir bei der gewählten Ladungsträgerdichte nur lokalisierte Zustän-
de haben, die in den Mulden des Unordnungspotenzial gebunden sind. Erhöhen wir jetzt
die Ladungsträgerdichte durch Variation der Gate-Spannung, so schieben wir das chemische
Potenzial µ nach oben. Wie Abb. 10.43(b) zeigt, nimmt die Zahl der Zustände mit E < µ da-
durch zu. Die Größe der vorhandenen Quantum-Hall-Droplets wächst und neue kommen
hinzu. Haben wir die Ladungsträgerdichte soweit erhöht, dass die Droplets überlappen [sie-
he Abb. 10.44(b)], so können Elektronen über die zusammenhängenden Droplets von der
einen zur anderen Probenseite gelangen. Wir haben es jetzt mit ausgedehnten Zuständen
zu tun und µ liegt im Bereich der delokalisierten Zustände. Erhöhen wir die Ladungsträ-
gerdichte weiter, so liegt µ schließlich im Bereich der lokalisierten Zustände oberhalb des
delokalisierten Bereichs. Wie Abb. 10.44(c) zeigt, erhalten wir hier Quantum-Hall-Droplets,
566 10 Halbleiter
(a) 𝑬 lokalisierte
Zustände
𝟏
ℏ𝝎𝒄
𝟐
𝝁
𝟎
DOS
(b) 𝑬
ausgedehnte
Zustände
𝟏 𝝁
ℏ𝝎𝒄
𝟐
𝟎
DOS
(c) 𝑬
𝝁
𝟏
ℏ𝝎𝒄
𝟐
𝟎
DOS 127
Abb. 10.44: Schematische Darstellung von Quantum-Hall-Droplets (links) und der Zustandsdichte
(rechts) für unterschiedliche Lagen des chemischen Potenzials µ. Die Droplets sind als gefüllte Flä-
che dargestellt, die Elektronenbahnen als durchgezogene Linien mit Pfeilen. (a) µ liegt unterhalb des
1. Landau-Niveaus im Bereich der lokalisierten Zustände (hellgrau). (b) µ liegt im Bereich der deloka-
lisierten Zustände (dunkelgrau). (c) µ liegt oberhalb des 1. Landau-Niveaus im Bereich der lokaliserten
Zustände (hellgrau).
die keine Zustände enthalten. Wir bezeichnen diese als Loch-Droplets.58 Die Bewegungs-
richtung der Skipping Orbits um die Loch-Droplets herum ist der Bewegungsrichtung der
Skipping Orbits innerhalb der Droplets in Abb. 10.44(a) genau entgegengesetzt.
Wir können nun das in Abb. 10.43 und 10.44 gezeigte Bild verwenden, um das Entstehen
der Hall-Plateaus zu erklären. Für kleine Ladungsträgerdichten liegen nur wenige Droplets
vor, die klein und wohl getrennt voneinander sind. Das heißt, dass die Orbits der Randelek-
tronen nicht überlappen und somit lokalisiert sind. Somit ist σx x = ρ x x = 0. Erhöhen wir die
Ladungsträgerdichte, so überlappen einige Droplets, σx x und ρ x x bleiben aber null, solan-
ge die Droplets noch keinen geschlossenen Pfad zwischen den Spannungskontakten bilden
können. Erst bei weiterer Erhöhung der Ladungsträgerdichte bildet sich ein Perkolationspfad
von der einen zur anderen Probenseite aus. Wir erhalten dann ausgedehnte Zustände, wo-
durch σx x und ρ x x endlich werden. Bei weiterer Erhöhung der Ladungsträgerdichte rückt das
äußerste Skipping Orbit an den Rand der Probe, wo das Potenzial aufgrund des Einschlus-
58
Anschaulich entspricht die Situation einem Potenzialgebirge, das wir in einer Badewanne langsam
mit Wasser überfluten. Am Anfang bilden sich einige kleinere Seen an den tiefsten Stellen des Po-
tenzialgebirges (Droplets). Steigt der Wasserspiegel, so überlappen sich irgendwann die Seen und
bilden eine zusammenhängende Wasserfläche, die vom einen bis zum anderen Rand der Badewan-
ne reicht (ausgedehnte Zustände). Schließlich werden nach weiterem Anstieg des Wasserpegels nur
noch einige Bergspitzen aus dem Wasser ragen, die quasi Löcher in der ansonsten geschlossenen
Wasserfläche bilden (Loch-Droplets).
10.5 Zweidimensionales Elektronengas: Quanten-Hall-Effekt 567
𝝁𝟓 𝝁𝟔
𝝁𝟏 𝝁𝟐
128
ses der Elektronen in der Probe steil ansteigt (Rand der Badewanne). Es bleiben nur noch
einige kleine Loch-Droplets übrig [siehe Abb. 10.44(c)]. In diesem Fall wird σx x = ρ x x = 0
und σx y = e 2 ⇑h. Das Verhältnis σx y ⇑(e 2 ⇑h) gibt die Zahl der Randkanäle im Perkolations-
prozess an. Jeder Randkanal stellt einen eindimensionalen Leitungskanal dar und trägt genau
die Leitfähigkeit e 2 ⇑h bei (vergleiche hierzu Abschnitt 7.5.1). Jedes Mal, wenn wir das chemi-
sche Potenzial über ein weiteres Landau-Niveau anheben, entsteht ein neuer Randkanal und
wir erhalten σx y = n ⋅ (e 2 ⇑h). Wir erhalten also Hall-Plateaus, wenn sich das chemische Po-
tenzial im Bereich der lokalisierten Zustände befindet, und der Wert des Hall-Widerstands
hängt von der Zahl n der Randkanäle ab. Wir sehen, dass wir bei einer starken Unordnung
(breiter Bereich der lokalisierten Zustände), also in Proben mit einer hohen Störstellenkon-
zentration, breite Hall-Plateuas bekommen. Wir dürfen die Störstellenkonzentration aber
auch nicht zu hoch machen, da dann die Streuzeit τ sehr klein und die Breite ħ⇑τ der Landau-
Niveaus größer als ihr Abstand ħω c wird, d. h. wir erfüllen dann die Bedingung ω c τ ≫ 1
nicht mehr.
Die bereits in Abschnitt 7.5.1 geführte Diskussion und Gleichung (7.5.6) sind nur für einen
einzelnen Transportkanal gültig. Fassen wir die gerade diskutierten Randkanäle als eindi-
mensionale Transportkanäle auf, so haben wir es mit einem System aus mehreren Transport-
kanälen und mehreren Kontakten zu tun. Diese Situation wird durch den Landauer-Bütti-
ker-Formalismus beschrieben, auf den wir hier kurz eingehen wollen.59 Für die in Abb. 10.45
gezeigte Konfiguration erhalten wir
6
e
Ii = {(n − r i i )µ i − ∑ t i j µ j (︀ , (10.5.20)
h j=1
wobei I i der Strom in den i-ten Kontakt, r i i die Rückstreuwahrscheinlichkeit von Kontakt i
nach Kontakt i und t i j die Transmissionswahrscheinlichkeit von Kontakt i nach Kontakt j
ist. Mit r i i = 0 und t i j = 1 folgt für den Hall-Widerstand bei in unserem Beispiel zwei Rand-
kanälen
µ3 − µ5 h
R 35 = = 2, (10.5.21)
eI 2e
da
2e
I1 = I = (µ 1 − µ 5 ) (10.5.22)
h
59
siehe z. B. The Physics of Low Dimensional Semiconductors, J. H. Davies, Cambridge University
Press, Cambridge (1998).
568 10 Halbleiter
und
2e
I3 = 0 = (µ 3 − µ 1 ) (10.5.23)
h
2e
I5 = 0 = (µ 5 − µ 1 ) . (10.5.24)
h
Um uns dieses etwas abstrakte Ergebnis zu veranschaulichen, nehmen wir an, dass wir ein
negatives Potenzial −µ 1 an Kontakt 1 angelegt haben und µ 2 = 0. Es fließt dann ein tech-
nischer Strom von Kontakt 2 nach 1, bzw. ein Elektronenstrom von Kontakt 1 nach 2. In
Abb. 10.45 geben die Pfeile die Elektronenrichtung an. Aus Kontakt 1 werden also Elektro-
nen in die beiden Randkanäle injiziert und verlassen diesen Kontakt. Sie können sich ohne
Streuung am oberen Rand der Probe entlangbewegen und treten in Kontakt 5 ein. Dieser
Kontakt kann aber keinen Strom aufnehmen. Sein chemisches Potenzial muss deshalb so-
weit ansteigen, damit er einen gleich großen Strom wieder in den auslaufenden Randkanal
abgeben kann. Dies erfordert µ 5 = µ 1 . Das gleiche gilt für Kontakt 6, d. h. µ 6 = µ 1 . Somit
haben alle Kontakte entlang der oberen Probenseite das gleiche Potenzial. Mit der gleichen
Argumentation können wir folgern, dass alle Kontakte auf der Probenunterseite auf dem
gleichen Potenzial µ 2 = 0 liegen (damit tragen die unteren Randkanäle keinen Strom).
Der gesamte aus Kontakt 1 injizierte Strom ist für die beiden Randkanäle I = (2e⇑h)(µ 1 −
µ 3 ) = −(2e⇑h)µ 1 und der Hall-Widerstand ist R 35 = (µ 3 − µ 5 )⇑eI = −µ 5 ⇑eI = h⇑2e 2 . Wir
erhalten also den quantisierten Wert. Ferner ist der longitudinale Widerstand (µ 6 − µ 5 )⇑eI =
0. Wir haben also in relativ einfacher Weise die experimentellen Beobachtungen erklärt. Eine
wichtige Voraussetzung ist, dass die Transmissionswahrscheinlichkeit in den Randkanälen
gleich eins ist. Dies ist gegeben, wenn keine Streuung von der einen Probenseite auf die an-
dere erfolgt. In der in Abb. 10.44b dargestellten Situation ist dies offensichtlich nicht der Fall.
Hier befinden wir uns gerade im Bereich zwischen den Hall-Plateaus.
Wir möchten schließlich noch darauf hinweisen, dass eine allgemeinere Interpretation des
Quanten-Hall-Effekts von Robert B. Laughlin gegeben wurde.60 , 61 Dabei wird der Quanten-
Hall-Effekt als direkte Folge des allgemeinen Prinzips der Eichinvarianz ausgedrückt. In ei-
ner moderneren Betrachtungsweise wird der Quanten-Hall-Zustand als topologischer Isola-
tor klassifiziert (siehe hierzu Kapitel 14). Für eine tiefergehendere Diskussion des Quanten-
Hall-Effekts wird auf die Spezialliteratur verwiesen.62 , 63 , 64 , 65 , 66
60
Robert B. Laughlin, Quantized Hall conductivity in two dimensions, Phys. Rev. B 23, 5632 (1981).
61
R. B. Laughlin, in McGraw-Hill Book of Science and Technology 1984, McGraw-Hill, New York
(1984).
62
H. L. Stoermer, D. C. Tsui, The Quantized Hall Effect, Science 220, 1241–1246 (1983).
63
M. Janssen, O. Viehweger, U. Fastenrath, J. Hajdu, Introduction to the Theory of the Integer Quantum
Hall Effect, VCH Weinheim (1994).
64
R. E. Prange, S. M. Girvin, The Quantum Hall Effect, Springer Verlag, New York, Berlin (1990).
65
T. Chakraborty, P. Pietiläinen, The Quantum Hall Effect – Fractional and Integral, Springer Series
on Solid-State Science, Vol. 85, Springer Berlin, Heidelberg (1995).
66
A. H. McDonald, The Quantum Hall Effect: A Perspective, Kluwer, Boston (1989).
10.5 Zweidimensionales Elektronengas: Quanten-Hall-Effekt 569
𝟐. 𝟓
𝟑𝟐 𝑵= 𝟏 𝑵=𝟎
𝟐
𝝆𝒙𝒚 𝒉/𝒆𝟐
𝝂=𝟒 𝟑 𝟐 𝟏
1. 𝟓
𝟏 1/2
3/2
Quanten-Hall-Effekt (nach
R. Willett, J. P. Eisenstein,
H. L. Störmer, D. C. Tsui,
𝟎
A. C. Gossard, Phys. Rev.
Lett. 59, 1776 (1987),
𝟎 © (2012) American Phy-
𝟓 𝟏𝟎 𝟏𝟓 𝟐𝟎 𝟐𝟓 𝟑𝟎
Magnetfeld (T) sical Society).
131
67
D. C. Tsui, H. L. Störmer, A. C. Gossard, Two-Dimensional Magnetotransport in the Extreme Quan-
tum Limit, Phys. Rev. Lett. 48, 1559 (1982).
68
R. B. Laughlin, Anomalous Quantum Hall Effect: An Incompressible Quantum Fluid with Fractio-
nally Charged Excitations, Phys. Rev. Lett. 50, 1395 (1983).
69
T. Chakraborty, P. Pietiläinen, The Quantum Hall Effect – Fractional and Integral, Springer Series
on Solid-State Science, Vol. 85, Springer Berlin, Heidelberg (1995).
570 10 Halbleiter
finden sich alle Elektronen im untersten Landau-Niveau, sie haben alle dieselbe kinetische
Energie 12 ħω c und ihre Spins sind alle parallel ausgerichtet. Die Vielteilcheneffekte kommen
nun dadurch zustande, dass wir die Coulomb-Wechselwirkung zwischen den Elektronen
berücksichtigen müssen.
In jüngster Zeit wurde zur Beschreibung des fraktionalen QHE das Konzept der zusammen-
gesetzten Fermionen (Composite Fermions) eingeführt. Diese Quasiteilchen bestehen aus
einem Elektron (oder Loch), das mit einer geraden Zahl von magnetischen Flussquanten
verbunden ist. Jedes Elektron bildet also mit Quanten des magnetischen Flusses ein zusam-
mengesetztes (composite) Fermion. Die an die Elektronen angehängten Flussquanten bilden
ein homogenes Magnetfeld, das dem äußeren Magnetfeld entgegenwirkt. Das zusammenge-
setzte Fermion, das eine ganzzahlige Ladung trägt, bewegt sich in einem durch die Fluss-
quanten reduzierten, effektiven Magnetfeld. Mit diesen Quasiteilchen kann der fraktionale
QHE auf den ganzzahligen QHE abgebildet werden. Das heißt, der fraktionale QHE von
Elektronen in einem äußeren Feld wird dann der ganzzahlige QHE der neuen zusammen-
gesetzten Fermionen in einem effektiven Feld. Die zusammengesetzten Fermionen haben
eine ganzzahlige Ladung. Da sie sich aber in einem effektiven Feld bewegen, erscheint es so,
als ob sie eine fraktionale topologische Ladung besäßen. Das Bild der zusammengesetzten
Fermionen kann alle experimentellen Beobachtung Rechnung tragen. Insbesondere erklärt
es, dass ν = 1⇑2 ein besonderer Zustand ist, da hier für ein Quasiteilchen aus einem Elek-
Literatur 571
tron und zwei Flussquanten das effektive Feld null ist. Abb. 10.46 zeigt in der Tat, dass sich
sowohl ρ x y als auch ρ x x um ν = 12 ähnlich zu den um B = 0 gemessenen Größen ist.
Literatur
G. Bauer, F. Kuchar, H. Heinrich (Hg.), Two-dimensional Systems: Physics and New Devices,
Springer Series on Solid Sate Science, Vol. 67, Springer Berlin, Heidelberg (1986).
G. Bednorz, K. A. Müller, Possible high-Tc superconductivity in the Ba-La-Cu-O system, Zeit-
schrift für Physik B 64, 189 (1986).
T. Chakraborty, P. Pietiläinen, The Quantum Hall Effect – Fractional and Integral, Springer
Series on Solid-State Science, Vol. 85, Springer Berlin, Heidelberg (1995).
D. M. Chapin, C. S. Fuller, G. L. Pearson, A New Silicon p-n Junction Photocell for Converting
Solar Radiation into Electrical Power, J. Appl. Phys. 25, 676 (1954).
C. K. Chiang et al., Electrical Conductivity in Doped Polyacetylene, Phys. Rev. Lett. 39, 1098–
1101 (1977).
M. Contreras et al., 19.9%-efficient ZnO/CdS/CuInGaSe2 solar cell with 81.2% fill factor, Pro-
gress in Photovoltaics: Research and Applications 16, 235 (2008).
J. Czochralski, Ein neues Verfahren zur Messung der Kristallisationsgeschwindigkeit der Me-
talle, Zeitschrift für Physikalische Chemie 92, 219–221 (1918).
J. H. Davies, The Physics of Low Dimensional Semiconductors, Cambridge University Press,
Cambridge (1998).
L. Esaki, Compositional Superlattices, in The Technology and Physics of Molecular Beam
Epitaxy, herausgegeben von E. H. C. Parker, Plenum Press, New York (1985).
L. Esaki, R. Tsu, Superlattice and Negative Differential Conductivity in Semiconductors, IBM
J. Res. Develop. 14, 61 (1970).
M. Grundmann, The Physics of Semiconductors: An Introduction Including Nanophysics and
Application, Springer-Verlag, Berlin (2010).
M. Janssen, O. Viehweger, U. Fastenrath, J. Hajdu, Introduction to the Theory of the Integer
Quantum Hall Effect, VCH Weinheim (1994).
D. Kahng, A Historical Perspective on the Development of MOS Transistors and Related De-
vices, IEEE Trans. El. Dev. ED-23, 655 (1976).
D. Kahng, M. M. Atalla, Silicon-silicon dioxide field induced surface devices, IRE Solid State
Res. Conf., Pittsburgh (1960).
J-Y. Kim et al., Efficient tandem polymer solar cells fabricated by all-solution processing,
Science 317, 222 (2007).
R. R. King et al., 40% efficient metamorphic GaInP/GaInAs/Ge multijunction solar cells, Ap-
plied Physics Letters 90, 183516 (2007).
572 10 Halbleiter
R. B. Laughlin, Quantized Hall conductivity in two dimensions, Phys. Rev. B 23, 5632 (1981).
R. B. Laughlin, Anomalous Quantum Hall Effect: An Incompressible Quantum Fluid with Frac-
tionally Charged Excitations, Phys. Rev. Lett. 50, 1395 (1983).
R. B. Laughlin, in McGraw-Hill Book of Science and Technology 1984, McGraw-Hill, New
York (1984).
G. Margaritondo, P. Perfetti, The Problem of Heterojunction Band Discontinuities, in Hetero-
junction Band Discontinuities, Physics and Device Applications, herausgegeben von
F. Capasso und G. Margaritondo, North-Holland, Amsterdam (1987).
A. H. McDonald, The Quantum Hall Effect: A Perspective, Kluwer, Boston (1989).
R. E. Prange, S. M. Girvin, The Quantum Hall Effect, Springer Verlag, New York, Berlin
(1990).
C. T. Sah, R. N. Noyce, W. Shockley, Carrier generation and recombination in p-n junctions
and p-n junction characteristics, Proc. IRE 45, 1228 (1957).
M. Schwoerer, Physikalische Blätter 49, 52 (1994); H. Sixl, H. Schenk, N. Yu, Physikalische
Blätter 54, 225 (1998); Physik Journal 7, 29–32 (2008).
W. Shockley, The Theory of p-n Junctions in Semiconductors and p-n Junction Transistors, Bell.
Syst. Tech. J. 28, 435 (1949).
H. L. Stoermer, D. C. Tsui, The Quantized Hall Effect, Science 220, 1241–1246 (1983).
E. C. G. Stückelberg, Theorie der unelastischen Stöße zwischen Atomen, Helvetica Physica Ac-
ta 5, 369–422 (1932).
S. M. Sze, Semiconductor Devices: Physics and Technology, Wiley, New York (1985).
S. M. Sze, K. Ng Kwok, The Physics of Semiconductor Devices, John Wiley & Sons, New York
(1981).
D. C. Tsui, H. L. Störmer, A. C. Gossard, Two-Dimensional Magnetotransport in the Extreme
Quantum Limit, Phys. Rev. Lett. 48, 1559 (1982).
Y.Ṗ. Varshni, Temperature dependence of the energy gap in semiconductors, Physica 34, 149
(1967).
K. von Klitzing, G. Dorda, M. Pepper, New Method for High-Accuracy Determination of the
Fine-Structure Constant Based on Quantized Hall Resistance, Phys. Rev. Lett. 45, 494–
497 (1980).
K. von Klitzing, G. Dorda, M. Pepper, High-magnetic-field transport in a dilute two-dimen-
sional electron gas, Phys. Rev. B 28, 4886–4888 (1983).
P. Y. Yu, M. Cardona, Fundamentals of Semiconductors, Springer Verlag, Berlin (1996).
C. M. Zener Non-adiabatic Crossing of Energy Levels, Proceedings of the Royal Society of
London A 137 (6), 696–702 (1932).
11 Dielektrische Eigenschaften
Wir haben bereits in Kapitel 9 das Verhalten von Kristallelektronen unter dem Einfluss äu-
ßerer Kräfte diskutiert. Dort haben wir uns im Wesentlichen auf die Beschreibung der Bewe-
gung von einzelnen Kristallelektronen in Metallen unter der Wirkung einer äußeren Kraft
beschränkt. In diesem Kapitel wollen wir unsere Diskussion auf die Beschreibung der Reak-
tion eines Festkörpers als Ganzem auf ein von außen wirkendes elektrisches Feld ausdehnen.
Dadurch erhalten wir zum Beispiel eine Beschreibung der optischen Eigenschaften von Fest-
körpern wie z.B. dem in der Abbildung gezeigten Glas eines Kirchenfensters. Das heißt, wir
werden verstehen, wieso ein Festkörper Licht absorbiert, reflektiert oder durchlässt.
Je nach Bedarf wird die Wechselwirkung eines
Festkörpers mit einem elektromagnetischen Feld
entweder mikroskopisch oder makroskopisch be-
schrieben. In einem mikroskopischen Bild spre-
chen wir zum Beispiel von der Absorption ei-
nes Photons und der damit verbundenen An-
regung des Kristallgitters (z. B. Erzeugung von
Phononen) oder des Elektronensystems (z. B. Er-
zeugung von Elektron-Loch-Paaren). Im Rah-
men einer makroskopischen Beschreibung auf
der Basis der Maxwell-Gleichungen charakteri-
sieren wir dagegen einen Festkörper mit einer
4
Materialkonstante, ohne dass wir uns für die mi-
kroskopischen Prozesse interessieren. Selbstverständlich besteht ein Zusammenhang zwi-
schen mikroskopischer und makroskopischer Beschreibung. Eine Zielsetzung dieses Kapi-
tels wird gerade sein, diesen Zusammenhang zwischen mikroskopischer und makroskopi-
scher Beschreibung herzustellen.
Wir werden uns in diesem Kapitel nur mit der linearen Antwort von Festkörpern auf von
außen wirkende elektromagnetische Felder beschränken. Es soll hier aber darauf hingewie-
sen werden, dass der Bereich der nicht-linearen Optik1 , 2 durch die Entwicklung leistungs-
fähiger Laser in den letzten Jahrzehnten stark an Bedeutung gewonnen hat. Die Diskussion
nicht-linearer Effekte würde aber den Rahmen dieser Einführung in die Festkörperpyhsik
sprengen.
Die Art und Weise, wie ein Festkörper auf den Einfluss eines elektrischen Feldes reagiert,
hängt davon ab, wie frei sich Ladungen im Festkörper bewegen können. So liegen bei Me-
1
Robert W. Boyd, Nonlinear Optics, 3. Auflage, Academic Press, New York (2008).
2
Shen, Yuen-Ron, The Principles of Nonlinear Optics, Wiley-Interscience (2002).
574 11 Dielektrische Eigenschaften
tallen quasi freie Ladungen vor, die elektrische Felder auf einer sehr kurzen Längenskala ab-
schirmen können. In Isolatoren sind die Ladungsträger dagegen gebunden und können nur
über kleine Längenskalen gegenüber den Atomrümpfen verschoben werden. Dadurch baut
sich eine elektrische Polarisation auf und elektrische Felder können selbst über große Län-
genskalen nicht abgeschirmt werden. Das Abschirmverhalten ändert sich natürlich mit der
Frequenz des elektrischen Feldes. Aufgrund der Trägheit der Ladungsträger können diese
schnellen Feldänderungen nicht mehr folgen. Deshalb können selbst in Metallen hochfre-
quente Felder nicht mehr abgeschirmt werden. Wir sehen also, dass die Reaktion eines Fest-
körpers auf den Einfluss eines elektrischen Feldes sehr komplex sein kann und stark von den
mit den spezifischen Materialeigenschaften verbundenen charakteristischen Längen- und
Zeitskalen abhängen wird.
11.1 Makroskopische Elektrodynamik 575
Hierbei ist χ i j der Tensor der elektrischen Suszeptibilität, Pi (r′ , t ′ ) die i-te Komponente
des Polarisationsvektors, der aus dem im Festkörper induzierten Dipolmoment resultiert,
und є 0 = 8.854 187 817 × 10−12 As⇑Vm die elektrische Feldkonstante. Gleichung (11.1.2) ist
ein Beispiel für eine lineare Antwortfunktion, die allgemein den Zusammenhang zwischen
einer Störung und einer durch sie hervorgerufenen Wirkung in mathematischer Form be-
schreibt. Die Störung ist hier das elektrische Feld E(r, t), die Wirkung die damit hervorge-
rufene Polarisation E(r′ , t ′ ) und die lineare Antwortfunktion die Größe χ i j (r, r′ , t, t ′ ), die
auch als Responsefunktion oder verallgemeinerte Suszeptibilität bezeichnet wird. Sie gibt an,
wie empfindlich das betrachtete System auf eine Störung reagiert.
Die Polarisation P ist definiert als das elektrische Dipolmoment pel pro Volumen, d. h.
pel
P≡ , (11.1.3)
V
wobei das elektrische Dipolmoment pel allgemein gegeben ist durch
pel = ∑ q i r i , (11.1.4)
i
also durch das Produkt aus Ladung q i und Ortsvektor r i dieser Ladung.
Falls Raum und Zeit homogen sind,3 hängt die Suszeptibilität nur von ⋃︀r − r′ ⋃︀ und ⋃︀t − t ′ ⋃︀ ab
und (11.1.2) vereinfacht sich zu
3
Um den Raum als homogen anzunehmen, müssen alle mikroskopischen Größen über die Ein-
heitszelle gemittelt werden, um Komplikationen mit lokalen Feldern zu vermeiden. Auf einer ato-
maren Skala oszillieren die Ladungsdichte ρ mikro und das elektrostatische Potenzial ϕ mikro bzw.
Emikro = −∇ϕ mikro schnell. Auf einer makroskopischen Skala ist dagegen ρ makro = 0 und Emakro = 0.
576 11 Dielektrische Eigenschaften
Wir können nun den Faltungssatz verwenden und (11.1.5) durch die Fourier-Transformier-
ten von P, χ und E auszudrücken. Wir erhalten4
Im Prinzip sind alle linearen dielektrischen Eigenschaften eines Festkörpers durch den kom-
plexen elektrischen Suszeptibilitätstensor bestimmt.5 Falls χ i j (⋃︀r − r′ ⋃︀, t − t ′ ) reell ist, impli-
ziert dies χ i j (−q, −ω) = χ∗i j (q, ω). Gehen wir über den Bereich der linearen Antwort hinaus,
so müssen wir in (11.1.6) Terme höherer Ordnung berücksichtigen und erhalten
(1) (2) (3)
Pi = є 0 ∑ χ i j E j + є 0 ∑ χ i jk E j E k + є 0 ∑ χ i jkℓ E j E k E ℓ + . . . . (11.1.7)
j jk jkℓ
Hierbei sind χ(m) Tensoren (m + 1)-ter Stufe. Während χ(1) die lineare Suszeptibilität be-
schreibt, ist χ(2) für den Pockels-Effekt und χ(3) für den Kerr-Effekt verantwortlich. Auf
diese Effekte werden wir hier aber nicht eingehen.
Für den Vergleich mit Experimenten führt man einen weiteren komplexen Tensor 2. Stufe
ein, nämlich den Dielektrizitätstensor. Dieser Tensor ist definiert durch
Wir werden im Folgenden den Real- und Imaginärteil des Dielektrizitätstensors mit є r (q, ω)
und є i (q, ω) bezeichnen. In Fällen, wo die Tensoreigenschaften nicht relevant sind, werden
wir є i j (q, ω) durch die skalare Funktion є(q, ω) ersetzen. Diese Funktion wird als dielektri-
sche Funktion bezeichnet.
Ohne Angabe eines Beweises wollen wir folgende Zusammenhänge festhalten:6
є(−q, −ω) = є∗ (q, ω) (11.1.11)
Gleichung (11.1.11) folgt aus der Tatsache, dass є(r, t) eine reelle Funktion von Ort und Zeit
sein muss, und (11.1.12) folgt aus den Onsager-Beziehungen,7 die aus der Zeitumkehrsym-
metrie der zugrunde liegenden mikroskopischen Prozesse folgen.
In den meisten Problemen, die wir behandeln werden, wird die Wellenlänge der elektro-
magnetischen Welle wesentlich größer als der Gitterabstand oder andere relevante Längen-
skalen sein. In diesem Fall können wir den Wellenvektor q ≃ 0 setzen und wir werden die
dielektrische Funktion mit є(ω) abkürzen. Dies gilt für Licht bis weit in den UV-Bereich,
nicht aber für den Röntgenbereich. Wenn wir annehmen, dass є(q, ω) unabhängig von q ist,
ist die q-Abhängigkeit durch eine konstante Funktion gegeben, deren Fourier-Transformier-
te eine δ-Funktion ist. Das heißt, є(r, ω) ist proportional zu einer δ-Funktion und damit die
Reaktion des Festkörpers auf die äußere Störung lokal. Die dielektrische Verschiebung D(r)
hängt dann nur von dem lokal am Ort r wirkenden elektrischen Feld ab. Falls allerdings є
eine gewisse q-Abhängigkeit besitzt, bedeutet dies, dass seine Fourier-Transformierte von
r − r′ abhängt und die Antwort deshalb nichtlokal ist. Die є(q)-Abhängigkeit wird räumli-
che Dispersion genannt.
J=σE (11.1.15)
schreiben. Gehen wir nun wiederum zu den Fourier-Komponenten über und benutzen die
Beziehung D(ω) = є 0 є(ω) E(ω), so können wir damit die Maxwell-Gleichung (11.1.14)
7
Lars Onsager, Reciprocal relations in irreversible processes I, Phys. Rev. 37, 405 (1931); Reciprocal
relations in irreversible processes II, Phys. Rev. 38, 2265 (1931).
578 11 Dielektrische Eigenschaften
schreiben als
∇ × H = σ(ω) E(ω) − ıωє 0 є(ω) E(ω) . (11.1.16)
Wir können nun formal eine frequenzabhängige verallgemeinerte Leitfähigkeit
̃
σ (ω) ≡ σ(ω) − ıωє 0 є(ω) (11.1.17)
definieren, die zusätzlich die dielektrischen Effekte berücksichtigt. Gleichung (11.1.14) kann
somit als
∇×H= ̃
σ (ω) E(ω) (11.1.18)
geschrieben werden. Andererseits können wir auch eine verallgemeinerte Dielektrizitäts-
konstante ̃
є(ω) benutzen und (11.1.14) schreiben als
∇ × H = −ıω є 0̃
є(ω) E(ω) , (11.1.19)
worin die verallgemeinerte Dielektrizitätskonstante gegeben ist durch
ıσ(ω)
̃
є(ω) = є(ω) + . (11.1.20)
є0 ω
11.1.2 Kramers-Kronig-Relationen
Setzen wir voraus, dass die Feldstärke des elektrischen Feldes klein genug ist, so dass die
resultierende Polarisation eines Festkörpers linear von der elektrischen Feldstärke abhängt
(linear response), so beschreiben die Funktionen χ(ω) und є(ω) lineare Antwortfunktionen
eines Festkörpers auf ein externes elektrisches Feld. Es kann gezeigt werden, dass lineare
Antwortfunktionen wie χ(ω) oder є(ω) die Kramers-Kronig-Relationen9 , 10 erfüllen:
∞
2 ω′ є i (ω′ )
є r (ω) − 1 = 𝒫∫ dω′ . (11.1.21)
π ω′ 2 − ω 2
0
∞
2ω є r (ω′ )
є i (ω) = − 𝒫 ∫ dω′ . (11.1.22)
π ω′ 2 − ω 2
0
8
Es ist wichtig, sich klar zu machen, dass eine klare Unterscheidung zwischen freien und gebunde-
nen Ladungsträgern in zeitlich oszillierenden Feldern verwaschen wird. In beiden Fällen haben wir
es mit periodischen Verschiebungen von Ladungen zu tun. Nur für ω = 0 können wir das Verhalten
von freien und gebundenen Ladungen klar unterscheiden und eine Trennung von Phänomenen,
die σ bzw. є zugeordnet werden können, ist evident. Für zeitlich und räumlich variierende Felder
ist dies dagegen nicht mehr möglich.
9
R. de L. Kronig, On the theory of the dispersion of X-rays, J. Opt. Soc. Am. 12, 547556 (1926).
11.1 Makroskopische Elektrodynamik 579
Hierbei ist 𝒫 der so genannte Hauptwert des Integrals. Die Kramers-Kronig-Relationen stel-
len eine Beziehung zwischen dem Real- und Imaginärteil der dielektrischen Funktion her.
Sie können dazu benutzt werden, den einen Teil der dielektrischen Funktion zu berechnen,
wenn der andere Teil über einen weiten Spektralbereich gemessen wurde. Der Beweis der
Kramers-Kronig-Relationen basiert auf dem grundlegenden Prinzip der Kausalität, das be-
sagt, dass die Antwort eines Systems auf eine Störung zeitlich immer erst nach der Störung
erfolgen kann.
∂2 E
∇2 E = µ 0 є 0 ̃
є , (11.1.23)
∂t 2
wobei µ 0 die magnetische Feldkonstante ist und wir µ = 1 (nicht-magnetisches Material) an-
genommen haben. Die allgemeine Permittivität ̃ є des Festkörpers enthält sowohl einen Real-
als auch Imaginärteil, wobei Letzterer die endliche Absorption berücksichtigt. Die komplexe
Permittivität ist mit dem komplexen Brechungsindex ̃ n über
⌋︂
̃
n(ω) = n(ω) + ıκ(ω) = ̃ є (11.1.24)
n2 − κ 2 = єr (11.1.25)
2nκ = є i . (11.1.26)
Mit ̃ n) ̃
n = n + ıκ und der Dispersionsrelation ω = (c⇑̃ k erhalten wir den komplexen Wel-
lenvektor
̃
k=̃
ω ω ω
n = n + ıκ = k r + ık i (11.1.27)
c c c
10
H. A. Kramers, La diffusion de la lumière par les atomes, Atti Cong. Intern. Fisica, Como, Bd. 2,
S. 545–557 (1927).
11
Das Vorzeichen von ıκ in (11.1.24) hängt davon ab, ob wir beim Ansatz der ebenen Welle eine in
+r- oder −r-Richtung abnehmende Wellenamplitude ansetzen. Beide Ansätze, n + ıκ und n − ıκ
sind gebräuchlich.
580 11 Dielektrische Eigenschaften
𝝎
𝒕 𝑬𝟎 𝐞𝐱𝐩 −𝜿 𝒙
𝒄
𝑬𝟎
und damit als Lösung von (11.1.23) eine gedämpfte Welle (die Ausbreitungsgeschwindigkeit
wird in x-Richtung angenommen, siehe Abb. 11.1)
6
ω ω
E = E0 exp ]︀ı (n x − ωt){︀ exp (−κ x) . (11.1.28)
c c
Die Ausbreitungsgeschwindigkeit der Welle ist also im Medium auf c⇑n reduziert und ihre
Amplitude längs der Ausbreitungsrichtung um einen Faktor exp (−2πκ⇑n) pro Wellenlänge
λ = 2π⇑k = 2πc⇑nω gedämpft.
Um die Absorption elektromagnetischer Energie im betrachteten Medium zu berechnen,
benutzen wir die Maxwell-Gleichungen. Mit ∇ × H = ̃
σ (ω)E(ω) = J(ω) erhalten wir mit
der verallgemeinerten Leitfähigkeit (11.1.17)
ıσ
J(ω) = (σ − ıω є 0 є) E(ω) = −ıωє 0 ( + є) E(ω) = −ıωє 0̃
є E(ω)
ωє 0
= −ıωє 0 ̃
n 2 E(ω) . (11.1.29)
Die dissipierte Leistung ist durch den Realteil von J ⋅ E,
ω
R(J ⋅ E) = R(−ıωє 0 ̃
n 2 E2 ) = 2κnωє 0 E 02 exp (−2κ x) (11.1.30)
c
gegeben. Wir können nun den Absorptionskoeffizienten K als den Bruchteil der Energie de-
finieren, der beim Durchlaufen einer Materialschicht der Dicke 1 absorbiert wird. Er ist ge-
geben durch
OH
Transmission (rel. Einh.)
SO2
HCHO
Abb. 11.2: Transmissionsspektren von OH-
Radikalen, dem Spurengas SO2 , Formalde-
C10H8
hyd (HCHO) und Naphthalin (C10 H8 ) im
308.00 308.05 308.10 308.15 UV-Bereich um 308 nm (Quelle: Forschungs-
Wellenlänge (nm) zentrum Jülich).
werden z. B. zum Nachweis von Verunreinigungen in der Atmosphäre verwendet. Die Ab-
sorptionsmaxima (Minima in der Transmission) entsprechen Maxima in є i (ω). Messen wir
є i (ω) über einen weiten Frequenzbereich, so können wir mit Hilfe der Kramers-Kronig-
Relationen n(ω) berechnen.
Im Prinzip können wir auch durch die Messung der Reflektivität eines Festkörpers die dielek-
trische Funktion bestimmen. Allerdings besteht hierbei das Problem, dass in die Reflek-
tivität sowohl є r als auch є i eingehen. Eine Berechnung von є r und є i aus der gemessenen
Reflektivität alleine ist deshalb nur dann möglich, wenn wir diese über einen sehr weiten
Frequenzbereich messen und dadurch die Kramers-Kronig-Beziehungen benutzen können.
Im Allgemeinen ist die Reflexion und Transmission einer elektromagnetischen Welle an der
Oberfläche eines Festkörpers ein kompliziertes Problem der Optik.12 Die Reflexions- und
Transmissionsamplituden werden durch die Fresnelschen Gleichungen gegeben. Für den
einfachen Fall senkrechter Inzidenz gilt für die Transmissions- und Reflexionsamplituden
(siehe Abb. 11.1):
̃
n−1 2
r= , t =1−r = . (11.1.32)
̃
n+1 ̃
n+1
Der Anteil der reflektierten Intensität ist durch den Reflexionskoeffizienten
̃
n − 1 2 (n − 1)2 + κ 2
R = ⋀︀ ⋀︀ = (11.1.33)
̃
n+1 (n + 1)2 + κ 2
gegeben.
Zusammenhang zwischen lokalem Feld und externem Feld diskutieren. Ähnliche Überle-
gungen werden wir in Abschnitt 12.1.4 bei der Diskussion der magnetischen Eigenschaften
von Festkörpern machen.
In einem Festkörper ergibt sich das lokale elektrische Feld aus dem von außen angelegten
Feld und der Summe aller Dipolfelder13 der einzelnen Atome im Festkörper. Falls alle Dipole
in z-Richtung zeigen und den Betrag p i,e l pro Einheitszelle des betrachteten Festkörpers
haben, so ergibt sich die z-Komponente des Feldes aufgrund der Wirkung aller Dipole zu
1 3z 2i − r 2i
E z,lok = E z,ext + ∑ p i,e l . (11.1.34)
4πє 0 i r 5i
Hierbei läuft die Summe über alle Nachbarzellen. Die Summe lässt sich einfach für einen
kugelförmigen Festkörper mit homogener Polarisation (p i,e l = p e l ) auswerten. Legen wir
den Ursprung in den Mittelpunkt der Kugel, so erhalten wir für die z-Komponente des Feldes
3z 2i − r 2i 2z 2i − x i2 − y 2i
E z,dip = p el ∑ = p el ∑ . (11.1.35)
i 4πє 0 r 5i i 4πє 0 r 5i
Benutzen wir
x i2 y 2i z 2i 1 r 2i
pe l ∑ = p e l ∑ = p e l ∑ = p e l ∑ (11.1.36)
i r 5i 5
i ri
5
i ri 3 i ri
5
und setzen dies in (11.1.35) ein, so sehen wir, dass in diesem Fall die Summe verschwindet
und das lokale Feld im Zentrum der Kugel gleich dem makroskopischen Feld ist.
Leider liegt dieser einfache Fall im Experiment nicht vor. Die Annahme einer homogenen
Polarisation ist nämlich nur für Kugeln erfüllt, deren Durchmesser kleiner als die Wellen-
länge des elektromagnetischen Feldes ist. Wir können dieses einfache Beispiel aber trotzdem
verwenden. Wir können uns eine Kugel vorstellen, die aus dem betrachteten Festkörper her-
ausgeschnitten ist und in der die Polarisation homogen ist. Diese Kugel enthält immer noch
viele Einheitszellen des Festkörpers, ist aber kleiner als die Wellenlänge. Diese Anforderung
ist für sichtbares Licht leicht zu erfüllen. Der Beitrag der gedachten Kugel zum lokalen Feld
im Zentrum der Kugel ist gemäß der obigen Überlegung null.14 Wir müssen dann nur noch
den Beitrag des verbleibenden Festkörpers diskutieren. Für den Bereich außerhalb der ge-
dachten Kugel ist aber der Abstand zum Zentrum der Kugel genügend groß, so dass wir eine
kontinuierliche Verteilung der Dipole annehmen können und deshalb mit der makroskopi-
schen Polarisation P arbeiten können. Das Feld aufgrund dieser Polarisation können wir mit
induzierten Ladungen auf der Oberfläche der Kugel beschreiben (siehe Abb. 11.3a), deren
Ladungsdichte durch
ρ P = −P⊥ = ⧹︂
n ⋅ P = −P cos θ (11.1.37)
13
Der Ausdruck für das elektrische Dipolfeld lautet:
3(pel ⋅ r)r − r 2 pel
Edip = .
4πє 0 r 5
14
Hinweis: Dies gilt streng nur für Festkörper mit kubischer Umgebung. Allerdings kompensieren
sich auch für andere Kristallsymmetrien die Beiträge der benachbarten Atome weitgehend, so dass
der resultierende Feldbeitrag fast immer vernachlässigbar klein ist.
11.1 Makroskopische Elektrodynamik 583
Lorentz-Feld
(a) (b)
𝑬𝐞𝐱𝐭
𝑷
ෝ⋅𝑷=
𝒏
𝑷 𝑬𝐍
𝑷 𝐜𝐨𝐬 𝜽
𝜽
ෝ
𝒏 𝑬𝐋
𝒂
gegeben ist, das heißt, durch die Normalkomponente der Polarisation (⧹︂ n ist der auf der Ku-
geloberfläche senkrecht stehende Einheitsvektor). Dies entspricht dem allgemeinen Theo-
rem der Elektrodynamik, dass das elektrische Feld eines homogen polarisierten Festkörpers
dem Vakuumfeld einer effektiven Flächenladungsdichte ρ P = ⧹︂n ⋅ P auf der Oberfläche ent-
10
15
spricht.
Die Ladung dq, die in einem ringförmigen Oberflächenelement beim Winkel θ enthalten ist
(siehe Abb. 11.3a), ist gegeben durch
Ihr Beitrag zur z-Komponente des elektrischen Felds im Zentrum der fiktiven Kugel ist16
1 dq 1 dq
dE L,z = − ⧹︂
z ⋅ a⧹︂
n=− cos θ . (11.1.39)
4πє 0 a 3 4πє 0 a 2
Setzen wir dq aus (11.1.38) ein und integrieren über θ, erhalten wir das gesamte so genannte
Lorentz-Feld zu
π
P 1
E L,z = ∫ cos θ sin θ dθ =
2
P (11.1.40)
2є 0 3є 0
0
Das Lorentz-Feld resultiert also aus dem Feld der Polarisationsladungen auf der Innenseite
eines fiktiven kugelförmigen Hohlraums, in dessen Mittelpunkt sich das Bezugsatom befin-
det. Wir erhalten damit für das lokale elektrische Feld die Lorentz-Beziehung
P
Elok = Eext + . (11.1.41)
3є 0
15
Haben wir z. B. einen quaderförmigen Körper mit homogener Polarisation vorliegen, so können
wir uns das resultierende elektrische Feld durch eine positive und negative Flächenladung auf ge-
genüberliegenden Quaderseiten zustande gekommen denken.
16
Die x- und y-Komponente verschwinden aufgrund der Rotationssymmetrie um die z-Achse.
584 11 Dielektrische Eigenschaften
11.1.4.1 Depolarisationsfeld
Die Lorentz-Beziehung gilt nur für Probengeometrien, für die kein Entelektrisierungsfeld
oder Depolarisationsfeld EN auftritt. Um zu geometrieunabhängigen Beziehungen zu kom-
men, müssen wir zusätzlich zum Lorentz-Feld EL noch das Depolarisationsfeld EN berück-
sichtigen (siehe Abb. 11.3b), das durch die Ladungsdichte ⧹︂
n ⋅ P auf der Oberfläche des be-
trachteten Festkörpers zustande kommt. Bei der in Abb. 11.3b dargestellten Situation ist die
Probe homogen polarisiert und für das Depolarisationsfeld gilt
1
EN = − NP. (11.1.42)
є0
Hierbei ist N der aus der Elektrizitätslehre bekannte Depolarisations- oder Entelektrisie-
rungsfaktor. Für eine kugelförmige Probe ist N = 13 , so dass sich EL und EN gerade kom-
pensieren. Für eine dünne Scheibe senkrecht bzw. parallel zum elektrischen Feld ist N = 1
bzw. N = 0. Üblicherweise wird die Summe aus angelegtem elektrischem Feld Eext und dem
Depolarisationsfeld EN als makroskopisches Feld bezeichnet:
1
Emak = Eext + EN = Eext − NP. (11.1.43)
є0
Damit erhalten wir das lokale elektrische Feld zu
1 1
Elok = Eext + EN + EL = Emak + EL = Eext − NP+ P. (11.1.44)
є0 3є 0
∎ dielektrische Festkörper:
Die Polarisation beruht hier einerseits darauf, dass die Elektronwolken der Gitteratome
in einem angelegten elektrischen Feld gegenüber den positiven Atomkernen eine Aus-
lenkung aus ihrer Gleichgewichtslage erfahren und dadurch elektrische Dipole entstehen
(siehe Abb. 11.4a). Die daraus resultierende Polarisation nennen wir auch elektronische
Polarisation. Andererseits werden in Ionenkristallen in einem angelegten elektrischen
17
Eine analoge Klassifizierung werden wir in Kapitel 12 für magnetischen Substanzen vornehmen,
wo wir zwischen diamagnetischen, paramagnetischen und ferro- bzw. antiferromagnetischen Sub-
stanzen unterscheiden werden.
11.2 Mikroskopische Theorie 585
M1 M2 M1 M2
Feld die positiven und negativen Ionen relativ zueinander verschoben (siehe Abb. 11.4b).
Die daraus resultierende Polarisation nennen wir ionische Polarisation. In beiden Fällen
ist mit der Auslenkung eine Rückstellkraft verbunden, die zu einer charakteristischen
Eigenfrequenz führt. Im einfachsten Fall kann die Situation mit dem Lorentzschen Os-
zillatormodell beschrieben werden, in dem man einen gedämpften Oszillator mit har-
monischem Antrieb (äußeres Feld) betrachtet. Aufgrund der kleinen Masse und hohen
Rückstellkräfte durch die atomaren elektrischen Felder spielt die elektronische Polarisati-
on bis zu Frequenzen oberhalb des Bereichs des sichtbaren Lichts eine Rolle. Die ionische
Polarisation verschwindet dagegen wegen der viel größeren Masse der Ionen im Bereich
des Infraroten.
Einen Spezialfall stellen Metalle dar, da wir hier zusätzlich zu den an die Atome gebun-
denen lokalisierten Elektronen die frei beweglichen, delokalisierten Ladungsträger be-
rücksichtigen müssen. Letztere erfahren nach einer Auslenkung durch ein elektrisches
Feld keine Rückstellkraft und die damit verbundene charakteristische Frequenz ist so-
mit null. Die dielektrischen Eigenschaften von Metallen werden wir deshalb getrennt in
Abschnitt 11.6 diskutieren.
∎ paraelektrische Festkörper:
Paraelektrische Substanzen enthalten bereits ohne anliegendes elektrisches Feld perma-
nente elektrische Dipole, die durch das äußere Feld nur noch ausgerichtet werden (sie-
he Abb. 11.4c). Wir sprechen hier von einer Orientierungspolarisation, die mit abneh-
mender Temperatur und zunehmender elektrischer Feldstärke zunimmt. Eine Orien-
tierungspolarisation lässt sich nur für Festkörper beobachten, die aus asymmetrischen
Molekülen aufgebaut sind. Beispiele hierfür sind Eismoleküle und Cyanidionen. Da die
Orientierungsvorgänge generell langsam sind, verschwindet die Orientierungspolarisa-
tion üblicherweise bereits im Mikrowellenbereich.
∎ ferro- und antiferroelektrischen Festkörper:
In diesen Materialien tritt unterhalb einer materialspezifischen Temperatur eine spon-
tane Polarisation auch ohne äußeres Feld auf. Ferroelektrizität werden wir später in Ab-
schnitt 11.8 diskutieren.
Die Gesamtpolarisation eines Festkörpers wird aus der Summe der verschiedenen Polari-
sationsbeiträge gebildet, deren physikalische Grundlagen wir in den folgenden Abschnitten
einzeln diskutieren werden. Wir werden in den Abschnitten 11.3 und 11.4 zunächst die elek-
tronische und ionische Polarisation von Isolatoren diskutieren. Anschließend werden wir in
Abschnitt 11.5 kurz auf die Orientierungspolarisation eingehen und damit eine allgemei-
ne Frequenzabhängigkeit der dielektrischen Funktion von Isolatoren angeben können. Wir
586 11 Dielektrische Eigenschaften
werden dann unsere Diskussion in Abschnitt 11.6 und 11.7 auf Metalle erweitern, wo wir
es zusätzlich mit frei beweglichen Ladungsträgern zu tun haben. Im abschließenden Ab-
schnitt 11.8 gehen wir auf ferroelektrische Festkörper ein.
18
Hendrik Antoon Lorentz, geboren am 18. Juli 1853 in Arnheim, gestorben am 4. Februar 1928 in
Haarlem, Niederlande. Lorentz erhielt im Jahr 1902 zusammen mit Pieter Zeeman den Nobelpreis
für Physik für die Entdeckung und theoretische Erklärung des Zeeman-Effekts.
11.3 Elektronische Polarisation 587
zu harmonischen Schwingungen angeregt wird. Nehmen wir an, dass ein aus seiner Ruhelage
in x-Richtung ausgelenktes Elektron mit Masse m und Ladung q = −e eine zu seiner Aus-
lenkung proportionale Rückstellkraft erfährt (vergleiche hierzu Abb. 11.4a), so können wir
die Dynamik der Elektronen mit der Bewegungsgleichung eines getriebenen harmonischen
Oszillators beschreiben:
d2x dx
m 2
+ mΓ + mω 20 x = −eE 0 e−ı ωt . (11.3.2)
dt dt
Hierbei ist ω 0 die Resonanzfrequenz des ungedämpften harmonischen Oszillators. Wir ha-
ben ferner einen Dämpfungsterm mit Dämpfungskonstante Γ eingeführt, da die Schwin-
gung des Elektrons durch Energieabstrahlung gedämpft wird. Die stationäre Lösung dieser
Differentialgleichung lautet
−e 1
x(t) = E 0 e−ı ωt . (11.3.3)
m ω 0 − ω 2 − ıΓω
2
Da mit der Auslenkung x ein elektrisches Dipolmoment p el = −ex verbunden ist und ferner
für das Dipolmoment allgemein19
pel = є 0 αE (11.3.4)
gilt, können wir eine frequenzabhängige Polarisierbarkeit α(ω) wie folgt definieren:
e2 1
α(ω) = . (11.3.5)
є 0 m ω 0 − ω 2 − ıΓω
2
Wenn wir nun n V = N⇑V unabhängige Atome pro Volumeneinheit haben, resultiert die
elektrische Polarisation
P = є 0 n V αE . (11.3.6)
19
Die Polarisierbarkeit α ist als Proportionalitätskonstante zwischen dem lokalen elektrischen Di-
polmoment und dem lokal wirkenden elektrischen Feld definiert. Wir werden später sehen, dass
im Allgemeinen das lokal wirkende elektrische Feld von dem von außen angelegten elektrischen
Feld abweicht. Die dielektrische Suszeptibilität χ ist dagegen als Proportionalitätskonstante zwi-
schen der Polarisation und dem von außen wirkenden makroskopischen elektrischen Feld E mak =
E ext + E N definiert.
588 11 Dielektrische Eigenschaften
und
Setzen wir den Ausdruck (11.3.5) ein, so ergibt sich für die dielektrische Funktion der Zu-
sammenhang
nV e 2 1
є(ω) = 1 + . (11.3.9)
є 0 m (ω 0 − ω 2 ) − ıΓω
2
Wir können diesen Ausdruck in Real- und Imaginärteil zerlegen und erhalten damit für
є = є r + ıє i
nV e 2 ω 20 − ω 2
є r (ω) = 1 + (11.3.10)
є 0 m (ω 20 − ω 2 )2 + (Γω)2
nV e 2 Γω
є i (ω) = . (11.3.11)
є 0 m (ω 20 − ω 2 )2 + (Γω)2
Dieses Ergebnis ist in Abb. 11.6 dargestellt. Es entspricht dem Ausdruck (11.3.45), den wir
unten quantenmechanisch herleiten werden. Charakteristisch ist der Vorzeichenwechsel des
Realteils und das Maximum mit Halbwertsbreite 2Γ des Imaginärteils der dielektrischen
Funktion bei der Resonanzfrequenz ω 0 .
In realen Festkörpern treten natürlich immer mehrere Resonanzfrequenzen ω i k auf, die cha-
rakteristischen Übergängen zwischen elektronischen Zuständen ⋃︀ĩ︀ und ⋃︀k̃︀ entsprechen. Die
detailliertere Diskussion in Abschnitt 11.3.2 zeigt, dass wir die dielektrische Funktion eines
Festkörpers erhalten können, indem wir über alle auftretenden Oszillatoren mit charakteris-
tischen Frequenzen ω i k aufsummieren, wobei wir noch die so genannte Oszillatorstärke f i k
berücksichtigen müssen [vergleiche (11.3.45)]. Diese gibt an, wie wahrscheinlich Übergänge
zwischen den Zuständen ⋃︀ĩ︀ und ⋃︀k̃︀ sind.
Abschließend wollen wir noch darauf hinweisen, dass in der gerade durchgeführten Analy-
se angenommen wurde, dass auf jedes Atom das von außen angelegte elektrische Feld wirkt.
Wir werden in Abschnitt 11.1.4 sehen, dass dies nicht ganz richtig ist, da sich in einem Fest-
körper das auf ein Atom wirkende elektrische Feld aus der Summe des äußeren Feldes und
den Dipolfeldern der Nachbaratome ergibt. Diese Tatsache führt zu einer Verschiebung der
Resonanzfrequenz.
Hierbei ist E 0 die lokal am Ort des Atomes wirkende elektrische Feldstärke. In harmonischer
Näherung können wir die Federkonstante durch k = Zmω 20 ausdrücken. Die obige Differen-
tialgleichung hat dann die Lösung
eE 0
r=− e−ı ωt = r 0 e−ı ωt . (11.3.13)
m(ω 20 − ω 2 )
Ze 2 E 0
p el = e−ı ωt = p 0 e−ı ωt . (11.3.14)
m(ω 20 − ω 2 )
Wir sehen, dass p 0 proportional zur lokal wirkenden Amplitude des elektrischen Feldes ist.
Da für das elektrische Dipolmoment allgemein p el = є 0 αE 0 gilt, erhalten wir
Ze 2 1
α(ω) = . (11.3.15)
є0 m ω0 − ω2
2
Dieser Ausdruck entspricht Gleichung (11.3.5), die wir mit dem Lorentzschen Oszillator-
modell abgeleitet haben. Wir sehen also, dass unsere einfache Überlegung auch die richtige
Frequenzabhängigkeit der Polarisierbarkeit ergibt.
Um E 0 abzuschätzen, können wir das Modell von Mossotti benutzen, der ein Atom als ge-
ladene Kugel mit σ = ∞ und Radius a angenommen hat. Da in diesem Fall E lok = 0 gelten
muss, erhalten wir20
P p el n V p el 1
E 0 = −E L = − =− =− 4 (11.3.16)
3є 0 3є 0 3є 0 3
πa 3
20
Wegen σ = ∞ muss E∏︁ auf der Kugeloberfläche verschwinden. Die Feldverteilung entspricht dann
einer Überlagerung des homogenen externen Felds E ext und mit dem Feld von fiktiven Oberflä-
chenladungen auf einer Kugeloberfläche. Diese ergeben genau das Lorentz-Feld E L .
590 11 Dielektrische Eigenschaften
Vergleichen wir dies mit der Beziehung P = є 0 χEmak , so erhalten wir die elektrische Suszep-
tibilität
nV α
χ= (11.3.20)
1 − 13 n V α
Vergleichen wir dies mit dem oben abgeleiteten Ausdruck (11.3.8), є = 1 + n V α, so sehen
wir, dass (11.3.21) dem Ergebnis (11.3.8) entspricht, wenn 13 n V α ≪ 1. Dies trifft zwar für
ein verdünntes Gas zu, für das n V sehr klein ist, nicht aber für einen Festkörper. Lösen wir
(11.3.21) nach α auf, so erhalten wir die Clausius-Mossotti Beziehung 21 , 22
1 є−1
nV α = . (11.3.22)
3 є+2
Diese Beziehung kann dazu verwendet werden, aus der gemessenen dielektrischen Funktion
eine Aussage über die Polarisierbarkeit der Gitteratome zu gewinnen. Ferner kann dann bei
bekanntem äußeren Feld das lokale elektrische Feld berechnet werden.
21
Rudolf Clausius, geboren am 2. Januar 1822 in Köslin, gestorben am 24. August 1888 in Bonn.
22
Ottaviano Fabrizio Mossotti, geboren am 18. April 1791 in Novara, gestorben am 20. März 1863
in Pisa, italienischer Physiker.
11.3 Elektronische Polarisation 591
mit Hilfe von zeitabhängiger Störungstheorie betrachten. Leider ist es dabei nicht möglich,
die Absorption mit einzubeziehen, da hier die Störung, d. h. das elektrische Feld, Energie
verliert. Wie in Kapitel 9 werden wir eine semiklassische Beschreibung verwenden, in der
das äußere Feld klassisch und die Kristallelektronen quantenmechanisch behandelt werden.
Wir gehen vom ungestörten Hamilton-Operator
⧹︂
p2
ℋ0 = + V (r) (11.3.23)
2m∗
für ein einzelnes Elektron im Festkörper aus. Hierbei ist ⧹︂
p = ħı ∇ der Impulsoperator. Gehen
wir zur Beschreibung der Bewegung der Ladung q = −e in einem elektromagnetischen Feld
über, so müssen wir den Impuls-Operator durch den Operator des kanonischen Impulses
ersetzen und erhalten (siehe hierzu Anhang D)
1
ℋ= (︀⧹︂
p + eA⌋︀ + V (r) .
2
(11.3.24)
2m∗
Hierbei haben wir die Coulomb-Eichung ϕ = 0 und ∇ ⋅ A = 0 verwendet. In dieser Eichung
ist E = −∂A⇑∂t und B = ∇ × A. Mit23
1 1 2 e e e2 2
(︀⧹︂
p + eA⌋︀
2
= ⧹︂
p + A ⋅ ⧹︂
p + ⧹︂
p ⋅ A + A (11.3.25)
2m∗ 2m∗ 2m∗ 2m∗ 2m∗
erhalten wir unter Benutzung von ∇ ⋅ A = 0 und Vernachlässigung des Terms in A2 (es wird
nur die lineare Antwort diskutiert)
e
ℋ = ℋ0 + ∗ A ⋅ ⧹︂p. (11.3.26)
m
Der zusätzliche Term
e
ℋr = A ⋅ ⧹︂
p (11.3.27)
m∗
beschreibt die Wechselwirkung zwischen der elektromagnetischen Strahlung und einem
Kristallelektron. Für die Wechselwirkung der Kristallelektronen mit dem elektrischen Feld
verwenden wir die Dipolnäherung (siehe Anhang F), in der der Wechselwirkungsopera-
tor (11.3.27) durch
ℋr = −e r ⋅ E (11.3.28)
ausgedrückt werden kann. Es ist ferner zweckmäßig, für das elektrische Feld E einen Fourier-
Ansatz der Form
E(t) = E0 (e ı ωt + e−ı ωt ) = 2E0 cos ωt (11.3.29)
zu verwenden, wobei wir die Ortsabhängigkeit vernachlässigen. Dies führt zum Störoperator
r ⋅ E0 (e ı ωt) + e−ı ωt ) und somit zur zeitabhängigen Schrödinger-Gleichung
ℋr = −e⧹︂
ħ2 2 ∂Ψ(r, t)
⌊︀− ∗
r ⋅ E0 (e ı ωt + e−ı ωt )}︀ Ψ(r, t) = ıħ
∇ + V (r) − e⧹︂ . (11.3.30)
2m ∂t
23
Es gilt (p ⋅ A) f (r) = A ⋅ ħı ∇ f + ( ħı ∇ ⋅ A) f = A ⋅ ħı ∇ f = (A ⋅ p) f (r), da ∇ ⋅ A = 0.
592 11 Dielektrische Eigenschaften
mit den zeitabhängigen Koeffizienten c k (t). Wir können nun die Zeitableitung von Ψ(r, t)
durchführen und zusammen mit dem Ansatz (11.3.31) in die Schrödinger-Gleichung ein-
setzen. Betrachten wir einen beliebigen Zustand ϕ∗i (r) e+ıє i t⇑ħ , so können wir ein Matrixele-
ment mit der gesamten Schrödinger-Gleichung bilden, indem wir Gleichung (11.3.30) von
links mit ϕ∗i (r) e+ıє i t⇑ħ multiplizieren und über den gesamten Raum aufintegrieren. Dabei
nutzen wir die Orthonormalität der ungestörten Zustände ϕ k (r) aus (∫ ϕ∗i (r)ϕ k (r) dV =
δ i k ) und erhalten
dc k
ıħ = ∫ ϕ∗i (−e) r ⋅ E(t) ϕ k d 3 r c k (t) e ı(є i −є k )t⇑ħ . (11.3.32)
dt
Wir nehmen an, dass zum Zeitpunkt t = 0 das System im Zustand k sein soll und deshalb
c k (t = 0) = 1 und alle anderen Koeffizienten null sind. Die Lösung lautet dann
t
1
c k (t) = (−e) E 0 r i k ∫ (e ı ωt) + e−ı ωt ) e ı(є i −є k )t⇑ħ
ıħ
0
e2 1 1
= −er i i + ∑ ⋃︀r i k ⋃︀ {
2
+
ħ k ωik − ω ωik + ω
× E0 (e ı ωt + e−ı ωt + e ı ω i k t + e−ı ω i k t ) . (11.3.35)
Der erste Term in dieser Gleichung, −er i i , beschreibt den feldunabhängigen Beitrag zum
Dipolmoment, der allerdings für Systeme mit Inversionssymmetrie verschwindet (dieser
Term ist für ferroelektrische Materialien von Bedeutung). Der zweite Term ist linear im
11.3 Elektronische Polarisation 593
Feld und enthält eine Komponente, die mit der gleichen Frequenz wie das angelegte Feld
oszilliert. Dieser Term beschreibt die Polarisierbarkeit des Festkörpers. Die weitere linea-
re Komponente, die mit der Übergangsfrequenz ω i k oszilliert, kann in einem Experiment
nicht beobachtet werden, da im Experiment üblicherweise über viele Oszillationsperioden
von ω i k gemittelt wird.
Wir sehen, dass der Erwartungswert für das elektrische Dipolmoment proportional zum
angelegten Feld ist. Da für das Dipolmoment allgemein pel = є 0 αE gilt, können wir eine fre-
quenzabhängige Polarisierbarkeit α(ω) wie folgt definieren:
e 2 ⋃︀r i k ⋃︀2 2ω i k
α(ω) = ∑ . (11.3.36)
k є 0 ħ ω 2i k − ω 2
Vergleichen wir diesen Ausdruck mit (11.3.5), so sehen wir, dass für eine bestimmte Fre-
quenz ω i k das Atom nur einen Bruchteil f i k des Absorptionsvermögens eines klassischen
Oszillators hat. Es ist üblich, die Größe
2m∗
fik = ħω i k ⋃︀r i k ⋃︀2 (11.3.37)
ħ2
als die Oszillatorstärke des atomaren Übergangs zwischen Zustand ⋃︀ĩ︀ und ⋃︀k̃︀ zu definieren.
Summieren wir die Absorptionswahrscheinlichkeiten über alle möglichen Übergänge des
Atoms auf, so muss gerade das Absorptionsvermögen eines klassischen Oszillators heraus-
kommen. Das heißt, es muss ∑ i k f i k = 1 gelten.24 Damit ergibt sich
e2 fik
α(ω) = ∑ . (11.3.38)
k є 0 m∗ ω 2i k − ω 2
und damit
nV e 2 fik
є(ω) = 1 + n V α(ω) = 1 + ∑ . (11.3.39)
є 0 m∗ k ω 2i k − ω 2
Dieses Ergebnis für die dielektrische Funktion ist in Abb. 11.5 grafisch dargestellt. Wir sehen,
dass in der Nachbarschaft jeder Übergangsfrequenz ω i k ein Gebiet anomaler Dispersion vor-
liegt. Insbesondere wird hier є(ω) negativ und damit nach (11.1.20) der Brechungsindex ̃ n
rein imaginär, das heißt
⌋︂
n =0, κ= є. (11.3.40)
Nach (11.1.33) bedeutet dies, dass der Reflexionskoeffizient R = 1 wird, also Totalreflexion
auftritt.
Im Prinzip würde der Kristall bis ω = ω i k durchsichtig bleiben, dann plötzlich undurchsich-
tig und vollständig reflektierend werden und anschließend bei höheren Frequenzen wie-
der durchsichtig werden. Dieses Verhalten wäre aber nicht mit dem in Abschnitt 11.1 aus
24
Summenregel von Thomas, Reiche und Kuhn, siehe z. B. H. Friedrich, Theoretische Atomphysik,
Springer, Berlin, Heidelberg (1994).
594 11 Dielektrische Eigenschaften
4 𝝐(𝟎)
𝝎𝟏 𝝎𝟐
()
0
-4
14
π nV e 2
2ω n(ω) κ(ω) = ∑ f i k δ(ω − ω i k ) (11.3.41)
2 є 0 m∗ k
setzen. Dies muss gerade der Imaginärteil der komplexen Dielektrizitätskonstante sein, die
dann insgesamt die Form
nV e 2 1
є(ω) = 1 + ∑ fik { 2 + ıπ δ(ω 2 − ω 2i k )(︀ (11.3.42)
є 0 m∗ k ω i k − ω2
hat. In der Praxis treten aber nie unendlich scharfe, wie durch (11.3.42) vorhergesagte Linien
auf, sondern es liegt vielmehr immer eine endliche Linienbreite aufgrund von Verunreini-
gungen oder einfach aufgrund der natürlichen Relaxation der Niveaus vor. Diese Effekte
können phänomenologisch in unsere Analyse einbezogen werden, indem wir in (11.3.33)
einen Zerfallsterm exp(−Γt⇑2) einführen, dem eine Zerfallszeit (des Amplitudenquadrats,
also der Intensität) der Größe 1⇑Γ entspricht.25 In den Ausdrücken (11.3.35) und (11.3.38)
führt das zu einem zusätzlichen Term von ıΓ⇑2, den wir zur Übergangsfrequenz addieren
müssen. Wenn wir Γ 2 gegenüber ω 2i k vernachlässigen (dies ist möglich, wenn die Breite der
25
Dies folgt einfach aus der Unschärfe-Relation ∆E ⋅ ∆t ≃ ħ. Eine endliche Linienbreite ∆E führt zu
∆t = 1⇑Γ ≃ ħ⇑∆E.
11.3 Elektronische Polarisation 595
4
r(), i()
𝟐𝚪𝟏
2 𝟐𝚪𝟐
0
𝝎𝟏 𝝎𝟐
-2
Niveaus klein gegenüber deren Abstand ist), erhalten wir für den Realteil der Polarisierbar-
keit und somit für den Realteil der dielektrischen Funktion Terme der Form
ω 2i k − ω 2
fik (11.3.43)
(ω 2i k − ω 2 )2 + ω 2 Γ 2
anstelle von f i k ⇑(ω 2i k − ω 2 ). Dies resultiert in der Beseitigung der Singularität in n bzw. є r
und einem Ausschmieren der Dispersionsfunktion über den Frequenzbereich der Breite
∼ 2Γ (siehe Abb. 11.6).
Es ist bekannt, dass die Wirkung der Relaxation auf die Absorptionslinie selbst in einer Ver-
breiterung der δ-Funktion auf eine endliche Funktion der Form
Γ⇑2π 2Γω 2 ⇑π
≃ (11.3.44)
(ω 2i k − ω ) + (Γ⇑2)
2 2 2 (ω i k − ω 2 )2 + Γ 2 ω 2
2
in der Nachbarschaft von ω = ω i k resultiert. Berücksichtigen wir dies, so erhalten wir den
(11.3.42) entsprechenden Ausdruck zu
nV e 2 ω 2i k − ω 2 Γi k ω
є(ω) = 1 + ∑ f { +ı 2 (︀
є 0 m∗ k (ω i k − ω 2 )2 + ω 2 Γi2k (ω i k − ω 2 )2 + ω 2 Γi2k
i k 2
nV e 2 1
=1+ ∑ fik 2 . (11.3.45)
є0 m k (ω i k − ω ) − ıωΓi k
2
Diese Funktion ist in Abb. 11.6 dargestellt. Sie entspricht Abb. 11.5, beinhaltet aber die Ef-
fekte einer endlichen Linienbreite. Gleichung (11.3.45) liefert einen phänomenologischen
Ausdruck der dielektrischen Funktion für solche Systeme, deren Absorptionsspektren aus
einer Serie von diskreten Linien besteht (vergleiche Abb. 11.2).
Im Allgemeinen ist die Berechnung des Absorptionsspektrums von Festkörpern schwie-
rig, da die Wahrscheinlichkeit eines bestimmten Übergangs nicht nur von dessen Oszilla-
torstärke, sondern auch von der Zustandsdichte der beteiligten Anfangs- und Endzustän-
de bestimmt wird. Die gemessenen Absorptionsspektren spiegeln deshalb die so genannte
596 11 Dielektrische Eigenschaften
𝑴𝟏 𝒇 𝑴𝟐 𝒇 𝑴𝟏 𝒇 M2 𝒇 𝑴𝟏 𝒇 M2
𝒖𝟏 𝒖𝟐 𝒖𝟏 𝒖𝟐 𝒖𝟏 𝒖𝟐
𝑬lok
Abb. 11.7: Zur Entstehung der ionischen Polarisation. Für q = 0 erhalten wir eine gleichmäßige Ver-
schiebung der positiven Ionen nach rechts und der negativen Ionen nach links. Dies führt zu einem
lokalen Feld, das von rechts nach links gerichtet ist und zu einer Kraft qE lok auf die positiven Ionen
und zu einer Kraft −qE lok auf die negativen Ionen resultiert.
∂2 u
µ + µω 20 u = qElok . (11.4.4)
22
∂t 2
Hierbei ist µ = M 1 M 2 ⇑(M 1 + M 2 ) die reduzierte Masse eines Ionenpaares und ω 0 ist die
Grenzfrequenz der optischen Schwingung für q = 0, wie sie aus (11.4.1) für neutrale Atome
erhalten wird.
Gleichung (11.4.4) entspricht der Differentialgleichung eines getriebenen harmonischen Os-
zillators. Fügen wir noch einen Dämpfungsterm hinzu, der die endliche Lebensdauer der
optischen Phononen berücksichtigt, so erhalten wir die Gleichung
∂2 u ∂u
µ + µΓ + µω 20 u = qElok , (11.4.5)
∂t 2 ∂t
die für das lokale Feld Elok (t) = E0 e ı ωt die stationäre Lösung
q 1
u(t) = E 0 e−ı ωt (11.4.6)
µ ω 0 − ω 2 − ıΓω
2
besitzt, die mit (11.3.3) übereinstimmt. Wir werden im Folgenden einige Lösungen dieser
Gleichung diskutieren.
Abb. 11.8: Zur Herleitung des lokalen elektrischen Feldes bei transversalen (TO) und longitudinalen
optischen (LO) Eigenschwingungen von Ionenkristallen. Gezeigt ist der langwellige Grenzfall, bei dem
jede Schicht der Dicke λ⇑2 eine große Zahl von Atomlagen enthält. In (a) ist aufgrund des Depolari-
sationsfeldes das lokale elektrische Feld antiparallel zur Polarisation. Zum Beispiel schwingen in der
obersten Schicht die positiven Ionen nach oben und die negativen nach unten, was zu einer Polarisa-
tion P ∝ qu führt, die nach oben gerichtet ist. Aufgrund des Depolarisationsfeldes ist aber das lokale
Feld von oben nach unten gerichtet, also antiparallel zur Polarisation. In (b) ist das Depolarisationsfeld
null und das lokale elektrische Feld ist parallel zur Polarisation. Rechts ist jeweils die Auslenkung der
positiven Ionen gezeigt.
Hierbei ist n V die Dichte der Ionenpaare. Da jedes einzelne Ionenpaar mit einem elektri-
schen Dipolmoment pion = qu1 − qu2 = qu zur Polarisation beiträgt, erhalten wir für die
ionische Polarisation
Pion = n V qu . (11.4.8) 23
Da pion = є 0 α ion Elok und gleichzeitig pion = qu gilt, erhalten wir die ionische Polarisierbar-
keit zu α ion = qu⇑є 0 E lok . Im statischen Grenzfall ergibt sich ferner aus (11.4.4) u = qE lok ⇑µω 20
und damit für den statischen Wert von α ion
q2
α ion (0) = . (11.4.13)
є 0 ω 20 µ
Führen wir diesen Ausdruck in (11.4.12) ein und lösen nach Elok auf, so erhalten wir
1
2
n V α ion (0)
Elok = − µω 20 3 2 u. (11.4.14)
q 1 + 3 n V α el
Wir können nun diesen Ausdruck für das lokale elektrische Feld in die Differentialgleichung
(11.4.4) einsetzen und erhalten dadurch die Differentialgleichung einer freien Schwingung
mit der Eigenfrequenz
⟨
⧸︂ 2
n α (0)
ω L = ω 0 ⧸︂
⟩1 + 3 V ion
(11.4.15)
1 + 23 n V α el (0)
für die longitudinale Schwingung. Hierbei haben wir α el durch α el (0) ersetzt, da die typi-
sche Frequenz ω 0 von optischen Phononen im Bereich von 1014 Hz liegt. In diesem infra-
roten Spektralbereich hat die elektronische Polarisation bereits ihren statischen Grenzwert
erreicht.
Wir sehen, dass bei Ionenkristallen die Eigenfrequenz einer longitudinalen optischen Git-
terschwingung höher und diejenige einer transversalen optischen Gitterschwingung niedri-
ger ist als die Eigenfrequenz ω 0 einer optischen Gitterschwingung neutraler Atome. Dies ist
sofort einsichtig. Bei der longitudinalen Schwingung ist das lokale elektrische Feld der Aus-
lenkung entgegengesetzt, wodurch dieses die rücktreibende Kraft verstärkt und somit das
Gitter „härter“ macht, was einer höheren Eigenfrequenz entspricht. Bei der transversalen
Schwingung ist dies genau umgekehrt.
11.4.1.3 Lyddane-Sachs-Teller-Relation
Wir können nun noch das Verhältnis von ω 2L und ω 2T betrachten. Wir erhalten dann den als
Lyddane-Sachs-Teller-Relation bekannten Ausdruck
ω 2L є(0)
= , (11.4.17)
ω 2T є stat
600 11 Dielektrische Eigenschaften
der das Verhältnis der Eigenfrequenzen der longitudinalen und transversalen optischen
Schwingungen bei q = 0 angibt. Hierbei sind
die Dielektrizitätskonstante für Frequenzen ω ≫ ω 0 (z. B. im sichtbaren Bereich), bei der wir
die ionische Polarisierbarkeit null setzen können, wir aber immer noch α el (0), also den sta-
tischen Grenzwert der elektronischen Polarisierbarkeit verwenden können, da die typischen
Eigenfrequenzen der elektronischen Prozesse im UV-Bereich liegen.
Eine interessante Konsequenz der LST-Relation ist die Tatsache, dass є(0) sehr groß wird,
wenn die Eigenfrequenz der transversalen optischen Gitterschwingung sehr klein wird. Wir
sprechen dann von weichen optischen Phononen. Diese sind für Ferroelektrika, die wir spä-
ter diskutieren werden, von großer Bedeutung.
eine transversale Welle dar. Die longitudinale Welle muss die Bedingung
∇ × PL = 0 , ∇ ⋅ PL ≠ 0 (11.4.22)
∇ × PT ≠ 0 , ∇ ⋅ PT = 0 (11.4.23)
genügen muss.
11.4 Ionische Polarisation 601
In einem dielektrischen Medium ohne Ladungsträger und sonstige Quellen einer Raumla-
dungsdichte ρ muss die Divergenz der dielektrischen Verschiebung verschwinden:
∇⋅P
∇ ⋅ D = ρ = є 0 є(ω) ∇ ⋅ E = є(ω) =0. (11.4.24)
є(ω) − 1
Da für eine longitudinale Welle aber ∇ ⋅ PL ≠ 0 gelten muss, kann (11.4.24) nur für
є(ω L ) = 0 (11.4.25)
erfüllt werden. Das heißt, eine longitudinale Schwingungsmode kann nur für eine Eigenfre-
quenz ω L existieren, für die die dielektrische Funktion verschwindet. Ferner ist das lokale
elektrische Feld antiparallel zur Polarisation gerichtet (siehe Abb. 11.8), d. h. der Feld- und
Polarisationsvektor sind genau um 180○ phasenverschoben. Solche longitudinalen Moden
können nicht mit transversalen elektromagnetischen Wellen wechselwirken und deshalb
nicht mit elektromagnetischer Strahlung angeregt werden. Eine Anregung der longitudi-
nalen Moden kann z. B. durch Beschuss mit hochenergetischen Elektronen erfolgen (siehe
hierzu Abschnitt 11.6.2).
Da die transversalen Moden an elektromagnetische Wellen koppeln, müssen wir bei ihrer
Diskussion von der Wellengleichung
∂2 E
∇2 E − µ 0 є 0 є(ω) =0 (11.4.26)
∂t 2
ausgehen. Da die Polarisation in diesem Fall proportional zum lokalen Feld ist, erhalten wir
als Lösungen ebene Wellen der Form
P = P0 e ı(q⋅r−ωt) (11.4.27)
c2 2
ω2 = q =̃
c 2 q2 . (11.4.28)
є(ω)
gilt. Für Frequenzen im infraroten Spektralbereich (1013 Hz) liegt der Wellenvektor von
Photonen im Bereich von 103 cm−1 , wogegen sich die Wellenzahl der Phononen bis etwa
108 cm−1 erstreckt. Es können deshalb nur solche Gitterschwingungen angeregt werden, die
unmittelbar im Zentrum der ersten Brillouin-Zone liegen (vergleiche hierzu die Diskussion
in Abschnitt 5.5). Wir werden deshalb zunächst nur den Fall q = 0 betrachten.
602 11 Dielektrische Eigenschaften
Für die erzwungene Schwingung müssen wir in der Differentialgleichung (11.4.4) das lokale
elektrische Feld jetzt
1
Elok = Eext + EL = Eext + P (11.4.30)
3є 0
anstelle von (11.4.11) verwenden. Setzen wir in diese Gleichung P = є 0 n V α el Elok + n V qu ein
q2
und verwenden ferner α ion (0) = є 0 ω 2 µ , so erhalten wir
0
1 2 3 n V α ion (0)
1
1
Elok = E + µω u. (11.4.31)
1 − 13 n V α el q 0 1 − 13 n V α el
ext
Setzen wir dieses lokale Feld wiederum in die Differentialgleichung (11.4.4) ein und verwen-
den den Ausdruck (11.4.16) für ω T , so ergibt sich
∂2 u q
µ + µω 2T u = Eext . (11.4.32)
∂t 2 1 − 3 n V α el (0)
1
Hierbei haben wir außerdem bereits den statischen Wert für die elektronische Polarisierbar-
keit benutzt. Für ein harmonisches externes elektrisches Feld der Frequenz ω erhalten wir
die Lösung
q 1 1
u= Eext . (11.4.33)
µ 1 − 3 n V α el (0) ω T − ω 2
1 2
Mit Pion = n V qu und dem allgemeinen Zusammenhang P = є 0 χEext erhalten wir für den
Beitrag der Ionen zur Suszeptibilität
n V q ⋃︀u⋃︀ nV q2 1 1
χ ion = = . (11.4.34)
є 0 ⋃︀Eext ⋃︀ є 0 µ 1 − 13 n V α el (0) ω 2T − ω 2
ω 2T
χ ion = χ ion (0) . (11.4.36)
ω 2T− ω2
wobei χ el (ω) der elektronische Beitrag ist. Für den statischen Wert können wir
𝝐 𝟎
4 8
𝝐stat
0 0
i ( )
r ()
𝝎𝑻 𝝎𝑳
schreiben, wobei wir (11.4.19) verwendet haben. Wir können nun χ ion (0) durch є(0) und
є stat ersetzen und erhalten
(︀є(0) − є stat ⌋︀ ω 2T
є(ω) = 1 + χ el (ω) + . (11.4.39)
ω 2T − ω 2
Wir können uns nun nach oben auf den Frequenzbereich des sichtbaren Lichts beschränken
und deshalb 1 + χ el (ω) durch є stat ersetzen. Damit ergibt sich27
(︀є(0) − є stat ⌋︀ ω 2T
є(ω) = є stat + (11.4.40)
ω 2T − ω 2
ω 2L − ω 2
є(ω) = є stat . (11.4.41)
ω 2T − ω 2
27
Für eine bessere Übereinstimmung mit dem Experiment ist es notwendig, einen Dämpfungsterm
einzuführen. Damit erhalten wir den Ausdruck
(︀є(0) − є stat ⌋︀ ω 2T
є(ω) = є stat + ,
(ω 2T − ω 2 ) − ıΓω
womit wir für den Real- und Imaginärteil der dielektrischen Funktion unter Benutzung der LST-
Relation
4 2 2 2
( ωω ) − ( ωω ) [︀1 + ( ωω L ) + ( ωΓ ) ⌉︀
T T T T
є r (ω) = є stat 4 2 2
1 + ( ωωT ) − 2( ωωT ) + ( ωΓT )
2
( ωω )( ωω L ) ( ωΓ ) − ( ωω )( ωΓ )
T T T T T
є i (ω) = є stat 4 2 2
1 + ( ωωT ) − 2( ωωT ) + ( ωΓT )
erhalten.
604 11 Dielektrische Eigenschaften
1.0
0.8
Totalreflexion
0.6
R ()
0.4
0.2
𝝎𝑻 𝝎𝑳
Abb. 11.10: Reflexionsvermögen ei-
nes Ionenkristalls berechnet nach 0.0
0 1 2 3 4
Gleichung (11.4.41) und (11.1.33)
für ω L = 1.5 ω T und є stat = 1.5. / T
32
Diese Funktion (siehe hierzu Abb. 11.9) besitzt eine Singularität bei ω = ω T und eine Null-
stelle bei ω = ω L . Letzteres stimmt mit unserer allgemeinen Überlegung überein, dass eine
longitudinale Eigenmode nur für є(ω) = 0 auftreten kann. Für den Frequenzbereich ω T <
ω < ω L ist die dielektrische Funktion
⌈︂ negativ. Nach unserer Diskussion in Abschnitt 11.1.3
bedeutet dies, dass n = 0 und κ = ⋃︀є⋃︀. Der Reflexionskoeffizient ist nach (11.1.33) somit
R = 1. Wir erhalten also gemäß (11.1.28)
⌈︂
E = E0 e−ı ωt e− ⋃︀є⋃︀ ωc x
. (11.4.42)
Die elektromagnetische Welle kann nicht in den Festkörper eindringen, ⌋︂ sondern wird total-
reflektiert.28 Außerhalb des Frequenzbereichs ω T < ω < ω L ist n = є und κ ≃ 0, der Reflexi-
onskoeffizient ist also kleiner als eins. Das aus Abb. 11.9 bei Vernachlässigung der Dämpfung
erhaltene Reflexionsvermögen ist in Abb. 11.10 gezeigt.
Die dielektrische Funktion (11.4.41) beschreibt die experimentell gemessene Funktion noch
nicht ganz richtig, da wir bei unserer Analyse dissipative Effekte vernachlässigt haben (siehe
hierzu Fußnote auf S. 603). Dies können wir korrigieren, indem wir in der Differentialglei-
chung (11.4.4) einen Dämpfungsterm hinzufügen. Dadurch erhält die dielektrische Funk-
tion einen Imaginäranteil, der in der Nähe von ω T zu einer starken Strahlungsabsorption
und außerdem dazu führt, dass der Reflexionskoeffizient nicht mehr den maximalen Wert
eins erreicht. In Abb. 11.9 haben wir die endliche Dämpfung bereits berücksichtigt, wodurch
bei ω⇑ω T keine Singularität auftritt.
In Tabelle 11.2 sind die experimentell ermittelten Zahlenwerte für ω T , ω L , є(0) und є stat für
einige Materialien angegeben. Dabei wurde ω T aus den gemessenen Absorptionsspektren
bestimmt und ω L wurde mit Hilfe der LST-Relation aus ω T , є(0) und є stat ermittelt. Die
Dielektrizitätskonstante є(0) kann einfach mit Hilfe eines Plattenkondensators gemessenen
werden, während є stat üblicherweise durch Messung des Brechungsindex bestimmt wird. Die
28
Lassen wir breitbandige elektromagnetische Strahlung zwischen zwei dielektrischen Festkörpern
mehrmals hin- und herlaufen, so bleibt nur Strahlung aus dem Bereich ω T < ω < ω L übrig. Man
spricht deshalb von Reststrahlen.
11.4 Ionische Polarisation 605
Material є(0) єstat ωT (1013 Hz) ωL (1013 Hz) Tabelle 11.2: Dielektrizitäts-
LiF 8.9 1.9 5.8 12
konstanten є(0) und є stat
sowie Frequenzen der longi-
NaF 5.1 1.7 4.5 7.8 tudinalen und transversalen
KF 5.5 1.5 3.6 6.1 optischen Phononen bei
LiCl 12.0 2.7 3.6 7.5 300 K für einige dielektrische
NaCl 5.9 2.25 3.1 5.0 Festkörper.
KCl 4.85 2.1 2.7 4.0
LiBr 13.2 3.2 3.0 6.1
NaBr 6.4 2.6 2.5 3.9
KI 5.1 2.7 1.9 2.6
MgO 9.8 2.95 7.5 14
GaAs 12.9 10.9 5.1 5.5
InAs 14.9 12.3 4.1 4.5
GaP 10.7 8.5 6.9 7.6
InP 12.4 9.6 5.7 6.5
C 5.5 5.5 25.1 25.1
Si 11.7 11.7 9.9 9.9
Ge 15.8 15.8 5.7 5.7
mit Hilfe der LST-Relation bestimmten Werte von ω L stimmen sehr gut mit den durch in-
elastische Neutronenbeugung direkt erhaltenen Werten von ω L überein. Die Abweichungen
liegen meist nur im Prozentbereich.
11.4.2.2 Polaritonen
Wir haben im vorangegangenen Abschnitt gesehen, dass transversale elektromagnetische
Wellen transversale optische Gitterschwingungen anregen können, wenn Frequenz und Wel-
lenvektor übereinstimmen. Wir haben aber unsere Diskussion dann auf q ≃ 0 beschränkt.
Wir erweitern nun unsere Betrachtung auf q > 0. Dies können wir dadurch tun, dass wir
die in (11.4.41) angegebene dielektrische Funktion in die allgemeine Dispersionsrelation
(11.4.28) einsetzen. Wir erhalten dann
є stat ω 2L − ω 2 2
q2 = ω . (11.4.43)
c 2 ω 2T − ω 2
In Abb. 11.11 ist die sich daraus ergebende Dispersionsrelation ω(q) dargestellt. Ebenfalls
eingezeichnet sind die Dispersionsrelationen von Photonen und optischen Phononen. Da
die Dispersion von Photonen sehr steil verläuft und wir uns deshalb nahe am Zentrum
der Brillouin-Zone befinden, wurde für die optischen Phononen ω(q) = const angenom-
men. Wir erhalten aus (11.4.43) zwei Dispersionszweige, die durch eine Frequenzlücke zwi-
schen ω T und ω L voneinander getrennt sind. In diesem Frequenzbereich erlaubt (11.4.43)
keine Lösung mit reellen Werten für ω und q. Im Bereich, in dem Frequenz und Wellen-
vektor von Photonen und Phononen gut übereinstimmen, liegt eine starke Kopplung von
Photon und Phonon vor und wir erhalten eine neue, aus Photon und Phonon zusammenge-
setzte Anregung, die Polariton genannt wird. Entfernen wir uns von diesem Bereich, liegen
wieder getrennte Anregungen (Photonen und Phononen) mit ihren jeweiligen Dispersions-
606 11 Dielektrische Eigenschaften
3
𝝎 = 𝒄𝒒/ 𝝐𝐬𝐭𝐚𝐭
Abb. 11.11: Dispersionsrelation von
Polaritonen berechnet nach (11.4.43)
/ T
für ω L = 1.5 ω T . Gestrichelt einge- 2 Phonon-
zeichnet sind die Dispersionskur- artig 𝝎 = 𝒄𝒒/ 𝝐(𝟎)
ven für die optischen Phononen, L
die in dem gezeigten kleinen Be- verbotener Frequenzbereich
1
reich nahe q = 0 etwa horizontal
verlaufen. Die gepunkteten Gera-
T Phonon-artig
є stat ω 2L 2
q2 = ω . (11.4.44)
c 2 ω 2T
11.5 Orientierungspolarisation
11.5.1 Statische Polarisation
In paraelektrischen Substanzen liegen auch ohne elektrisches Feld elektrische Dipole vor.
Diese sind ohne äußeres Feld völlig ungeordnet und werden durch Anlegen eines externen
11.5 Orientierungspolarisation 607
Felds ausgerichtet. In einem Gas wirkt der Ausrichtung vorhandener Dipole nur die Tempe-
raturbewegung entgegen. Bei einem Festkörper ist dies komplizierter, da hier auch Gitter-
kräfte der Umorientierung von Dipolen entgegenwirken können. Ein Dipol kann zum Bei-
spiel aufgrund eines Kristallfeldes für verschiedenen Orientierungen unterschiedliche po-
tenzielle Energie besitzen. Der Einfluss der Gitterkräfte ist üblicherweise in verschiedenen
Festkörpern unterschiedlich stark und kann nicht allgemein angegeben werden. Nur wenn
die thermische Energie k B T größer ist als die durch das Kristallfeld bewirkten Unterschiede
der Dipolenergie, kann ein einfacher Zusammenhang zwischen der statischen elektrischen
Suszeptibilität eines paraelektrischen Festkörpers und seiner Temperatur angegeben werden.
Dieser Zusammenhang kann ganz analog zum Langevinschen Paramagnetismus abgeleitet
werden. Die potenzielle Energie eines elektrischen Dipolmoments in einem statischen elek-
trischen Feld ist gegeben durch
wobei θ der Winkel zwischen Dipolmoment und elektrischem Feld ist. Für p dip E ≪ k B T
können die Dipole nur partiell ausgerichtet werden. Sind sie frei beweglich, so lässt
sich der Mittelwert der Kosinusfunktion wie beim Paramagnetismus (vergleiche hierzu
Abschnitt 12.3.5) zu ∐︀cos θ̃︀ = p dip E⇑3k B T berechnen. Damit erhalten wir die Langevin-
Debye-Beziehung
und damit
C p2dip
χ dip = mit C = nV . (11.5.3)
T 3є 0 k B
Hierbei ist ⧹︂
E der Einheitsvektor in Feldrichtung. Der Zusammenhang (11.5.3) entspricht
dem Curieschen Gesetz für die magnetische Suszeptibilität paramagnetischer Substanzen
(vergleiche Abschnitt 12.3.5).
In Festkörpern können die elektrischen Dipolmomente üblicherweise nicht frei rotieren. Sie
nehmen vielmehr bevorzugte Orientierungen ein. Nehmen wir an, dass nur zwei bevorzug-
te Orientierungen vorliegen, so erhalten wir für die Polarisation einen zur Magnetisierung
eines Spin-1⇑2-Systems äquivalenten Ausdruck (vergleiche hierzu Abschnitt 12.3.5):
2
p dip E n V p dip E
Pdip = nv p dip tanh ≃ . (11.5.4)
kB T kB T
Hierbei gilt die Näherung nur für p dip E ≪ k B T, da wir in diesem Fall die tanh-Funktion
durch ihr Argument nähern können. Für die Suszeptibilität ergibt sich daraus
C p2dip
χ dip ≃ mit C = nV . (11.5.5)
T є0 kB
Wir sehen, dass dieses Ergebnis bis auf den Faktor 1⇑3 mit dem Ausdruck für frei rotierbare
Dipole übereinstimmt.
608 11 Dielektrische Eigenschaften
Für den Real- und Imaginärteil von χ dip (ω) ergeben sich daraus die so genannten Debye-
schen Formeln
1
r
χ dip (ω) = χ dip (0) (11.5.10)
1 + ω2 τ 2
ωτ
i
χ dip (ω) = χ dip (0) . (11.5.11)
1 + ω2 τ 2
In Abb. 11.12 sind diese Abhängigkeiten auf einer logarithmischen Frequenzskala aufgetra-
gen. Für ωτ ≪ 1 können die elektrischen Dipole dem angelegten elektrischen Feld instantan
ohne Phasenverzögerung folgen und wir erhalten χ dip r
(ω) = χ dip (0). Ferner ist χ dip
i
(ω) = 0,
d. h. die dielektrischen Verluste sind verschwindend klein. Mit steigender Frequenz nimmt
r
dann χ dip (ω) kontinuierlich ab und χ dip
i
(ω) gleichzeitig zu. Bei ωτ = 1 ist χ dip
r
(ω) auf 1⇑2
11.5 Orientierungspolarisation 609
1.0
χdip /χdip(0)
r
0.8
χdip /χdip(0) χdip /χdip(0)
0.6
i
χdip /χdip(0)
i
0.4
0.2
r
0.0
Abb. 11.12: Real- und Imaginärteil
0.01 0.1 1 10 100 der elektrischen Suszeptibilität durch
ωτ Orientierungspolarisation.
i
abgefallen und χ dip (ω) hat ein Maximum, d. h. die dielektrischen Verluste sind hier maxi-
mal. Für ωτ ≫ 1 gehen sowohl χ dip
r
(ω) als auch χ dip
i
(ω) gegen null. Hier können die Perma-
nentdipole der schnellen Änderung des elektrischen Feldes nicht folgen und werden deshalb
überhaupt nicht mehr ausgerichtet.
Wir haben oben bereits festgestellt, dass ein elektrischer Dipol zum Beispiel aufgrund eines
Kristallfeldes für verschiedene Orientierungen unterschiedliche potenzielle Energie besitzen
kann. Stellen wir uns die Abhängigkeit der potenziellen Energie vom Orientierungswinkel
in einfachster Näherung als Kosinus-Funktion mit Amplitude E A ⇑2 vor, so müssen wir bei
einer Umorientierung eines elektrischen Dipolmoments eine Potenzialbarriere der Höhe E A
überwinden. Die zugehörige Rate können wir ausdrücken durch
1 1 −E A ⇑k B T
= e . (11.5.12)
τ τ0
Sie nimmt exponentiell mit höher werdender Potenzialbarriere ab. Für die charakteristi-
sche Versuchsfrequenz 1⇑τ 0 können wir die Debye-Frequenz verwenden, da die Moleküle
bzw. Atome in den Potenzialmulden mit dieser Frequenz schwingen. Verwenden wir für die
Debye-Frequenz den typischen Wert von 1014 s−1 , so erhalten wir für eine Potenzialbarriere
von etwa 300 mV die Relaxationsrate 1⇑τ = 109 s−1 .
Aufgrund der exponentiellen Abhängigkeit von der Temperatur und der Höhe der Poten-
zialbarriere kann die Relaxationsrate 1⇑τ der Orientierungspolarisation Werte über einen
weiten Bereich annehmen. Typische Werte liegen im Bereich zwischen 108 bis 1010 Hz und
damit üblicherweise weit unterhalb der charakteristischen Frequenzen ω T und ω L der opti-
schen Phononen (∼ 1013 − 1014 Hz). Diese liegen wiederum weit unterhalb der charakteris-
tischen Frequenzen ω i k der elektronischen Polarisation (∼ 1016 Hz). Die gesamte dielektri-
sche Funktion eines paraelektrischen Ionenkristalls, in dem alle drei Polarisationsprozesse
zum Tragen kommen, erhalten wir dadurch, dass wir die drei Beiträge einfach aufsummie-
ren. Wir erhalten dann insgesamt den in Abb. 11.13 gezeigten charakteristischen Verlauf der
dielektrischen Funktion.
610 11 Dielektrische Eigenschaften
d 2 x m∗ dx
m∗ + = −eE 0 e−ı ωt . (11.6.1)
dt 2 τ dt
6
𝟏/𝝉
𝝌dip 𝟎
4
𝝌𝐢𝐨𝐧 𝟎
2
𝝌𝐞𝐥 𝟎
Abb. 11.13: Schematischer Ver-
lauf der Frequenzabhängig- 1
keit der dielektrischen Funk- 0
tion für einen paraelektri- 𝝎𝑻 𝝎𝑳
schen Ionenkristall mit 1⇑τ =
1010 Hz, ω T = 1014 Hz, ω L = -2
8 9 10 11 12 13 14 15 16 17 18
1.5 × 1014 Hz, ω i k = 1016 Hz, 10 10 10 10 10 10 10 10 10 10 10
χ dip (0) = 3 und є stat = 1.5. (Hz)
38
11.6 Dielektrische Eigenschaften von Metallen und Halbleitern 611
Hierbei ist x die homogene Auslenkung der Elektronen in x-Richtung gegenüber den positi-
ven Ionenrümpfen. Der Term auf der rechten Seite beschreibt die antreibende Kraft, der ers-
te Term auf der linken Seite den Trägheitsterm und der zweite einen Reibungs- bzw. Dämp-
fungsterm. Dieser kommt durch die Stoßprozesse der Elektronen mit der mittleren Stoßzeit τ
zustande. Da wir es mit vollkommen freien Elektronen zu tun haben, fehlt die Rückstellkraft
kx = m∗ ω 20 x, die zu einer charakteristischen Schwingungsfrequenz ω 0 führen würde.
Gleichung (11.6.1) hat die Lösung
e 1
x(t) = ∗
E 0 e−ı ωt . (11.6.2)
m ω (ω + ı 1τ )
Die sich aus der Verschiebung x(t) der Leitungselektronen relativ zu den positiven Ionen-
rümpfen ergebende Polarisation ist
nV e 2 1
PL (t) = −en V x(t) = − ∗
E 0 e−ı ωt . (11.6.3)
m ω (ω + ı 1τ )
Hierbei ist n V die Dichte der Leitungselektronen. Für den Beitrag der Leitungelektronen zur
elektrischen Suszeptibilität erhalten wir damit
PL nV e 2 1
χ L (ω) = =− ∗
. (11.6.4)
є0 E є 0 m ω (ω + ı 1τ )
Die gesamte dielektrische Funktion eines Metalls erhalten wir als Summe aus dem Beitrag
der gebundenen und vollkommen freien Elektronen zu
Hierbei ist є el der Beitrag der an die Ionenrümpfe gebundenen Elektronen, der durch
(11.3.45) gegeben ist.29 Setzen wir (11.6.4) in (11.6.5) ein, so erhalten wir
⎨ ⎬
⎝ nV e 2 1 ⎠
є(ω) = є el (ω) ⎝1 − ⎠
⎝ (ω)m ∗ 1 ⎠
ω (ω + ı τ ) ⎮
⎪ є є
0 el
1− ı
= є el (ω) ⌊︀1 − ω 2p τ 2 ωτ
}︀ . (11.6.6)
1+ ω2 τ 2
Hierbei ist
}︂ }︂
nV e 2 σ(0)
ωp = = (11.6.7)
є 0 є el m∗ є 0 є el τ
die Plasmafrequenz, wobei wir den Ausdruck σ(0) = n V e 2 τ⇑m∗ für die statische elektri-
sche Leitfähigkeit benutzt haben. Wir werden weiter unten sehen, dass die charakteristi-
sche Frequenz ω p , für die im Fall schwacher Dämpfung (ωτ ≫ 1) nach (11.6.6) є(ω p ) = 0
29
Wir verwenden є el ≃ є r,el , da der Imaginärteil є i,el bis zu sehr hohen Frequenzen im UV-Bereich
sehr klein ist.
612 11 Dielektrische Eigenschaften
ω 2p ω2 τ 2 σ(0) ωτ
є r (ω) = є el (ω) (1 − ) = є el (ω) (1 − )
ω2 1 + ω2 τ 2 є 0 є el (ω)ω 1 + ω 2 τ 2
(11.6.8)
ω 2p ωτ σ(0) 1
є i (ω) = є el (ω) ( 2 ) = є el (ω) ( ).
ω 1 + ω2 τ 2 є 0 є el (ω)ω 1 + ω 2 τ 2
Diese Ausdrücke entsprechen den mit dem Lorentzschen Oszillator-Modell abgeleiteten
Ausdrücken [vergleiche (11.3.10) und (11.3.11)] für ω 0 → 0 und Γ = 1⇑τ. Dies ist einfach
verständlich. Da wir für freie Elektronen keine Rückstellkräfte haben, geht die charakteristi-
sche Schwingungsfrequenz gegen null. Die Linienbreite Γ wird durch Streuprozesse mit der
Rate 1⇑τ verursacht. Die Streuzeit τ liegt bei Metallen typischerweise im Bereich von 10−13
bis 10−14 s. Wir können drei Frequenzbereiche unterscheiden:
1. ωτ ≪ 1:
In diesem niederfrequenten Bereich gilt neben ωτ ≪ 1 auch σ(0)⇑є 0 є el ω ≫ 1. Der Ima-
ginärteil der dielektrischen Funktion ist wesentlich größer als der Realteil und wir erhal-
ten deshalb aus ̃n 2 = n 2 + 2ınκ − κ 2 = є r (ω) + ıє i (ω) näherungsweise n 2 ≃ κ 2 und 2nκ ≃
2κ ≃ є 0 ω , also
2 σ(0)
}︂
σ(0)
n≃κ≃ . (11.6.9)
2є 0 ω
Den Reflexionskoeffizienten (11.1.33) schreiben wir in der Form R = 1 − (4n⇑(︀(n + 1)2 +
κ 2 ⌋︀), was sich für n ≃ κ ≫ 1 durch R ≃ 1 − 2⇑n annähern lässt. Wir erhalten dann die so
genannte Hagen-Rubens-Relation
}︂
2є 0 ω
R ≃1−2 . (11.6.10)
σ(0)
Wir sehen, dass die Abweichung vom idealen Reflexionsvermögen R = 1 umso gerin-
ger ist, je höher die Leitfähigkeit eines Metalls ist. Für Silber mit einer Leitfähigkeit
von 6.25 × 107 Ω−1 m−1 erhalten wir im Infraroten bei einer Frequenz von 1013 s−1 nach
(11.6.10) ein Reflexionsvermögen von R = 0.997, also einen Wert sehr nahe bei eins.
Selbst im sichtbaren Bereich ist R > 0.96.
Nach (11.1.28) ist die elektromagnetische Welle im Metall nach der Strecke δ = c⇑ωκ auf
1⇑e-tel des Anfangswerts abgefallen. Wir nennen diese Strecke die Skin-Eindringtiefe.
Sie ist gegeben durch
}︂
2
δ≃ , (11.6.11)
σ(0)µ 0 ω
wobei wir 1⇑c 2 = є 0 µ 0 verwendet haben.
11.6 Dielektrische Eigenschaften von Metallen und Halbleitern 613
2. 1⇑τ ≪ ω ≪ ω p :
Dies ist der so genannte Relaxationsbereich, in dem der Term ω 2 τ 2 im Nenner von
(11.6.8) das Übergewicht bekommt. Der Imaginärteil der dielektrischen Funktion wird
kleiner als der Realteil. Letzterer ist aber immer noch negativ. Wir erhalten
ω 2P
є r (ω) = є el (ω) (1 − ) (11.6.12)
ω2
ω 2P
є i (ω) = є el (ω) ( ). (11.6.13)
ω3 τ
Wir können in diesem Frequenzbereich gut die Näherung є(ω) ≃ −є el (ω)ω 2p ⇑ω 2 =
⌈︂ ⌈︂
−σ(0)⇑є 0 ω 2 τ benutzen und erhalten ̃
n = n + ıκ ≃ ı є el (ω) ω p ⇑ω ≃ ı σ(0)⇑є 0 τ ⋅ 1⇑ω.
Der Absorptionsindex κ nimmt deshalb proportional zu 1⇑ω ab und ist erstaunlicher-
weise proportional zur Leitfähigkeit.
3. ω ≫ ω p :
In diesem Frequenzbereich wird der Realteil der dielektrischen Funktion positiv. Wir
erhalten
⌈︂
̃
n ≃ є el (ω) (11.6.14)
und das Reflexionsvermögen sinkt auf null ab, da für sehr hohe Frequenzen є r,el (ω) → 1
und є i,el (ω) → 0. Das heißt, das Metall wird mehr oder weniger transparent mit einem
Absorptionskoeffizienten
єi ω ω 2p
K= ≃ 2 ≪ 1. (11.6.15)
c ω τc
Der Verlauf von є r (ω) und das daraus resultierende Reflexionsvermögen R(ω) von Metallen
ist in Abb. 11.14 dargestellt. Für ω < ω p wird eine auf ein Metall auftreffende elektromagne-
tische Welle totalreflektiert. Da für Metalle ω p im UV-Bereich liegt, wird sichtbares Licht
von Metallen üblicherweise gut reflektiert, weshalb Metalle glänzend erscheinen.30
Für ω > ω p ist dagegen є r (ω) positiv und das Metall wird, da, gleichzeitig der Absorpti-
onskoeffizient κ ≃ 0 ist, für elektromagnetische Strahlung durchlässig. Dies trifft z. B. für
Alkali-Metalle im UV-Bereich zu. Der in Abb. 11.14 gezeigte Verlauf von є r und R wird
experimentell für Metalle und Halbleiter meistens nicht beobachtet, da sich der Antwort
des Elektronensystems durch Intraband-Übergänge auch immer noch Beiträge durch Inter-
bandübergänge überlagern (siehe hierzu Abschnitt 11.6.4). Experimentelle Daten zum Re-
flexionsvermögen R von Metallen sind in Abb. 11.15 gezeigt.
30
Das gleiche Phänomen wird beim Kurzwellenfunk ausgenutzt. Da unsere Ionosphäre ein Plasma
darstellt, wird diese unterhalb eines bestimmten Frequenzbereichs totalreflektierend. Langwellige
Radiowellen werden deshalb an der Ionosphäre totalreflektiert.
Die Ionosphäre erstreckt sich in einer Höhe zwischen etwa 50 und mehr als 1500 km über der Erd-
oberfläche. Die Elektronenkonzentration in den Schichten der Ionosphäre reagiert sehr sensibel
auf die solare Aktivität. Tagsüber sind die D-Schicht in 50 bis 90 km Höhe und die E-Schicht in
etwa 85 bis 140 km Höhe präsent. In der nachts vorhandenen F-Schicht ist die Elektronenkonzen-
tration am größten in Höhen zwischen 200 und 600 km. Tagsüber bilden sich oft zwei Maxima aus,
dabei ist die F1-Schicht die schwächer ausgebildete und der Erde näher als die F2-Schicht.
614 11 Dielektrische Eigenschaften
Dielektrische Funktion und Reflexionsvermögen eines Metalls
2 1.0
R
el
R
1 0.5
0 0.0
r
-1 r () -0.5
-2 -1.0
Abb. 11.14: Realteil der dielektrischen
0 1 2 3
/ p
Funktion und Reflexionsvermögen R
eines Metalls bzw. eines Halbleiters. 41
100
80 Al
Au Pt
Reflektivität (%)
Ag
60
Metalle erhalten wir nun ebenfalls einen Bereich mit negativer Dielektrizitätskonstante für
0 < ω < ω p . Es liegt also nahe, der Transversalschwingung des Elektronengases den Frequen-
zwert null zuzuordnen und die Plasmafrequenz ω p mit der Eigenfrequenz der longitudi-
nalen Eigenschwingung des Elektronengases zu identifizieren. Zunächst können wir fest-
halten, dass sich in einem freien Elektronengas genauso wie in einem normalen Gas keine
transversalen Eigenschwingungen ausbilden können, da die entsprechenden Rückstellkräfte
fehlen. Wir können deshalb den Leitungselektronen tatsächlich die transversale Eigenfre-
quenz ω T = 0 zuordnen.
Wir wollen nun noch zeigen, dass ω p in der Tat die Eigenfrequenz der Longitudinalschwin-
gung eines Elektronengases ist. Dazu gehen wir von einem Metall aus, in dem die Elektronen
frei beweglich sind und die positiven Ionen einen starren Ladungshintergrund bilden. Im
Gleichgewichtszustand ist das resultierende Plasma feldfrei und elektrisch neutral. Sobald
die Elektronen durch ein externes Feld aus ihren Gleichgewichtspositionen ausgelenkt wer-
den, wird die Ladungsneutralität aufgehoben und es treten rücktreibende Kräfte auf. Diese
führen zu Plasmaschwingungen.
Wir betrachten zunächst den langwelligen Grenzfall q = 0, das heißt, den Fall einer gleich-
förmigen Auslenkung aller Leitungselektronen. In der in Abb. 11.16 gezeigten Anordnung
führt die gleichförmige Auslenkung s der Elektronen in einer dünnen Metallplatte zu ei-
ner Flächenladungsdichte ρ A = −n V es auf der oberen und ρ A = +n V es auf der unteren Seite
der Metallplatte.31 Es entsteht dadurch ein elektrisches Feld E = n V es⇑єє 0 , welches auf jedes
Elektron die rücktreibende Kraft32
nV e 2
F = −eE = − s (11.6.16)
єє 0
erzeugt. Vernachlässigen wir Reibungsterme, so lautet die entsprechende Bewegungsglei-
chung
d 2 s nV e 2
m∗ + s=0. (11.6.17)
dt 2 єє 0
𝝆𝑨 = −𝒏𝑽 𝒆𝒔
𝒔
𝑬
𝝆𝑨 = +𝒏𝑽 𝒆𝒔 Abb. 11.16: Zur Ableitung der Plasmafrequenz.
31
Wir können uns dies leicht dadurch erklären, dass wir die Elektronen gegenüber den ortsfesten
Ionenrümpfen des Kristallgitters geringfügig nach oben verschieben. Fast überall innerhalb der
Metallplatte herrscht dann nach wie vor Ladungsneutralität. Nur an der Oberseite wird die Ladung
der verschobenen Elektronen nicht durch die Ionenrümpfe kompensiert, wodurch eine negative
Flächenladung resultiert. An der Unterseite bleiben44 die positiven Ionen zurück und resultieren in
einer gleich großen positiven Flächenladung.
32
Es gilt Q = CU = CEd = єєd0 A Ed, wobei d die Dicke der Metallplatte ist. Auflösen nach E ergibt
E = єєQ0 A = nєєV 0es .
616 11 Dielektrische Eigenschaften
Material Li Na K Mg Cu Ag Zn Al Si Ge
ħω p (eV) 7.12 5.71 3.72 10.6 7.5 3.9 10.1 15.3 16.6 16.2
ω p (1015 1/s) 10.86 8.71 5.67 16.17 11.44 5.95 15.41 23.34 25.33 24.71
Dies ist die Bewegungsgleichung eines harmonischen Oszillators mit der Eigenfrequenz
}︂
nV e 2
̃p =
ω . (11.6.18)
єє 0 m∗
Diese Frequenz stimmt mit der Frequenz ω p aus (11.6.7) überein, wenn wir є = є el setzen.
Bei einer Plasmaschwingung handelt es sich um eine kollektive Anregung der Leitungselek-
tronen. Die Quanten dieser Anregung nennen wir Plasmonen. Da ihre Energie für Metalle
im Bereich von 10 eV liegt (siehe Tabelle 11.3), können Plasmonen nicht thermisch ange-
regt werden. Eine Anregung mit transversalen elektromagnetischen Wellen ist auch nicht
möglich. Ihre Anregung erfolgt üblicherweise durch Wechselwirkung des Elektronengases
mit schnellen elektrisch geladenen Teilchen.33 So lassen sich Plasmonen durch Messung des
Energieverlusts von schnellen Elektronen (einige keV) beim Durchgang durch dünne Me-
tallfolien nachweisen. Ein typisches experimentelles Ergebnis ist in Abb. 11.17 gezeigt. Die
Plasmonenenergie manifestiert sich dabei im Energieverlustspektrum der transmittierten
Elektronen durch charakteristische Strukturen bei der Energie ħω p und ganzzahligen Viel-
fachen dieser Energie.
Neben den hier diskutierten Volumenplasmonen werden in Experimenten meist immer auch
Oberflächenplasmonen beobachtet. Bei Letzteren ist die kollektive Elektronenbewegung an
der Oberfläche lokalisiert. Da das damit verbundene elektrische Feld teilweise im Vaku-
um verläuft, besitzen die Oberflächenplasmonen eine niedrigere Energie und wechselwirken
stark mit elektromagnetischen Wellen.34 Oberflächenplasmonen spielen eine wichtige Rol-
le in der oberflächenverstärkten Raman-Spektroskopie und der Erklärung von Anomalien
in der Beugung von Metallgittern (Wood Anomalien35 ). In jüngster Vergangenheit wurden
Oberflächenplasmonen dazu verwendet, die Farbe von Materialien zu kontrollieren.36 Dies
ist möglich, da die Größe und Form von Nanopartikeln die Art der Oberflächenplasmonen
bestimmt, die an sie koppeln und durch sie propagieren können, was wiederum die Wechsel-
wirkung von Licht mit der Oberfläche bestimmt. Dieser Effekt ist von den farbigen Gläsern
in mittelalterlichen Kirchen bekannt, bei denen die Farbe durch Nanopartikel bestimmter
Größe festgelegt wird.
Wir haben bisher nur die longitudinalen Plasmaschwingungen für den langwelligen Grenz-
fall q → 0 diskutiert. Für zunehmende Wellenzahl q nimmt die Eigenfrequenz der Plasma-
33
R. H. Ritchie, Plasma Losses by Fast Electrons in Thin Films, Phys. Rev. 106, 874–881 (1957).
34
S. Maier, Plasmonics: Fundamentals and Applications, Springer Verlag, Berlin (2007).
35
R. W. Wood, On a remarkable case of uneven distribution of light in a diffraction grating spectrum,
Phil. Mag. 4, 396–402 (1902).
36
H. Atwater, The Promise of Plasmonics, Scientific American 296, 56–63 (2007).
11.6 Dielektrische Eigenschaften von Metallen und Halbleitern 617
5 Oberflächenplasmon: 10.0 eV
Al
Intensität (bel. Einh.)
4
Volumenplasmon: 14.8 eV
schwingungen zu. Es lässt sich zeigen, dass für kleine Werte von q die Plasmonen die Di-
spersionsrelation
3v F2 2
ω = ω p (1 + q + . . .) (11.6.19)
10ω 2P
besitzen. Hierbei ist v F die Fermi-Geschwindigkeit des Metalls oder Halbleiters. Die Plasma-
schwingungen können also bei verschiedenen Wellenlängen auftreten. Die Dispersionsrela-
tion zeigt allerdings, dass die Frequenz nicht stark von q abhängt und Plasmonen deshalb
eine kleine Gruppengeschwindigkeit besitzen. Sie neigen deshalb dazu, lokalisierte Schwin-
gungen zu bleiben, die sich nur langsam durch den Festkörper fortbewegen.
є(ω) 2 ω 2p ω 2
q2 = ω = є el (ω) (1 − ) (11.6.20)
c2 ω2 c 2
und damit
c2 2
ω 2 = ω 2p + q . (11.6.21)
є el
618 11 Dielektrische Eigenschaften
Plasmon-Polaritonen
3 𝒄𝟐 𝒒𝟐
𝝎= 𝝎𝟐𝒑 +
𝝐𝐞𝐥
𝒄𝒒
𝝎=
𝝐𝐞𝐥
2
/ p
Abb. 11.18: Dispersionsrelation von 1
Plasmon-Polaritonen in einem frei-
en Elektronengas für є el = 1.5. Für verbotener Frequenzbereich
ω⇑ω p < 1 tritt ein verbotener Fre-
quenzbereich auf, in dem sich elek- 0
0 1 2 3
tromagnetische Wellen nicht in dem 1/2
Elektronengas ausbreiten können. c q / (el)
48
Für ω < ω p muss q 2 < 0 sein, so dass q rein imaginär ist. Wir erhalten in diesem Frequenz-
bereich Lösungen der Form e−⋃︀q⋃︀x . Wellen in diesem Frequenzbereich können sich also, wie
oben bereits diskutiert, im Medium nicht ausbreiten und werden totalreflektiert. Für ω > ω p
ist dagegen die dielektrische Funktion positiv und reell und (11.6.21) beschreibt die Dispersi-
on transversaler elektromagnetischer Wellen in einem Plasma. Wir bezeichnen diese Wellen
als Plasmon-Polaritonen. Der Verlauf der Dispersionskurve ist in Abb. 11.18 gezeigt.
11.6.4 Interband-Übergänge
Bei den meisten Metallen und Halbleitern überlagern Interband-Übergänge die Anregung
von Leitungselektronen durch Intrabandübergänge. Dies hat zur Folge, dass die dielektrische
Funktion von Metallen und Halbleitern teilweise erheblich von der in Abb. 11.14 gezeigten
einfachen Form abweicht. Wir wollen in diesem und im nächsten Abschnitt insbesonde-
re näher auf die optischen Eigenschaften von Halbleitern eingehen, die wir in Grundzügen
bereits in Abschnitt 10.1.2 diskutiert haben.
In Abb. 11.19 sind Interband-Übergänge zwischen Zuständen E v (k) des Valenzbandes und
Zuständen E c (k′ ) des Leitungsbandes eines Halbleiters schematisch gezeigt. Wir unterschei-
den generell zwischen zwei unterschiedlichen Typen von Übergängen, nämlich direkten und
indirekten Übergängen.
𝑬 𝑬𝒄 𝒌
direkt
Abb. 11.19: Direkte und indirekte Interband- indirekt
Übergänge in einem Halbleiter. Die gepunktet ge-
zeichneten Übergänge sind wesentlich unwahr- 𝒌
scheinlicher als die durchgezogen gezeichneten. 𝑬𝑽 𝒌
11.6 Dielektrische Eigenschaften von Metallen und Halbleitern 619
Direkte Übergänge erfolgen durch Absorption von Lichtquanten der Energie ħω ohne Be-
teiligung von Phononen. Für die Energie- und Impulserhaltung gilt hier also
und
k′ = k + kPhoton . (11.6.23)
und
k′ = k + kPhoton ± q . (11.6.25)
1 dS ħω
D i f (ħω) = ∫ (11.6.26)
(2π)3 ⋂︀grad k )︀E f (k) − E i (k)⌈︀⋂︀
ħω=E f −E i
ein, die immer dort maximal ist, wo die beteiligten Bänder i und f parallel zueinander mit
Abstand ħω verlaufen.
620 11 Dielektrische Eigenschaften
11.6.5 Exzitonen
Für Halbleiter erwarten wir bei tiefen Temperaturen, dass eine Absorption elektromagne-
tischer Strahlung nur dann einsetzt, wenn die Energie der Photonen größer als die Band-
lücke E g des Halbleiters ist, da nur dann Elektronen aus dem Valenzband ins Leitungsband
angeregt werden können. Experimentell wird dies aber nicht beobachtet. Man beobachtet
vielmehr einen stark strukturierten Einsatz der optischen Absorption bereits bei ħω < E g .
Diese Beobachtung wird durch Exzitonen verursacht. Ein Exziton ist ein gebundener Zu-
stand zwischen dem ins Leitungsband angeregten Elektron und dem im Valenzband zurück-
bleibenden Loch. Da wir dem Loch eine positive Ladung zuordnen können, ist einsichtig,
dass sich Elektron und Loch gegenseitig anziehen und einen gebundenen Zustand einge-
hen. Die Absorption in einem Halbleiter setzt somit nicht bei ħω = E g , sondern bereits bei
ħω = E g − E ex ein. Hierbei ist E ex die Bindungsenergie des Exzitons. Wir weisen darauf hin,
dass wir bei unserer Diskussion in Kapitel 10 immer angenommen haben, dass bei der Anre-
gung eines Elektrons aus dem Valenzband ins Leitungsband das Elektron im Leitungsband
und das Loch im Valenzband nicht wechselwirken.
Man unterschiedet zwischen so genannten Mott-Wannier-Exzitonen und Frenkel-Exzito-
nen. Erstere sind nach Sir Nevill Francis Mott37 und Gregory Wannier38 , letztere nach Ya-
kov Frenkel39 benannt. Bei Mott-Wannier-Exzitonen ist der Abstand zwischen Elektron und
Loch groß gegenüber dem Gitterabstand (siehe Abb. 11.20a). Sie werden beobachtet, wenn
die Elektronen nur schwach an die Gitteratome gebunden sind. Dies ist z. B. bei Halbleitern
der Fall. Die typischen Bindungsenergien betragen hier einige meV und der Elektron-Loch-
Abstand einige nm. Bei Molekül- oder Ionenkristallen beobachtet man dagegen Frenkel-Ex-
zitonen. Aufgrund der starken Coulomb-Wechselwirkung zwischen Elektron und Loch be-
tragen die Bindungsenergien hier etwa 1 eV. Der Elektron-Loch-Abstand ist so klein, dass das
Elektron-Loch-Paar am gleichen Gitteratom lokalisiert ist. Aufgrund der Kopplung benach-
barter Gitteratome kann sich allerdings ein Frenkel-Exziton genauso wie ein Mott-Wannier-
Exziton durch den Kristall bewegen. Fällt das Elektron in das Loch im Valenzband zurück
(Rekombination), wird die Bindungsenergie des Exzitons wieder frei.
Wir wollen uns im Folgenden nur mit Mott-Wannier-Exzitonen beschäftigen. Wir können
deren Bindungsenergie abschätzen, indem wir das gebundene Elektron-Loch-Paar als was-
serstoffähnliches System auffassen, bei dem das Elektron und das Loch um den gemeinsa-
men Schwerpunkt kreisen (siehe Abb. 11.20a). Die Coulomb-Energie der Wechselwirkung
lautet
e2
V (⋃︀r e − r h ⋃︀) = . (11.6.27)
4πє 0 є⋃︀r e − r h ⋃︀
37
Sir Nevill Francis Mott, geboren am 30. September 1905 in Leeds, gestorben am 8. August 1996
in Milton Keynes. Er erhielt 1977 zusammen mit Philip W. Anderson und J. H. Van Vleck den
Nobelpreis für Physik für seine Arbeiten zu den elektronischen und magnetischen Eigenschaften
von ungeordneten Systemen.
38
Gregory Hugh Wannier, schweizer Physiker, geboren 1911 in Basel, Schweiz, gestorben am 21. Ok-
tober 1983 in Portland, USA.
39
Yakov Il’ich Frenkel, russischer Physiker, geboren am 10. Februar 1894 in Rostov-on-Don, gestor-
ben am 23. Januar 1952 in St. Petersburg.
11.6 Dielektrische Eigenschaften von Metallen und Halbleitern 621
Hierbei sind r e und r h die Koordinaten des Elektrons bzw. des Lochs und є ist die Dielek-
tizitätskonstante des Festkörpers. Die zugehörige Schrödinger-Gleichung erlaubt eine Sepa-
ration nach Relativ- und Schwerpunktkoordinaten und liefert die Energieigenwerte
1 µ∗ e 4 1 ħ2 K 2
E n,K = E g − + , n = 1, 2, 3, . . . . (11.6.28)
2 (4πє 0 є)2 ħ 2 n 2 2(m∗e + m∗h ) 50
Hierbei erscheint die Energielücke E g als additive Konstante, da üblicherweise der Ener-
gienullpunkt in die Oberkante des Valenzbandes gelegt wird. Der zweite Term entspricht
den gebundenen Zuständen eines Wasserstoffatoms, wobei die effektive reduzierte Masse
1⇑µ∗ = 1⇑m∗e + 1⇑m∗h und die Dielektrizitätskonstante des Festkörpers eingehen. Letztere
trägt der Abschirmung des Coulomb-Potenzials durch das umgebende Medium Rechnung.
Der dritte Term resultiert aus der Schwerpunktsbewegung des Exzitons mit Wellenvektor K.
Da für Halbleiter є ∼ 10, liegt die experimentell gemessene Bindungsenergie im Bereich von
1–10 meV (siehe Tabelle 11.4, vergleiche hierzu auch die Diskussion in Abschnitt 10.1.3)
und der Bohrsche Radius im nm-Bereich. Dies rechtfertigt unsere einfache Annahme eines
Wasserstoff-Modells mit einer makroskopischen Dielektrizitätskonstante.
In einem optischen Absorptionsexperiment werden wegen des verschwindend kleinen Im-
pulses der Photonen nur Übergänge zwischen Zuständen mit etwa gleichem Wellenvektor
induziert. Das heißt, es können nur Zustände mit K = 0 angeregt werden und der dritte Term
in (11.6.28) fällt deshalb weg. Liegen das Valenzbandmaximum und das Leitungsbandmi-
nimum beim gleichen k-Wert, so liegen die durch (11.6.28) gegebenen Zustände innerhalb
der Energielücke und zwar um E ex unterhalb des Leitungsbandminimums. Dies führt zu ei-
nem Absorptionsmaximum, das innerhalb der Bandlücke liegt (siehe Abb. 11.21). Es sei dar-
auf hingewiesen, dass die durch (11.6.28) gegebenen Energien Zweiteilchen-Energieniveaus
sind und deshalb schlecht in ein Bandschema eingezeichnet werden können, in dem Einteil-
chenenergien dargestellt werden. Es ist allerdings möglich, durch Anregung eines Elektrons
aus dem Valenzband die Zustände E n,K zu erreichen, die gerade unterhalb der Bandkante
liegen (siehe Abb. 11.20b).
1.2
Exziton-
Absorption
1.0
K (10 cm )
-1
0.8 GaAs
4
T = 21 K
Abb. 11.21: Absorptionskonstante K
von GaAs gemessen bei 21 K in der
0.6 Eg
Nähe der Energielücke. Die gestrichel-
te Kurve deutet das Ergebnis an, das
wir ohne die Exziton-Zustände er- 0.0
warten würden (nach M. D. Sturge, 1.50 1.52 1.54 1.56
Phys. Rev. 127, 758 (1962)). ћ (eV)
11.7 Elektron-Elektron-Wechselwirkung
und Abschirmung in Metallen
Wir haben in Abschnitt 11.6 nur die Frequenzabhängigkeit є(ω) der dielektrischen Funk-
tion von Metallen diskutiert. Wir wollen nun in diesem Abschnitt auf ihre q-Abhängigkeit
є(q, ω) eingehen. Wir haben bereits darauf hingewiesen, dass das Fehlen einer q-Abhängig-
keit der dielektrischen Funktion gleichbedeutend damit ist, dass die Antwort eines Festkör-
pers auf ein elektrisches Feld rein lokal ist, da die Fourier-Transformierte einer konstanten
Funktion є(q) im q-Raum einer δ-Funktion im Ortsraum entspricht. Ein wichtiger Aspekt
bei der Behandlung der q-Abhängigkeit der dielektrischen Funktion in Metallen ist deshalb
die Berücksichtigung der Elektron-Elektron-Wechselwirkung. Sie führt dazu, dass die lokale
Antwort eines bestimmten Elektrons auf eine äußere Störung auch von den es umgebenden
Elektronen abhängt, mit denen es wechselwirkt. Es sei hier nochmals darauf hingewiesen,
dass wir bei der Diskussion der Bandstruktur von Festkörpern immer von einem Einelek-
tronenmodell ausgegangen sind, bei dem sich ein einzelnes, unabhängiges Teilchen in einem
wohldefinierten Potenzial bewegt. Das schwierige, für ein Vielteilchensystem charakteristi-
sche Problem der Wechselwirkung der Elektronen untereinander haben wir nicht behandelt,
obwohl wir wissen, dass die zwischen den Ladungen wirkenden Coulomb-Kräfte langreich-
weitig sind.
Da die Behandlung von wechselwirkenden Elektronensystemen komplex und einer exakten
Lösung nicht zugänglich ist, werden wir im Folgenden einfache Näherungen verwenden, um
die Auswirkung der Elektron-Elektron-Wechselwirkung auf die dielektrischen Eigenschaf-
ten von Metallen zu diskutieren. Wir werden dabei so genannte mittlere Feldnäherungen
verwenden, bei denen das Vielteilchenproblem auf die Bewegung eines Elektrons reduziert
wird, das sich in einem von allen anderen erzeugten mittleren Feld bewegt. Wir werden
sehen, dass die Elektron-Elektron-Wechselwirkung zu zwei neuen Phänomenen führt: Ab-
schirmung und Austausch. In den folgenden Abschnitten werden wir im Detail diskutieren,
wie jede Ladung in einem Festkörper – also auch die Elektronen – durch andere Elektro-
nen abgeschirmt wird. Die Austauschwechselwirkung zwischen freien Elektronen, bei der
11.7 Elektron-Elektron-Wechselwirkung und Abschirmung in Metallen 623
wir den Spin der Elektronen berücksichtigen müssen, werden wir erst in Abschnitt 12.5.6.1
im Zusammenhang mit den magnetischen Eigenschaften von Metallen behandeln. Abschir-
mung und Austausch führen zu einer Änderung der Gesamtenergie einer Elektronengases,
die wir in Abschnitt 3.5 bereits im Zusammenhang mit der metallischen Bindung angegeben
haben.
Als erstes Beispiel betrachten wir eine positive Ladung, die wir in ein Gas freier Elektronen
einbringen. Das elektrische Feld dieser Ladung fällt schneller als mit 1⇑r ab, da die positi-
ve Ladung eine Wolke negativer Ladungen um sich herum ansammelt und dadurch abge-
schirmt wird. Diese statische Abschirmung können wir mit einer statischen dielektrischen
Funktion є(q, 0) beschreiben.
Abb. 11.22: Schematische Darstellung der Abschirmung von Ladungen in Metallen zur Veran-
schaulichung der Äquivalenz von dielektrischer Verschiebung und ϕ ext (r) sowie elektrischem Feld
und ϕ ges (r). (a) Feldverteilung durch eine unendlich ausgedehnte homogene zweidimensionale La-
dungsverteilung. (b) Bei Einbringen der „externen“ Störladungen in ein Metall wird im Metall eine di-
elektrische Verschiebung D erzeugt, deren Quellen die externen Ladungen sind. Das elektrische Feld,
dessen Quellen sowohl die externen als auch die induzierten Ladungen sind, verschwindet.
Das elektrische Feld im Innern der Metallplatte ist E = (D − P)⇑є 0 . Seine Quellen sind also
sowohl die externen Ladungen als auch die im Metall induzierten Ladungen, wodurch 55
das
elektrische Feld nach Außen verschwindet. Diese Betrachtung zeigt uns, dass wir ϕ ext (r) mit
der dielektrischen Verschiebung, und ϕ ges (r) mit dem elektrischen Feld assoziieren können.
Wir können dann die allgemeine Definition der dielektrischen Funktion aus Abschnitt 11.1.1
übernehmen und erhalten für den Zusammenhang zwischen ϕ ges (r) und ϕ ext (r) in Analo-
gie zu (11.1.8)
Hierbei haben wir der Einfachheit halber ein räumlich isotropes Medium angenommen, so
dass wir anstelle eines Dielektrizitätstensors eine skalare dielektrische Funktion є(q) ver-
wenden können. Es gilt ferner
d 3 q +ıq⋅r
є(r) = ∫ e є(q) . (11.7.6)
(2π)3
Gleichung (11.7.4) zeigt, dass jede Fourier-Komponente ϕ ges (q) des Gesamtpotenzials der
um den Faktor 1⇑є(q) abgeschwächten Fourier-Komponente ϕ ext (q) des externen Potenzi-
als entspricht.
Wir wollen nun die Ladungsdichte ρ ind (r) berechnen, die durch das Gesamtpotenzi-
al ϕ ges (r) im Elektronengas induziert wird. Wir nehmen dabei vereinfachend an, dass
ϕ ges (r) und ρ ind (r) in linearer Weise zusammenhängen. Diese Annahme ist immer dann
gerechtfertigt, wenn ϕ ges (r) genügend schwach ist. In diesem Fall können wir den Zusam-
menhang zwischen ihren Fourier-Komponenten allgemein als
schreiben. Wir müssen jetzt noch den Zusammenhang zwischen der Proportionalitätskon-
stanten α(q) und є(q) herstellen. Hierzu verwenden wir die Fourier-Transformierten der
11.7 Elektron-Elektron-Wechselwirkung und Abschirmung in Metallen 625
Poisson-Gleichungen (11.7.1) und (11.7.3), die wir wie folgt ausdrücken können:
ρ ext (q)
q 2 ϕ ext (q) = (11.7.8)
є0
ρ ges (q)
q 2 ϕ ges (q) = . (11.7.9)
є0
Ziehen wir diese beiden Gleichungen voneinander ab und verwenden ρ ind (q) = ρ ges (q) −
ρ ext (q) sowie (11.7.7), so erhalten wir
є 0 q 2 )︀ϕ ges (q) − ϕ ext (q)⌈︀ = ρ ind (q) = α(q) ϕ ges (q) . (11.7.10)
ϕ ext (q)
ϕ ges (q) = (11.7.11)
1 − є 01q 2 α(q)
1 1 ρ ind (q)
є(q) = 1 − α(q) = 1 − . (11.7.12)
є0 q2 є 0 q 2 ϕ ges (q)
Aufgrund der gemachten Annahmen ist dieser Ausdruck für є(q) nur dann richtig, wenn
die äußere Störladung schwach genug ist, so dass das Elektronengas mit einer linearen Ant-
wort reagieren kann. Bezüglich der theoretischen Behandlung besteht dann das Problem
in der Berechnung von α(q). Hierzu gibt es zahlreiche Ansätze. Bekannte Beispiele sind
die Thomas-Fermi-Methode, bei der angenommen wird, dass die räumliche Variation des
Störpotenzials langsam erfolgt und deshalb das Störpotenzial mit einer semiklassischen Nä-
herung behandelt werden kann (vergleiche hierzu Abschnitt 9.1). Diese Methode hat den
Vorteil, dass sie nicht auf den Bereich kleiner Störungen begrenzt ist. Die Lindhard-Metho-
de benötigt dagegen keine semiklassische Näherung, setzt aber voraus, dass die induzierte
Ladung nur in linearer Ordnung mit ϕ ges zusammenhängt. Dann kann die Schrödinger-
Gleichung für die Kristallelektronen unter der Wirkung des Störpotenzials störungstheore-
tisch gelöst werden.
ħ2 2
− ∇ Ψk (r) − eϕ ges (r) Ψk (r) = E k Ψk (r) (11.7.13)
2m∗
lösen und können dann mit den ermittelten Wellenfunktionen die Ladungsdichte zu
ρ ges (r) = −e ∑ k ⋃︀Ψk (r)⋃︀2 bestimmen.41 In der Thomas-Fermi Näherung wird jetzt zur
41
Dies muss selbstkonsistent erfolgen, da das Gesamtpotenzials ϕ ges = ϕ ext + ϕ ind von der Ladungs-
verteilung und damit den Lösungen der Schrödinger-Gleichung selbst abhängt.
626 11 Dielektrische Eigenschaften
Vereinfachung angenommen, dass ϕ ges (r) sehr langsam als Funktion von r variiert. Dann
können wir in guter Näherung für die lokale E(k) Beziehung
ħ2 k 2
E(r, k) = − eϕ ges (r) (11.7.14)
2m∗
schreiben. Das heißt, die lokale Energie der Elektronen weicht von dem Wert für freie
Elektronen gerade um das lokale Gesamtpotenzial ab. Für eine positive Störladung wird
sie abgesenkt, für eine negative angehoben. Wir beschreiben dann die exakten Lösungen
der Schrödinger-Gleichung näherungsweise mit einem System von Elektronen, das die
einfache Energieverteilung (11.7.14) besitzt. Die Thomas-Fermi Näherung ist natürlich nur
dann zulässig, wenn wir die freien Elektronen als Wellenpakete auffassen, deren räumliche
Ausdehnung nach unserer Diskussion in Abschnitt 9.1 wesentlich größer als die Fermi-
Wellenlänge sein muss. Das Potenzial muss deshalb langsam im Vergleich zu λ F variieren.
Für die Fourier-Koeffizienten von α(q) bedeutet dies, dass wir uns auf q ≪ k F beschränken
müssen.
Um die lokale Ladungsdichte zu erhalten, die mit einem Elektronensystem mit der Energie-
verteilung (11.7.14) zusammenhängt, müssen wir die lokale Elektronendichte n(r) berech-
nen. Diese ist durch das Integral der Zustandsdichte multipliziert mit der Besetzungswahr-
scheinlichkeit (Fermi-Funktion)
1 1
n(r) = ∫ (︀E(r,k)−µ⌋︀ d3k (11.7.15)
4π 3 e ⇑k B T + 1
gegeben. Die lokal induzierte Ladungsdichte ist dann gerade durch die Differenz −e(︀n(r) −
n 0 ⌋︀ gegeben, wobei n 0 die homogene Ladungsdichte des ungestörten Systems ist. Da n(r) =
n 0 (︀µ + eϕ ges (r)⌋︀ erhalten wir
ρ ind (r) = −e {n 0 )︀µ + eϕ ges (r)⌈︀ − n 0 (µ)} . (11.7.16)
Diese Beziehung zwischen ρ ind (r) und ϕ ges (r) stellt das zentrale Ergebnis der nichtlinearen
Thomas-Fermi Theorie dar.
Im Folgenden werden wir nur die lineare Näherung der Thomas-Fermi Theorie diskutie-
ren. Für eϕ ges ≪ µ können wir die Näherung n 0 (︀µ + eϕ ges ⌋︀ − n 0 (µ) ≃ (∂n 0 ⇑∂µ) µ=E F ⋅ eϕ ges
verwenden und erhalten
∂n 0 D(E F ) ges
ρ ind (r) = −e 2 ( ) ϕ ges (r) = −e 2 ϕ (r) , (11.7.17)
∂µ µ=E F V
also einen linearen Zusammenhang zwischen ρ ind (r) und ϕ ges (r). Hierbei haben wir die
Zustandsdichte D(E F )⇑V = (∂n 0 ⇑∂µ) µ=E F beim Fermi-Niveau verwendet. Vergleichen wir
dieses Ergebnis mit (11.7.7), so folgt
D(E F )
α(q) = −e 2 (11.7.18)
V
und damit
e 2 D(E F )
є(q) = 1 + . (11.7.19)
є0 q2 V
11.7 Elektron-Elektron-Wechselwirkung und Abschirmung in Metallen 627
k s2
є(q) = 1 + . (11.7.21)
q2
Wir sehen, dass für q → 0 (langwelliger Grenzfall) die dielektrische Funktion є(q, 0) → ∞.
Aus Gleichung (11.7.4) folgt dann, dass für q → 0 bei fest vorgegebenem ϕ ext ≠ 0 das Ge-
samtpotenzial ϕ ges → 0. Das heißt, dass ein langwelliges äußeres Potenzial vollständig durch
Elektronenverschiebungen abgeschirmt wird. Die charakteristische Abschirmlänge 1⇑k s
bezeichnen wir als Thomas-Fermi Abschirmlänge. Für Kupfer mit einer Zustandsdichte
D(E F )⇑V = 1.2 × 1022 cm−3 eV−1 ergibt sich 1⇑k s = 0.55 Å. Die Thomas-Fermi Abschirm-
länge ist also für Metalle wegen ihrer hohen Zustandsdichte sehr klein. Für Halbleiter
ergeben sich wesentlich größere Werte.
Wir können das Ergebnis (11.7.21) qualitativ auch durch eine ganz elementare Überlegung
ableiten. Wir gehen von einem Gesamtpotenzial ϕ ges am Ort r aus. Dann wird die potenziel-
le Energie der freien Elektronen relativ zu der Verteilung an einem Ort, an dem ϕ ges = 0, um
den Wert −eϕ ges abgesenkt. Das bedeutet aber, dass sich das chemische Potenzial µ ändern
müsste, wenn nicht Elektronen in dieses Gebiet hineinfließen würden. Da aber im statio-
nären Gleichgewichtszustand das chemische Potenzial im ganzen Volumen konstant sein
muss, fließen in der Tat Elektronen in dieses Gebiet hinein. Nach Abb. 11.23 ist ihre Zahl für
kleine ϕ ges gerade
D(E F ) ges
δn(r) = eϕ (r) . (11.7.22)
V
Die Änderung der Elektronendichte entspricht einer Änderung der lokalen Ladungsdichte,
was wiederum zu einem Potenzial ϕ ind (r) führt. Dieses muss die Poisson-Gleichung
ρ ind (r) −eδn(r) e 2 D(E F )ϕ ges (r)
∇2 ϕ ind (r) = − =− = = k s2 ϕ ges (r) (11.7.23)
є0 є0 є0 V
erfüllen. Das heißt, wir erhalten wiederum das obige Ergebnis (11.7.17) und somit die glei-
chen Ausdrücke für k s und є(q).
n0
≃− eϕ ges (r) , (11.7.24)
kB T
Wir erhalten dann die Debye-Hückel-Formel42 , 43
e 2 n0
k s2 = . (11.7.25)
є0 kB T
Führen wir eine Fermi-Temperatur TF = E F ⇑k B ein und schreiben die Zustandsdichte als
[vergleiche hierzu (7.1.36)]
D(E F ) 3 n 0
= , (11.7.26)
V 2 k B TF
so sehen wir, dass unter der Annahme, dass die Elektronen eines freien Elektronengases ei-
ne sehr hohe Temperatur der Größenordnung TF haben, das quantenmechanische Ergebnis
(11.7.50) für die Abschirmlänge k s der klassischen Debye-Hückel-Formel (11.7.25) äquiva-
lent ist. Dieser Zusammenhang ist evident, da die Fermionen des freien Elektronengases we-
gen des Pauli-Verbots ja Zustände bis zu sehr hohen Energien k B TF ≫ k B T besetzen müssen.
Q Q
ϕ ext (r) = bzw. ϕ ext (q) = (11.7.27)
r є0 q2
gegeben. Mit der allgemeinen Beziehung ϕ ext (q) = є(q) ϕ ges (q) und dem Ausdruck
(11.7.21) für є(q) erhalten wir
ϕ ext (q) Q
ϕ ges (q) = = . (11.7.28)
є(q) є 0 (q + k s2 )
2
42
Petrus Josephus Wilhelmus Debye, siehe Kasten auf Seite 226.
43
Erich Armand Arthur Joseph Hückel, geboren am 9. August 1896 in Berlin, gestorben am 16. Fe-
bruar 1980 in Marburg, deutscher Chemiker und Physiker.
11.7 Elektron-Elektron-Wechselwirkung und Abschirmung in Metallen 629
∝ − 𝟏 𝒓 exp −𝒌𝒔 𝒓
0
∝− 𝟏𝒓
-1
(kse/0)
ges
-2
gegeben sein. Wir betrachten also eine zeitlich oszillierende Störung mit Wellenvektor q, die
mit einer Zeitkonstanten β mit der Zeit langsam abklingt.
Wirkt dieses Potenzial auf den Zustand ⋃︀k̃︀ = exp{ı(k ⋅ r + E(k)t⇑ħ)}, so wird dieser Zu-
stand mit anderen Zuständen gemischt, so dass die Wellenfunktion in
übergeht. Die Koeffizienten c k+q (t) können wir störungstheoretisch in erster Ordnung be-
rechnen zu
∐︀k + q⋃︀ ϕ ges ⋃︀k̃︀
c k+q (t) =
E(k + q) − E(k) − ħω + ıħβ
ϕ 0 e−ı ωt e−βt
ges
= . (11.7.32)
E(k + q) − E(k) − ħω + ıħβ
Dies folgt aus der zeitabhängigen Schrödinger-Gleichung für Ψk (r, t), in der der ungestör-
te Hamilton-Operator mit den Eigenenergien E(k) durch die als klein angenommene Stö-
rung ϕ ges (r, t) erweitert wurde.
Wir betrachten jetzt die Änderung der Elektronendichte aufgrund der Störung. Dabei neh-
men wir an, dass sich die Elektronen gegen einen gleichmäßig geladenen positiven Unter-
grund bewegen. Wir erhalten dann
Hierbei haben wir Terme in ⋃︀c⋃︀2 bereits vernachlässigt und die Summe läuft über alle besetz-
ten Elektronenzustände.
Da ρ ind (r, t) reell sein muss, ergibt die Störung (11.7.30) zwei unterschiedliche Ladungsstö-
rungen, nämlich eine, die mit der Störung in Phase und eine die gegenphasig ist. Allerdings
müssen wir auch berücksichtigen, dass die Störung reell ist. Wenn wir deshalb in (11.7.30)
das konjugiert komplexe, ϕ ges ∗ (r, t) = ϕ 0 e−ıq⋅r e+ı ωt e−βt , dazu addieren, so ergibt sich,
ges
44
Jens Lindhard, geboren am 26. Februar 1922, gestorben am 17. Oktober 1997, dänischer theoreti-
scher Physiker.
45
J. Lindhard, On the Properties of a Gas of Charged Particle, Mat. Fys. Medd. Dan. Vid. Selsk. 28, No.
8 (1954).
11.7 Elektron-Elektron-Wechselwirkung und Abschirmung in Metallen 631
Um dieses Ergebnis noch etwas zu verallgemeinern, wollen wir noch die Besetzungswahr-
scheinlichkeit f 0 (k) für den Zustand ⋃︀k̃︀ im ungestörten System einführen. Für ein Metall
wäre dies z. B. die Fermi-Verteilungsfunktion. Nennen wir im zweiten Term von (11.7.34)
den Summationsindex k in k + q um, so lässt sich die Summe wie folgt schreiben:
f 0 (k) − f 0 (k + q)
ρ ind (r, t) = eϕ 0 ∑ { (︀×e ıq⋅r e−ı ωt e−βt +c. c. .
ges
Die Summe läuft dabei über alle Zustände ⋃︀k̃︀, also besetzte und unbesetzte Zustände.
Wir können nun diese Ladungsdichte dazu benutzen, um mit Hilfe der Poisson-Gleichung
eρ ind (r, t)
∇2 ϕ ind (r, t) = − (11.7.36)
є0
das zugehörige Potenzial ϕ ind (r, t) auszurechnen. Wir können annehmen, dass sich
ϕ ind (r, t) zeitlich und räumlich wie ρ ind (r, t) ändert, d. h.
ıq⋅r −ı ωt −βt
ϕ ind (r, t) = ϕ ind
0 e e e + c. c. . (11.7.37)
Setzen wir diesen Ausdruck zusammen mit (11.7.35) in die Poisson-Gleichung ein, so erhal-
ten wir
f 0 (k) − f 0 (k + q)
ges
e 2 ϕ0
−q 2 ϕ ind
0 =− ∑ (11.7.38)
є0 k E(k + q) − E(k) − ħω + ıħβ
und damit das Potenzial, das die durch das ursprüngliche Störpotenzial ϕ ges erzeugte La-
dungsschwankung hervorruft, zu
e2 f 0 (k) − f 0 (k + q)
0 ={ ∑ (︀ ϕ 0 .
ges
ϕ ind (11.7.39)
q є 0 k E(k + q) − E(k) − ħω + ıħβ
2
Dieses neue Potenzial muss jetzt aber selbst wieder als Störung für die Elektronenverteilung
mitgerechnet werden. Um unsere Rechnung selbstkonsistent zu machen, müsste die ange-
nommene Störung ϕ ges den Beitrag ϕ ind schon enthalten haben, d. h. es muss
gelten, wobei ϕ ext (r, t) jetzt das tatsächliche äußere Potenzial ist, das wir in Gedanken an-
gelegt haben. Nehmen wir für dieses wiederum die Form
ıq⋅r −ı ωt −βt
ϕ ext (r, t) = ϕ ext
0 e e e + c. c. (11.7.41)
632 11 Dielektrische Eigenschaften
beziehungsweise
ϕ ext
ϕ0 =
ges 0
(11.7.43)
є(q, ω)
mit
e2 f 0 (k) − f 0 (k + q)
є(q, ω) = 1 + ∑ . (11.7.44)
q 2 є 0 k E(k + q) − E(k) − ħω + ıħβ
Diese Ausdrücke entsprechen den oben für den statischen Fall (ω = 0) erhaltenen Ergebnis-
sen (11.7.11) und (11.7.12). Wir sehen, dass wiederum das effektive Potenzial, das auf die
Elektronen wirkt, nicht das angelegte externe Potenzial ϕ ext
0 ist, sondern vielmehr das ange-
legte Potenzial dividiert durch die dielektrische Funktion є(q, ω), die von der Frequenz und
vom Wellenvektor der angelegten Störung abhängt. Dieses Ergebnis haben wir zunächst nur
für eine Fourier-Komponente abgeleitet. Da wir aber in den einzelnen Schritten die Glei-
chungen linearisiert haben, können wir die Wirkung verschiedener Fourier-Komponenten
einfach aufsummieren. Stellen wir ϕ ext (r, t) als Fourier-Integral
dar, dann können wir das effektive Potenzial, das ein Elektron spürt, angeben als
Dieser Ausdruck ist als Lindhardsche Näherung für die dielektrische Funktion bekannt. Wir
werden diese Näherung in den folgenden Abschnitten zur Beschreibung einiger physikali-
scher Phänomene benutzen.
Die Summation über k in(11.7.44) schreiben wir als Integral, wobei wir beachten müssen,
dass wir sowohl über die besetzten als auch die unbesetzten Zustände aufintegrieren müssen.
Für ω = 0 und β = 0 erhalten wir
e2 q ⋅ ∇k E(k) ∂ f0
є(q, 0) = 1 + 3
∫ d k Z(k) (− )
q2є0 q ⋅ ∇k E(k) ∂E
e2 D(E) ∂ f0
=1+ ∫ dE (− ). (11.7.49)
q2є0 V ∂E
Da wir (− ∂E0 ) ≃ δ(E − E F ) benutzen können, ergibt das Integral gerade die Zustandsdichte
∂f
D(E F )e 2 1 k s2 D(E F )e 2
є(q, 0) = 1 + = 1 + mit k s2 = . (11.7.50)
є0 V q2 q2 є0 V
Dieses Ergebnis entspricht gerade dem Ausdruck (11.7.21), den wir im Rahmen der linea-
risierten Thomas-Fermi Theorie abgeleitet haben. Die Lindhard-Beschreibung geht also im
langwelligen Grenzfall tatsächlich in die Thomas-Fermi-Beschreibung über.
Für T = 0 kann die Integration in
e2 d 3 k f 0 (k) − f 0 (k + q)
є(q, 0) = 1 + ∫ (11.7.51)
2
q є0 4π 3 q ⋅ ∇k E(k)
explizit ausgeführt werden und wir erhalten
e 2 D(E F ) 1 1 − x 2 1+x q
є(q, 0) = 1 + ⌊︀ + ln ⋀︀ ⋀︀}︀ mit x = . (11.7.52)
2
q є0 V 2 4x 1−x 2k F
Der Ausdruck in Klammern, der für x = 0 gleich eins wird, stellt gerade die Lindhard-
Korrektur zum Thomas-Fermi Ergebnis (11.7.21) dar.
є in Beziehung zu setzen zu der dielektrischen Funktion є el der Elektronen, є ion der Ionen
und є d der Ionen, die von einer Elektronenwolke abgeschirmt werden (dressed ions). Mit
der Beziehung (11.7.43)
ϕ ext
ϕ ges =
є(q, ω)
zwischen dem effektiv wirkenden Potenzial ϕ ges und dem von außen angelegten Potenzial V
können wir folgende Betrachtungsweisen machen:
1. Das Medium besteht nur aus Elektronen und die Ionen werden als externe Quellen be-
trachtet. In diesem Fall gilt
Hierbei kann ϕ ext + ϕ ion als effektives äußeres Potenzial betrachtet werden.
2. Das Medium besteht nur als Ionen und die Elektronen werden als externe Quellen be-
trachtet. In diesem Fall gilt
Addieren wir (11.7.54) und (11.7.55), so erhalten wir mit ϕ ges = ϕ ext ⇑є und unter Benut-
zung der Tatsache, dass ϕ ext + ϕ ion + ϕ el = ϕ ges , die Beziehung
є = є el + є ion − 1 . (11.7.56)
3. Das Medium besteht aus abgeschirmten Ionen, die nicht das äußere Potenzial sehen, son-
dern das durch die Elektronen abgeschirmte äußere Potenzial. Hier gilt
ϕ ext
є d ϕ ges = . (11.7.57)
є el
Das heißt, die Antwort eines Metalls auf ϕ ext kann als die Antwort von abgeschirmten
Ionen auf das Potenzial ϕ ext ⇑є el betrachtet werden. Mit є = ϕ ext ⇑ϕ ges folgt
1 1 1
= . (11.7.58)
є є d є el
Da (11.7.56) und (11.7.58) natürlich äquivalent sein müssen, folgt
1
єd = 1 + (є ion − 1) . (11.7.59)
є el
Wir benutzen nun wiederum Näherungen, um für einige Grenzfälle Abschätzungen machen
zu können. Als erstes berücksichtigen wir, dass in Metallen die Schallgeschwindigkeit v s
klein gegenüber der Fermi-Geschwindigkeit v F ist und die Elektronen deshalb der Bewe-
gung der Ionen quasi-instantan folgen können. Wir können deshalb für die Elektronen die
statische dielektrische Funktion
k s2
є el (q, 0) = 1 + (11.7.60)
q2
11.7 Elektron-Elektron-Wechselwirkung und Abschirmung in Metallen 635
verwenden. Für die Ionen können wir, vorausgesetzt dass sie sich unabhängig voneinander
bewegen, die Näherung
Ω 2p n(Ze)2
є ion (0, ω) = 1 − mit Ω 2p = (11.7.61)
ω2 є0 M
benutzen, wobei die Plasmafrequenz jetzt durch die schwerere Ionenmasse M und die La-
dungszahl Z der Ionen bestimmt wird. Wir erhalten somit für die gesamte dielektrische
Funktion
Ω 2p k s2
є(q, ω) = є el (q, 0) + є ion (0, ω) − 1 = 1 − + (11.7.62)
ω2 q2
1 ⎛ 1 ⎞⎛ ω2 ⎞
=⎜ ⎟ . (11.7.64)
k 2 ̃
є(q, ω) ⎝ 1 + s2 ⎠ ⎝ ω − Ω p (q) ⎠
2
2
q
Grenzfall hoher Frequenzen: Es gibt noch eine weitere Nullstelle der Funktion є(q, ω)
von positiven Ionen, die in einen Elektronensee eingebettet sind. Für hohe Frequenzen, die
allerdings immer noch genügend weit unterhalb der Plasmafrequenz liegen, können wir den
elektronischen Beitrag mit є el (ω, 0) ≃ 1 − ω 2p ⇑ω 2 annähern und wir erhalten
Ω 2p ω 2p
є(0, ω) = 1 − − . (11.7.67)
ω2 ω2
Dieser Ausdruck besitzt eine Nullstelle für
ne 2 ∗
ω2 = = ω 2p , (11.7.68)
є0 µ
wobei 1⇑µ = 1⇑M + 1⇑m und ω p ∗ die Plasmafrequenz des Elektronengases ist, allerdings mit
der reduzierten Masse µ aufgrund der Mitbewegung der Ionen.
Q Q ⎛ ̃ 2 (q) ⎞
Ω
ϕ ges (q, ω) = = +
p
1 . (11.7.70)
є(q, ω)є 0 q 2 є 0 (k s2 + q 2 ) ⎝ ̃ 2p (q) ⎠
ω2 − Ω
̃ 2 (q)⇑(ω 2 − Ω
Die Auswirkung der Ionen ist also durch den Korrekturterm Ω ̃ 2 (q)) gegeben,
der von der Frequenz und vom Wellenvektor abhängt. Die Frequenzabhängigkeit folgt dabei
aus der langsamen Reaktion der trägen Ionen. Wir sprechen von einer retardierten Wech-
selwirkung. Wir können folgende Fälle unterscheiden:
11.7.4 Polaronen
In vielen überwiegend kovalent gebundenen Materialien können Elektronen und Löcher in
sehr guter Näherung dadurch beschrieben werden, dass sie sich durch einen Kristall bewe-
gen, dessen Atome an einem festen Ort eingefroren sind. Natürlich streuen sie an Phono-
nen, aber falls diese bei tiefen Temperaturen ausgefroren werden, wird üblicherweise jegli-
che Auslenkung der Ionenrümpfe vernachlässigt. Diese Beschreibung ist für ionische oder
stark polare Festkörper (z.B. II-VI-Halbleiter, Oxide, Alkali-Halogenide) unzureichend, bei
denen die Coulomb-Wechselwirkung zwischen den Leitungselektronen und den Gitterio-
nen zu einer starken Elektron-Phonon-Wechselwirkung führt. Diese führt dazu, dass selbst
bei Abwesenheit von realen Phononen ein Elektron immer von einer lokalen strukturel-
len Verzerrung umgeben ist, die wir als Wolke virtueller Phononen auffassen können. Das
heißt, Elektronen erzeugen bei ihrer Bewegung durch das Kristallgitter in ihrer Umgebung
eine endliche elektrische Polarisation und strukturelle Verzerrung. Benachbarte Elektronen
werden wegen ihrer gleichnamigen Ladung abgestoßen, während die positiven Atomrümp-
fe angezogen werden. Die ein Elektron umgebende Polarisations- und Phononenwolke be-
wegt sich zusammen mit dem Elektron und führt damit zu einer Erhöhung dessen effektiver
Masse. Das neue Quasiteilchen, das aus Elektron und der es umgebenden Polarisationswol-
ke besteht, bezeichnen wir als Polaron. Streng genommen sollten wir von einem Ladungs-
polaron sprechen, da es auch Quasiteilchen gibt, bei denen ein Elektron von einer Spin-
Polarisationswolke oder einer orbitalen Polarisationswolke umgeben ist. Wir sprechen dann
von Spin-Polaronen oder orbitalen Polaronen. In manchen Fällen treten auch Mischungen
dieser Polaronen auf. Wir weisen hier darauf hin, dass Polaronen fermionische Quasiteilchen
sind und nicht mit Polaritonen verwechselt werden sollten. Letztere sind als hybridisierte
Zustände von Photonen und optischen Phononen bosonische Quasiteilchen.
Das Konzept des Polarons wurde bereits 1933 von Lev Landau eingeführt,48 um die Bewe-
gung eines Elektrons in einem dielektrischen Kristall zu beschreiben, in dem sich die Atom-
rümpfe aus ihren Gleichgewichtspositionen bewegen, um die Ladung des Elektrons abzu-
schirmen. Dieses Konzept wurde dann erweitert, um andere Wechselwirkungen zwischen
Elektronen und Ionen in Metallen zu beschreiben, die zu gebundenen Zuständen oder einer
Absenkung der Energie im Vergleich zu einem nicht-wechselwirkenden System führen.49 , 50
Da Polaronen für das Verständnis zahlreicher Materialeigenschaften, wie z.B. der Ladungs-
trägerbeweglichkeit in Halbleitern oder der optischen Leitfähigkeit von polaren Materialien
wichtig sind, stellen sie bis heute ein wichtiges Forschungsthema dar.51 So genannte Bipo-
laronen, die aus zwei Elektronen mit entgegengesetztem Spin und einer gemeinsamen Pho-
nonenwolke bestehen, wurden als mögliche Kandidaten für die Erklärung der Supraleitung
in den Kupratsupraleitern diskutiert.52 Bipolaronen sind ähnlich zu Cooper-Paaren in der
48
L. D. Landau, Über die Bewegung der Elektronen im Kristallgitter, Phys. Z. Sowjetunion 3, 644-645
(1933).
49
H. Fröhlich, H. Pelzer, S. Zienau, Properties of Slow Electrons in Polar Materials, Phil. Mag. 41,
221-242 (1950).
50
H. Fröhlich, Electrons in Lattice Fields, Adv. Phys. 3, 325 (1954).
51
J. T. Devreese, A. S. Alexandrov, Fröhlich Polaron and Bipolaron: Recent Developments, Rep. Prog.
Phys. 72, 066501 (2009).
52
A. S. Alexandrov, N. Mott, Polarons and Bipolarons, World Scientific, Singapore (1996).
638 11 Dielektrische Eigenschaften
BCS-Theorie (vergleiche Kapitel 13) hinsichtlich der Tatsache, dass in beiden Fällen zwei
Elektronen durch den Austausch virtueller Phononen einen Bindungszustand eingehen. In
der BCS-Theorie findet diese Paarung allerdings im k-Raum, bei den Bipolaronen dagegen
im Ortsraum statt.
Bei der Klassifizierung von Polaronen unterscheiden wir zwischen kleinen und großen Po-
laronen. In Materialien, in denen der Radius eines Polarons wesentlich größer als die Git-
terkonstante ist, sprechen wir von großen Polaronen. Sie werden häufig auch als Fröhlich-
Polaronen bezeichnet. In einem Polaron sitzt das Elektron in einer Potenzialmulde, die durch
die Verschiebung der es umgebenden Ionen gebildet wird. In einigen Materialien ist Form
und Tiefe dieser Potenzialmulde so ausgebildet, dass das Elektron in einem sehr kleinen Vo-
lumen, das in etwa nur einer Gitterzelle entspricht, eingefangen ist. Wir sprechen in diesem
Fall von kleinen Polaronen. Eine schematische Darstellung von großen und kleinen Polaro-
nen ist in Abb. 11.25 gezeigt.
Zur Beschreibung von großen Polaronen wurde von Fröhlich folgender Hamilton-Operator
vorgeschlagen:
ℋ = ∑ ε k c k,σ
†
c k,σ + ∑ ħΩ q,r b†q,r b q,r
k,σ q,r
)︁⌊︂⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂]︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ )︂ )︁⌊︂⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ]︂⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ )︂
ℋel ℋph
Dabei wird angenommen, dass die Elektronenwellenfunktion über viele Ionen ausgedehnt
ist, welche alle leicht aus ihrer Gleichgewichtsposition ausgelenkt sind. Wir sehen, dass der
†
Hamilton-Operator aus der kinetischen Energie der Elektronen besteht (die Operatoren c k,σ
bzw. c k,σ erzeugen bzw. vernichten ein Elektron mit Energie ε k und Spin σ, der Operator
†
c k,σ c k,σ ist der Teilchenzahloperator), der Energie des Phononensystems und einem Wech-
selwirkungsterm besteht. Die Energie des Phononensystems erhalten wir durch Aufsum-
mieren über alle Wellenvektoren q und Polarisationen r (die Operatoren b†q,r bzw. b q,r er-
zeugen bzw. vernichten ein Phonon mit Energie ħΩ q,r und Polarisation r). Der Wechselwir-
kungsterm enthält Beiträge, bei denen ein Phonon mit Energie ħΩ q,r , Wellenvektor q und
Polarisation r erzeugt und ein Elektron vom Zustand k in den Zustand k − q gestreut wird
†
(∝ c k−q,σ c k,σ b†q,r ) bzw. bei denen ein Phonon mit Energie ħΩ q,r , Wellenvektor q und Pola-
risation r vernichtet und ein Elektron vom Zustand k − q in den Zustand k gestreut wird
(a) + + (b) + + +
+
+ + + +
e– e–
+ + + + + +
+ + + +
Abb. 11.25: Schematische
Darstellung von (a) großen
und (b) kleinen Polaronen. + + + + + +
11.7 Elektron-Elektron-Wechselwirkung und Abschirmung in Metallen 639
†
(∝ c k,σ c k−q,σ b q,r ). Die exakte Form der Größe γ hängt vom Material und den beteiligten
Phononen ab. Die Stärke der Elektron-Phonon-Wechselwirkung wird durch den von Fröh-
lich eingeführten dimensionslosen Parameter α beschrieben (siehe Tabelle 11.5). Er beträgt
etwa zweimal die Zahl der Phononen in der ein Elektron umgebenden Phononenwolke. Wir
erwarten deshalb, dass polaronische Effekte signifikant werden, wenn α in der Größenord-
nung von eins oder größer ist.
Die effektive Masse eines Polarons ist größer als die Bandmasse m b eines Elektrons, da das
Elektron ja zusätzlich die Gitterverzerrung bzw. die es umgebende Phononenwolke mit-
schleppen muss. Es gibt leider keine genauen Formeln für die Beschreibung des Massenzu-
wachses. Nach einer von Richard Feynman entwickelten Näherung können wir die effektive
Masse von großen Polaron schreiben als53 , 54
α
m⋆ ≃ m b (1 + + 0.025α 2 ) für α ≪ 1 (11.7.72)
6
m⋆ ≃ m b (1 + 0.02α 4 ) für α ≫ 1 (11.7.73)
Die theoretische Analyse von kleinen Polaronen benötigt ab initio Rechnungen, welche die
Bewegung jedes einzelnen Atoms in der unmittelbaren Umgebung des Elektrons berücksich-
tigen. Wir wollen darauf hier nicht näher eingehen. Die Bewegung von kleinen Polaronen
kann meist durch ein thermisch aktiviertes Verhalten mit einer Beweglichkeit
1 Wpol
µ(T) ∝ exp (− ) (11.7.74)
T 2k B T
beschrieben werden, die einer Arrhenius-artigen Temperaturabhängigkeit folgt. Hierbei ist
Wpol die Bindungsenergie des Polarons. Durch Energieaufnahme aus dem Wärmebad, ei-
nem äußeren Strahlungsfeld oder durch eine angeschlossene Spannungsquelle können die
kleinen Polaronen aus ihrer lokalen Potenzialmulde in eine benachbarte hüpfen. Aufein-
anderfolgende Hüpfprozesse sind üblicherweise unkorreliert, d.h. der Transfer von kleinen
Polaronen zwischen Gitterplätzen ist inkohärent und folgt dem durch (11.7.74) beschriebe-
nen aktivierten Verhalten. Prinzipiell ist bei sehr tiefen Temperaturen auch eine kohärente
Bewegung von kleinen Polaronen durch quantenmechanisches Tunneln möglich. Sie ist al-
lerdings sehr langsam und aufgrund von Unordnungeffekten unterdrückt.
53
R. P. Feynman, Slow Electrons in a Polar Crystal, Phys. Rev. 97, 660-665 (1955).
54
J. T. Devreese, Polarons, in Digital Encyclopedia of Applied Physics, edited by G. L. Trigg (Wiley,
online, 2008).
640 11 Dielektrische Eigenschaften
Da für ein einfaches kubisches Gitter n = 1⇑a 3 , erhalten wir hier einen kritischen Ab-
stand a c = 2.78a B . Wird dieser Abstand überschritten, so werden die Leitungselektronen
im abgeschirmten Coulomb-Potenzial gebunden und wir erhalten einen Isolator. Für a < a c
sind dagegen gebundene Zustände nicht möglich. Die Elektronen sind delokalisiert und wir
erhalten ein Metall. Das heißt, wir erhalten bei a = a c einen Metall-Isolator-Übergang.56 , 57
Der Metall-Isolator-Übergang kann experimentell beobachtet werden, wenn ein Halblei-
ter immer stärker dotiert wird. Für mit P dotiertes Si wurde ein Metall-Isolator-Übergang
55
F. J. Rogers, H. C. Graboske, D. J. Harwood, Bound Eigenstates of the Static Screened Coulomb Po-
tential, Phys. Rev. A 1, 1577 (1970).
56
Von N. F. Mott wurde bereits früh ein Metall-Isolator-Übergang für a = 4.5 a B vorhergesagt
(N. F. Mott, Proc. Roy. Soc. London A 382, 1 (1980); siehe auch Metal-Insulator Transitions, Taylor
& Francis, Bristol, 2. Auflage (1990)).
57
P. P. Edwards, C. N. R. Rao (Hrsg.), Metal-Insulator Transitions Revised, Taylor & Francis, Bristol
(1995).
11.7 Elektron-Elektron-Wechselwirkung und Abschirmung in Metallen 641
bei einer kritischen Konzentration n c = 3.74 × 1018 cm−3 beobachtet.58 Nehmen wir für den
Radius des Grundzustands des Donators in Si den Wert a B = 3.2 × 10−7 cm an (vergleiche
Abschnitt 10.1.3), so ergibt das Kriterium (11.7.77) den Wert a c = 1.44 × 10−6 cm. Für ih-
re Dichte ergibt sich dann (wir nehmen der Einfachheit halber ein kubisches Gitter an)
n c ≃ 1⇑a c3 = 0.33 × 1018 cm−3 . Dieser Wert liegt zwar beträchtlich niedriger als der experi-
mentell beobachtete Wert, unsere größenordnungsmäßige Abschätzung lässt aber eine bes-
sere Übereinstimmung auch nicht erwarten.
11.7.6 Elektron-Elektron-Wechselwirkung
und Theorie der Fermi-Flüssigkeit
Die oben gemachte Betrachtung zur Dielektrizitätskonstante eines Metalls ist nur eine grobe
Näherung der realen Situation. Ein wesentlicher Schritt der in Abschnitt 11.7.2 gemachten
Diskussion war die Annahme, dass die verschiedenen Fourier-Koeffizienten des Potenzials
alle unabhängig voneinander sind. Dieses Vorgehen wird auch als Random Phase Approxi-
mation bezeichnet, da zwischen den einzelnen Fourier-Komponenten keine Phasen-Korre-
lationen bestehen. Diese Grundannahme steckt meist auch in tiefergehenden Betrachtun-
gen, auf die wir hier nicht eingehen wollen.
Unsere Überlegungen haben gezeigt, dass die langreichweitige Coulomb-Wechselwirkung
zwischen den Leitungselektronen in Metallen zu einer abgeschirmten Wechselwirkung ab-
geschwächt wird. Die Elektronen bilden aber nicht nur Ladungswolken um Fremdatome und
schirmen deren Feld in großer Entfernung ab, sondern auch um sich selbst. Jedes Elektron
führt sozusagen eine eigene Ladungswolke mit sich. Diese ist positiv, da ein Elektron ef-
fektiv andere Elektronen aus seiner unmittelbaren Umgebung wegdrängt (vergleiche hierzu
Abschnitt 12.5.6.1, wo eine Diskussion unter Berücksichtigung des Spins geführt wird). Für
die Beschreibung des Elektrons mit umgebender Lochwolke ist natürlich eine komplizierte
Wellenfunktion notwendig. Allerdings zeigt sich, dass sich das Gesamtgebilde aus Elektron
und Ladungswolke wie ein Teilchen mit Ladung e verhält und der Einfluss der mitgeführten
Ladungswolke (also die Wechselwirkung mit allen anderen Elektronen) durch eine effektive
Masse m∗ berücksichtigt werden kann. Die Tatsache, dass das Elektron die positiv geladene
Ladungswolke mitschleppen muss, führt zu einer Erhöhung der effektiven Masse eines Elek-
trons, die für Alkali-Metalle typischerweise etwa 25% beträgt. Die Auswirkungen der Elek-
tron-Elektron-Wechselwirkung werden üblicherweise im Rahmen der Landau-Theorie der
Fermi-Flüssigkeiten59 , 60 , 61 beschrieben. Das Ziel dieser Theorie ist, den Wechselwirkungen
im Elektronensystem Rechnung zu tragen. Wir bezeichnen allgemein ein Gas nicht-wech-
selwirkender Fermionen als Fermi-Gas und ein System aus wechselwirkenden Fermionen
als Fermi-Flüssigkeit.
58
T. F. Rosenbaum, R. F. Milligan, M. A. Paalanen, G. A. Thomas, R. N. Bhatt, Metal-insulator transi-
tion in a doped semiconductor, Phys. Rev. B 27, 7509–7523 (1983).
59
L. Landau, Theory of Fermi-Liquids, Sov. Phys. JETP 3, 920 (1957).
60
L. Landau, Oscillations in a Fermi-Liquid, Sov. Phys. JETP 5, 101 (1957).
61
L. Landau, On the Theory of the Fermi-Liquid, Sov. Phys. JETP 8, 70 (1959).
642 11 Dielektrische Eigenschaften
Die Tatsache, dass wir ein System von wechselwirkenden Elektronen als ein System nicht-
wechselwirkender Fermionen betrachten können, wurde von Lev Landau62 im Wesentli-
chen mit zwei Argumenten begründet. Wir können diese verstehen, wenn wir überlegen,
was mit einem nichtwechselwirkenden Elektronesystem passiert, wenn wir die Wechselwir-
kung langsam einschalten:
Ein Problem mit unserer bisherigen Argumentation ist, dass wir nicht wissen, was wir bei
einer starken Elektron-Elektron-Wechselwirkung tun sollen, wenn die bisherigen Argumen-
te nicht mehr anwendbar sind. Landau erweiterte deshalb die obige Argumentation um ein
subtiles Argument. Er erkannte 1957, dass das Bild der völlig wechselwirkungsfreien Elektro-
nen nicht der richtige Startpunkt ist. Ein adäquater Startpunkt müsste vielmehr ein System
von nichtwechselwirkenden „Quasielektronen“ sein. Er argumentierte, dass wechselwirken-
de Fermionen durch Renormierung wie ein freies Elektronengas behandelt werden können:
es gibt eine genaue Korrespondenz zwischen den Quasielektronen des korrelierten Elek-
tronensystems und den Anregungen des nicht-wechselwirkenden Elektronengases.63 Die
Wechselwirkung wird bei der Renormierung mit einer effektiven Masse m∗ beschrieben.
Die Landau-Theorie beschreibt in der Tat sehr gut die tiefliegenden Einteilchenanregungen
eines Systems wechselwirkender Elektronen. Diese Einteilchenanregungen bezeichnen wir
als Quasiteilchen. Diese Quasiteilchen sind sehr stabil, wenn sie nahe der Fermi-Energie
liegen. Sie laufen jedoch auseinander und sind gedämpft, wenn sie sich weit weg von der
Fermi-Energie befinden.
62
Lev Davidovich Landau, siehe Kasten auf Seite 466.
63
D. Pines, P. Nozières, Theory of Quantum Liquids, Benjamin, New York (1966).
11.8 Ferroelektrizität 643
11.8 Ferroelektrizität
Dielektrische und paraelektrische Substanzen besitzen ohne ein von außen wirkendes elek-
trisches Feld keine elektrische Polarisation. Es gibt aber auch eine Substanzklasse, bei der
sich unterhalb einer bestimmten Temperatur TC , die wir Curie-Temperatur nennen, ohne
äußeres elektrisches Feld eine spontane elektrische Polarisation Ps einstellt. Oberhalb die-
ser Temperatur verhalten sich die Materialien paraelektrisch. Üblicherweise kann die Rich-
tung der spontanen Polarisation mit einem angelegten elektrischen Feld umgepolt werden,
ähnlich wie die Magnetisierung eines Ferromagneten mit einem äußeren Magnetfeld umge-
schaltet werden kann. Wir nennen diese Materialien dann ferroelektrisch.64 Allerdings gibt
es, anders als bei magnetischen Materialien, auch Substanzen wie z. B. LiNbO3 oder LiTaO3 ,
bei denen das Schaltfeld höher als das elektrische Feld ist, das zu einem elektrischen Durch-
bruch führt. Diese Materialien bezeichnen wir als pyroelektrisch,65 da wir ihre Polarisation
nur durch Erhöhen der Temperatur ändern können. Sie besitzen zwar eine spontane Polari-
sation wie ferroelektrische Materialien, werden aber wegen der fehlenden Umschaltbarkeit
mit elektrischen Feldern nicht zu der Materialklasse der Ferroelektrika gezählt. In Analogie
zu magnetischen Materialien gibt es auch ferrielektrische und antiferroelektrische Substan-
zen (siehe Abb. 11.26). Die antiferroelektrische Ordnung zeichnet sich durch die Überlage-
rung mehrerer Teilgitter von geordneten elektrischen Dipolen aus, die eine gleich starke, aber
entgegengesetzte elektrische Polarisation aufweisen, so dass die makroskopische Gesamtpo-
larisation Ps null ist. Jedes Antiferroelektrikum besitzt eine Curie-Temperatur TC , oberhalb
derer beide Teilgitter unpolarisiert und völlig gleichwertig sind. Beispiele sind Ammonium-
dihydrogenphosphat (ADP) oder einige Perowskite wie Bleizirkonat (PbZrO3 ), Natriumnio-
bat oder Bleihafnat. Wenn sich die antiparallelen Dipolmomente der Teilgitter nicht völlig
aufheben, resultiert eine endliche Polarisation. In diesem Fall sprechen wir von Ferrielektri-
zität.
Eine spontane Polarisation kann nur dann auftreten, wenn die Kristallstruktur eine pola-
re Achse besitzt. Voraussetzung für die Existenz einer polaren Achse ist das Fehlen einer
strukturellen Inversionssymmetrie der zugrundeliegenden Kristallstruktur. Als polare Ach-
se bezeichnen wir eine Achse, deren beide Enden nicht vertauschbar sind. Das bedeutet,
(a) (b)
Abb. 11.26: Ferroelektrische (a) und
antiferroelektrische Ordnung (b)
in zwei Dimensionen anhand einer
Perowskitstruktur. Die unterschiedlich
farbigen Ionen sind positiv und nega-
tiv geladen, so dass ihre gegenseitige
Verschiebung in einer Polarisation re-
sultiert. Die getönten Vierecke zeigen
die jeweiligen Einheitszellen.
64
M. Lines, A. Glass, Principles and applications of ferroelectrics and related materials, Clarendon
Press, Oxford (1979).
65
J. C. Joshi, A. L. Dawar, Pyroelectric Materials, Their Properties and Applications, phys. stat. sol. (a)
70, 353 (1982).
644 11 Dielektrische Eigenschaften
Ti4+ Ti4+
c
b
a
Abb. 11.27: Kristallstruktur von Bariumtitanat: (a) Oberhalb der Curie-Temperatur von etwa 120○ C
liegt BaTiO3 in einer kubischen Kristallstruktur vor. Das Kristallgitter besitzt Inversionssymmetrie und
der positive und negative Ladungsschwerpunkt fallen zusammen. (b) Unterhalb der Curie-Tempera-
tur liegt eine tetragonale Kristallstruktur mit einer leicht elongierten c-Achse vor. Die positiv gelade-
nen Ba2+ und Ti4+ Ionen sind leicht nach oben, die negativ geladenen O2− Ionen leicht nach unten
verschoben, so dass eine spontane Polarisation in c-Achsenrichtung entsteht. Die verzerrte Struktur
besitzt keine Inversionssymmetrie mehr.
dass sich die Kristallstruktur durch eine 180○ -Drehung des Kristallkörpers um irgendeine
zur polaren Achse senkrechte Achse nicht mit sich selbst zur Deckung bringen lässt. Bei
dem in Abb. 11.27 gezeigten BaTiO3 verläuft die polare Achse in c-Achsenrichtung paral-
lel zu der Verschiebung der Ionen. Insgesamt gibt es 20 Kristallklassen, die mindestens eine
polare Achse besitzen.
Ein anschauliches Beispiel für ein System mit drei um 120○ gegeneinander gedrehten po-
laren Achsen ist in Abb. 11.28 gezeigt. In Systemen mit mehr als einer polaren Achse tritt
keine spontane Polarisation auf. Wir erkennen aber sofort, dass bei einer Krafteinwirkung
entlang einer polaren Achse die Schwerpunkte der negativen und positiven Ladungen ge-
geneinander verschoben werden und damit eine endliche Polarisation induziert wird. Wir
bezeichnen Materialien, die keine spontane Polarisation besitzen, in denen eine solche aber
durch eine mechanische Verformung erzeugt werden kann, als piezoelektrisch66 (von grie-
chisch πιєζєιν: drücken, pressen). Das heißt, besitzt eine Substanz mehrere polare Achsen,
so ist sie nicht ferroelektrisch, sondern lediglich piezoelektrisch (siehe Abb. 11.28). Wir wei-
sen darauf hin, dass natürlich alle ferroelektrischen Materialien auch piezoelektrisch sind,
umgekehrt gilt das aber nicht.
𝑭
66
D. Damjanovic, Ferroelectric, dielectric and piezoelectric properties of ferroelectric thin films and ce-
ramics, Rep. Prog. Phys. 61, 1267–1324 (1998).
70
11.8 Ferroelektrizität 645
rhomboedrisch
4.03 a=b=c
a Abb. 11.29: Gitterkonstanten von
b Bariumtitanat als Funktion der Tem-
c
Gitterkonstante (Å)
Wie Abb. 11.27 zeigt, kommt bei BaTiO3 die gebrochene Inversionssymmetrie durch einen
Phasenübergang von einer kubischen in eine tetragonale Kristallstuktur bei etwa 120 ○ C
zustande. Die positiv geladenen Ba2+ und Ti4+ Ionen sind gegen die negativ geladenen
O2− Ionen um etwa 0.1 Å verschoben, wodurch eine spontane Polarisation Ps ≃ 20 µC⇑cm2
in c-Achsenrichtung entsteht.
Aufgrund der Namensgebung (dielektrisch, paraelektrisch, ferroelektrisch) ist man geneigt,
eine große phänomenologische Ähnlichkeit zwischen ferromagnetischen und ferroelektri-
schen Materialien zu vermuten. In diesem Fall könnte die Beschreibung von Ferroelektri-
ka auf diejenige von Ferromagnetika und umgekehrt zurückgeführt werden. Wir müssten
nur die permanenten magnetischen durch elektrische Dipole sowie die Größen Magnetisie-
rung und Magnetfeld durch Polarisation und elektrisches Feld ersetzen. Leider kann diese
Analogie nicht zu weit getrieben werden, da den Phänomenen Ferroelektrizität und Ferro-
magnetismus letztendlich doch sehr unterschiedliche physikalische Mechanismen zugrunde
liegen. Insbesondere zeigt der Phasenübergang von der paraelektrischen in die ferroelektri-
sche Phase ein weitaus reichhaltigeres Verhalten. Während der Übergang in die ferromagne-
tische Phase ein Phasenübergang 2. Ordnung ist, kann der Übergang in die ferroelektrische
Phase sowohl 1. als auch 2. Ordnung sein. Ferner sind die Phasenübergänge in die ferro-
elektrische Phase meist mit strukturellen Phasenübergängen verbunden. Als Beispiel dafür
ist in Abb. 11.29 wiederum BaTiO3 gezeigt. Der Übergang von der paraelelektrischen in die
ferroelektrische Phase bei 393 K ist mit einem strukturellen Phasenübergang von der ku-
bischen in die tetragonale Phase verbunden, bei dem die a- und b-Achse kürzer und die
c-Achse länger wird. Dabei handelt es sich um einen Phasenübergang 1. Ordnung, bei dem
die Polarisation an der Übergangstemperatur von null auf einen endlichen Wert springt.
Ferner tritt beim Durchfahren des Phasenübergangs in unterschiedliche Temperaturrich-
tungen Hysterese auf. Bei tieferen Temperaturen werden weitere Phasenübergänge in eine
orthorhombische und schließlich rhomboedrische Phase beobachtet. Diese sind mit Rich-
tungsänderungen der polaren Achse verbunden. Die Curie-Temperaturen und die spontane
Polarisation sind für einige ferroelektrische Materialien in Tabelle 11.6 zusammengefasst.
646 11 Dielektrische Eigenschaften
67
Bei theoretischen Beschreibungen von Phasenübergängen spielt die Landau- oder auch Mean-
Field-Theorie eine wichtige Rolle. Dabei werden jedoch kritische thermische Fluktuationen ver-
nachlässigt, die in der Umgebung des Übergangs eine wesentliche Rolle spielen können. Die
Landau-Theorie vermittelt trotzdem als Ausgangspunkt genauerer Theorien wertvolle erste Ein-
sichten. Dies ist insbesondere von Kenneth G. Wilson erkannt worden, der 1982 den Nobelpreis
für bahnbrechende Arbeiten über kontinuierliche Phasenübergänge erhielt. Wilson ist einer der
entscheidenden Pioniere der Renormierungsgruppentheorie, die berücksichtigt, dass bei kontinu-
ierlichen Phasenübergängen die kritischen Fluktuationen auf vielen Längenskalen in selbstähnli-
cher Form stattfinden.
68
W. Gebhardt, U. Krey, Phasenübergänge und kritische Phänomene - Eine Einführung, Vieweg (1980).
69
L. D. Landau, E. M. Lifschitz, Lehrbuch der theoretischen Physik V. Statistische Physik, Akademie
Verlag, Berlin (1970).
70
Eine detaillierte Beschreibung der thermodynamischen Eigenschaften von Festkörpern kann in
Anhang G gefunden werden.
71
Prozesse mit dV = 0 sind experimentell oft schwierig zu realisieren. Deshalb ist es manchmal
zweckmäßiger, die freie Enthalpie (auch Gibbs-Potenzial genannt)
𝒢 = U − T S + pV − V Ps ⋅ E
zu betrachten, deren totales Differential gegeben ist durch
d𝒢 = dU − SdT − TdS + pdV + Vd p − V Ps ⋅ dE − V E ⋅ dPs = −SdT + Vd p − V Ps ⋅ dE .
Betrachten wir jetzt einen Prozess, der bei konstanter Temperatur und konstantem Druck abläuft,
2
𝒢
was experimentell leichter zu realisieren ist, so ist Ps,i = − V1 ( ∂E
∂𝒢
) und χ i j = − є 01V ( ∂E∂ ∂E ) .
i p,T i j p,T
Wir werden im Folgenden trotzdem die freie Energie benutzen.
11.8 Ferroelektrizität 647
1 ∂ℱ
Ps,i = − ( ) (11.8.2)
V ∂E i V ,T
1 ∂Ps,i 1 ∂2 ℱ
χi j = ( ) =− ( ) . (11.8.3)
є 0 ∂E j V ,T є 0 V ∂E i ∂E j V ,T
Da in der Nähe des Phasenübergangs der Ordnungsparameter Ps klein ist, können wir die
freie Energiedichte f = ℱ⇑V in eine Potenzreihe des Ordnungsparameters Ps entwickeln:
Hierbei treten aus Symmetriegründen für Kristalle, die im unpolarisierten Zustand ein In-
versionszentrum besitzen, keine ungeraden Potenzen von Ps auf. Auf Systeme, für die auch
ungerade Potenzen wichtig sind, wollen wir hier nicht eingehen.
Der thermische Gleichgewichtswert von Ps ist durch das Minimum von f(Ps ) gegeben. Der
Wert von f an diesem Minimum entspricht der Helmholtzschen freien Energiedichte. Die
Gleichgewichtspolarisation in einem elektrischen Feld E muss also die Bedingung
∂f
⋀︀ = 0 = −E + a 2 Ps + a 4 Ps3 + a 6 Ps5 + . . . . (11.8.5)
∂Ps T,E=const
erfüllen. Wir nehmen im Folgenden an, dass die betrachtete Probe ein langer Stab ist und
das elektrische Feld parallel zu diesem Stab angelegt ist. Dann müssen wir keine Depolari-
sationseffekte berücksichtigen.
Um einen ferroelektrischen Zustand mit endlicher spontaner Polarisation zu erhalten, müs-
sen wir annehmen, dass der Koeffizient a 2 bei einer endlichen Temperatur T0 sein Vorzei-
chen wechselt:
a 2 = γ(T − T0 ) . (11.8.6)
Hierbei ist γ eine positive Konstante und T0 ist kleiner oder gleich der Übergangstempera-
tur. Ein negativer Wert von a 2 bedeutet, dass das unpolarisierte Gitter instabil ist. Die physi-
kalische Ursache für die angenommene Temperaturabhängigkeit kann z. B. die thermische
Ausdehnung des Kristallgitters oder andere anharmonische Effekte sein.
Thermodynamisch unterscheiden wir nach der Ehrenfest-Klassifikation Phasenübergänge
erster und höherer Ordnung. Bei einem Phasenübergang 1. Ordnung ändern sich die ersten
Ableitungen der thermodynamischen Potenziale (z. B. nach Temperatur, elektrischem Feld,
Druck) am Punkt des Phasenübergangs sprunghaft. Für unseren Fall des Übergangs von ei-
ner paraelektrischen in eine ferroelektrische Phase bedeutet dies, dass die Ableitung dℱ⇑dE
unstetig ist, sich also die spontane Polarisation Ps am Punkt des Phasenübergangs sprunghaft
648 11 Dielektrische Eigenschaften
ändert. Allgemein ändern sich bei einem Phasenübergang n-ter Ordnung die n-ten Ablei-
tungen der thermodynamischen Potenziale sprunghaft, während alle (n − 1)-ten Ableitun-
gen am Umwandlungspunkt stetig sind. Wiederum auf unseren Fall übertragen bedeutet
dies, dass zum Beispiel bei einem Phasenübergang 2. Ordnung die 1. Ableitung der freien
Energie nach dem elektrischen Feld stetig ist, sich also die spontane Polarisation am Um-
wandlungspunkt kontinuierlich ändert. Dagegen zeigt die 2. Ableitung, also die elektrische
Suszeptibilität einen Sprung.
Diese Gleichung können wir entweder mit Ps = 0 oder Ps2 = (γ⇑a 4 )(T0 − T) erfüllen. Da
sowohl γ als auch a 4 positiv sind, ist für T ≥ T0 die einzig mögliche reelle Lösung Ps = 0.
Wir können deshalb T0 mit der Curie-Temperatur TC identifizieren. Für T < T0 erhalten
wir die Lösung
}︂
γ ⌈︂
⋃︀Ps ⋃︀ = T0 − T . (11.8.8)
a4
Wir nennen den Phasenübergang einen Phasenübergang 2. Ordnung, da die Polarisation für
T → TC kontinuierlich gegen null geht. Bei einem Phasenübergang 1. Ordnung tritt dagegen
ein Sprung auf.
Als weitere Randbedingung muss die freie Energie des paraelektrischen und ferroelektri-
schen Zustandes für T = TC gleich groß sein. Das bedeutet, dass der Wert von ℱ für Ps = 0
und der Wert des Minimums von ℱ, das durch (11.8.10) festgelegt ist, gleich sein müssen.
Um dies zu veranschaulichen, ist in Abb. 11.30 der Verlauf der freien Energie als Funktion
des Ordnungsparameters Ps für mehrere Temperaturen gezeigt. Für T > TC liegt das globale
Minimum bei Ps = 0, für T = TC besitzt ℱ für Ps = 0 und einen endlichen Wert von Ps den-
selben Wert. Schließlich liegt für T < TC das globale Minimum bei endlichem Ps . Kühlt man
das System ab, so springt bei T = TC der Ordnungsparameter Ps von null auf einen endlichen
Wert. Bei weiterer Abkühlung steigt dann Ps noch weiter an, da sich das globale Minimum
11.8 Ferroelektrizität 649
3
freie Energie (bel. Einheiten)
𝑻 > 𝑻𝑪
2
1 𝑻 = 𝑻𝑪
zu höheren Ps -Werte verschiebt. Wir sehen auch, dass für einen bestimmten Temperaturbe-
reich die lokalen Minima bei Ps = 0 und endlichem Ps durch eine Energiebarriere getrennt
sind, so dass es beim Durchfahren der Temperatur in unterschiedliche Richtungen zu Hys-
tereseeffekten kommt.
11.8.2.1 Ordnungs-Unordnungs-Systeme
Zu den Substanzen mit einem Ordnungs-Unordnungs-Übergang gehören Systeme mit Was-
serstoffbrückenbindungen, in denen die Bewegung des Protons mit den ferroelektrischen
Eigenschaften verbunden ist (siehe Abb. 11.31). Ein typischer Vertreter ist Kalium-Dihydro-
gen-Phosphat (KDP: KH2 PO4 ), bei dem die Protonen in den Wasserstoffbrückenbindungen
zwischen den PO4 -Ionen zwei Gleichgewichtslagen einnehmen können. Die resultierenden
elektrischen Dipolmomente sind in der paraelektrischen Phase oberhalb von TC = 123 K
650 11 Dielektrische Eigenschaften
paraelektrisch ferroelektrisch
nach vorne
H, fehlgeordnet
Phosphat
zunächst ungeordnet. Erst unterhalb von TC wird eine Position bevorzugt, wodurch eine
endliche spontane Polarisation resultiert. Dass die Protonen entscheidend sind, kann durch
Deuterieren von KDP gezeigt werden, was zu einer Erhöhung von TC auf 213 K führt.
72
Perowskit ist ein Mineral mit der chemischen Formel CaTiO3 . Perowskit wurde 1839 von Gustav
Rose im Ural-Gebirge entdeckt und nach dem russischen Mineralogen Lew Alexejewitsch Perow-
ski (1792–1856) benannt. Die Struktur besteht aus einer kubisch dichtest gepackten Kugelpackung
(kubisch flächenzentriert) von Ca2+ - und O 2− -Ionen, ein Viertel der entstehenden Oktaederlücken
werden von den Ti4+ -Ionen besetzt. Interessanterweise ist der für den Strukturtyp namensgeben-
de Perowskit selbst leicht verzerrt, da der Ionenradius von Ca2+ etwas zu klein ist. Eine optimale,
unverzerrte kubische Struktur findet sich stattdessen im SrTiO3 .
11.8 Ferroelektrizität 651
als die linear mit der Auslenkung ansteigende elastische Rückstellkraft.73 Der eben beschrie-
bene Vorgang ist äquivalent dazu, dass die Eigenfrequenz der TO Phononen gegen null geht.
Wir sprechen in diesem Zusammenhang von weichen optischen Phononen. Der Übergang
in die ferroelektrische Phase kann in diesem Bild als ein Einfrieren der transversalen opti-
schen Gitterschwingungen aufgefasst werden, bei dem die entgegengesetzt geladenen Ionen
voneinander getrennt werden.
Wir wollen jetzt noch diskutieren, unter welchen Voraussetzungen sich eine Polarisations-
katastrophe ergibt. Dies können wir anhand der Clausius-Mossotti Beziehung (11.3.22) und
der Lyddane-Sachs-Teller (LST) Relation (11.4.17) tun. Lösen wir (11.3.22) nach der Dielek-
trizitätskonstanten auf, so erhalten wir
1 + 23 ∑ i n V ,i α i
є= . (11.8.11)
1 − 13 ∑ i n V ,i α i
Hierbei setzt sich α i aus der elektronischen und ionischen Polarisierbarkeit zusammen und
wir haben berücksichtigt, dass wir in der betrachteten Substanz mehrere Ionensorten mit
unterschiedlicher Dichte n V ,i und Polarisierbarkeit α i vorliegen haben. Aus (11.8.11) wird
sofort klar, dass bei einer hohen ionischen Polarisierbarkeit, wie sie für viele Ionenkristal-
le charakteristisch ist, die Summe ∑ i n V ,i α i so groß werden kann, dass der Nenner gegen
null und damit є → ∞ geht. Dieser Fall kann zum Beispiel durch das Abkühlen einer Sub-
stanz eintreten. Nach der LST-Relation geht dann die Schwingungsfrequenz der tranversa-
len optischen Phononen gegen null. Wir erhalten eine statische gegenseitige Auslenkung der
verschiedenen Ionensorten und damit eine spontane Polarisation.
800
SrTiO3
Dielektrizitätskonstante
600
BaTiO3
400
KTaO3
200
Abb. 11.32: Temperaturabhängig-
keit der Dielektrizitätskonstante
der paraelektrischen Perowskite
0 BaTiO3 , KTaO3 und SrTiO3 (nach
0 2 4 6 8 10
G. Rupprecht and R. O. Bell, Phys. Rev.
-1
1000 / (T -) (K ) 135, A748–A752 (1964)).
73
Selbstverständlich wird die Auslenkung nicht beliebig groß. Bei größeren Auslenkungen gilt die
elastische Näherung nicht mehr und anharmonische Effekte führen dazu, dass die Rückstellkraft
wiederum schneller mit der Auslenkung anwächst als die Kraft durch das lokale elektrische Feld.
652 11 Dielektrische Eigenschaften
Da sich beim Abkühlen einer paraelektrischen Substanz oberhalb von TC die Summe
3 ∑ i V ,i i
1
n α dem Wert 1 annähert, können wir nahe bei TC davon ausgehen, dass
1
δ =1− ∑ n V ,i α i ≪ 1 . (11.8.12)
3 i
Wir nehmen nun ferner an, dass sich der Parameter δ linear mit der Temperaturdifferenz
(T − Θ) ändern soll:
δ(T) ∝ (T − Θ) . (11.8.13)
Hierbei ist Θ die paraelektrische Curie-Temperatur. Setzen wir dies in (11.8.11) ein, so er-
halten wir
1
є(T) ∝ . (11.8.14)
T −Θ
Diese Temperaturabhängigkeit bezeichnen wir als Curie-Weiss-Gesetz. Sie beschreibt den
experimentell beobachteten Temperaturverlauf der Dielektrizitätskonstante im paraelektri-
schen Bereich sehr gut (siehe Abb. 11.32).
Setzen wir den Verlauf (11.8.14) für є(T) in die LST-Relation (11.4.17) ein, so erhalten wir
für die Frequenz der TO Phononen den Temperaturverlauf
Hierbei ist є stat die Dielektrizitätskonstante für Frequenzen ω ≫ ω L (z. B. im sichtbaren Be-
reich), bei der wir die ionische Polarisierbarkeit null setzen, aber immer noch α el (0) verwen-
den können, da die typischen Eigenfrequenzen der elektronischen Prozesse im UV-Bereich
liegen. Wir sehen also, dass die Frequenz der TO Phononen im paraelektrischen Bereich mit
abnehmender Temperatur gegen null geht, die TO Phononen also immer weicher werden.
Wie Abb. 11.33 zeigt, stimmt dies sehr gut mit der experimentellen Beobachtung überein.
2.4 8
SrTiO3
1.8 6
(T / 2) (10 s )
-2
24
1000 /
11.8.4 Piezoelektrizität
Unter Piezoelektrizität versteht man die Änderung der elektrischen Polarisation und somit
das Auftreten einer elektrischen Spannung an Festkörpern, wenn sie elastisch verformt wer-
den (direkter piezoelektrischer Effekt). Umgekehrt verformen sich Materialien bei Anlegen
einer elektrischen Spannung (inverser piezoelektrischer Effekt). Der direkte piezoelektrische
Effekt wurde im Jahre 1880 von den Brüdern Jacques und Pierre Curie entdeckt. Bei Versu-
chen mit Turmalinkristallen fanden sie heraus, dass bei einer mechanischen Verformung der
Kristalle auf der Kristalloberfläche elektrische Ladungen entstehen, deren Menge sich pro-
portional zur Verformung verhält. Grundsätzlich sind alle Materialien, die ferroelektrisch
sind, auch piezoelektrisch aber nicht umgekehrt. Zum Beispiel ist Quarz piezoelektrisch aber
nicht ferroelektrisch.
In Abb. 11.28 haben wir bereits die Ursache für den piezoelektrischen Effekt veranschau-
licht. Wird ein Kristall durch eine äußere Kraft in Richtung seiner polaren Achse verformt,
so fallen die Schwerpunkte der negativen und positiven Ladungen nicht mehr zusammen
und es entsteht eine endliche Polarisation. Das heißt, durch die gerichtete Verformung des
piezoelektrischen Materials bilden sich mikroskopische Dipole innerhalb der Elementarzel-
654 11 Dielektrische Eigenschaften
len aus. Das Aufsummieren über die damit verbundenen elektrischen Dipolfelder führt zu
einer makroskopisch messbaren elektrischen Spannung entlang der polaren Achse. Wichtig
ist, dass die Verformung gerichtet ist, das heißt, dass der angelegte Druck nicht von allen
Seiten auf die Probe wirkt. Umgekehrt kann durch Anlegen einer elektrischen Spannung
eine Verformung des Kristalls erreicht werden. Wie auch jeder andere Festkörper, können
piezoelektrische Körper mechanische Schwingungen ausführen. Bei Piezoelektrika können
diese Schwingungen elektrisch angeregt werden. Andererseits bewirken die mechanischen
Schwingungen wieder eine elektrische Wechselspannung. Die Frequenz der Schwingung ist
nur von der Schallgeschwindigkeit (eine Materialkonstante) und den Abmessungen des pie-
zoelektrischen Körpers abhängig. Bei geeigneter Befestigung hängen diese Frequenzen kaum
von Umgebungseinflüssen ab. Deshalb sind piezoelektrische Bauteile wie Schwingquarze
sehr gut für präzise Oszillatoren geeignet (z. B. in der Quarzuhr).
Wirkt auf einen piezoelektrischen Kristall neben einem externen elektrischen Feld Eext noch
eine mechanische Spannung σ (vergleiche Abschnitt 4.2), so können wir die resultierende
dielektrische Verschiebung D schreiben als
D = є 0 χ elσ ⋅ Eext + P + d ⋅ σ = є 0 є σ ⋅ Eext + d ⋅ σ . (11.8.16)
Hierbei sind χ elσ und є σ die Tensoren der elektrischen Suszeptibilität und der Dielektrizi-
tätskonstante bei konstanter Spannung σ, d ist der Tensor des piezoelektrischen Effekts. Die
Koeffizienten des Tensors liegen in der Größenordnung von 1–100 × 10−12 C⇑N. Umgekehrt
können wir die Dehnung e eines piezoelektrischen Kristalls bei von außen wirkender me-
chanischer Spannung σ und elektrischem Feld Eext durch
e = C E ⋅ σ + d t ⋅ Eext (11.8.17)
ausdrücken. Hierbei ist C E der Elastizitätsmodul bei konstantem elektrischen Feld und d t
der Tensor für den inversen piezoelektrischen Effekt.74 Die piezoelektrischen Verzerrungs-
koeffizienten sind gegeben durch
E σ
∂e i ∂D i
di j = ( ) =( ) , (11.8.18)
∂E j ∂σ j
wobei der erste Ausdruck für den direkten und der zweite für den inversen piezoelektrischen
Effekt gilt. Häufig wird auch der piezoelektrische Spannungskoeffizient g E bei konstantem
elektrischen Feld verwendet, der die erzeugte Polarisation mit der wirkenden Spannung ver-
knüpft:
P = gE ⋅ σ . (11.8.19)
Er ist durch
E E
∂D i ∂D i E σk
gi j = ( ) = ∑( ) ⋅( ) = ∑ di k ⋅ Ck j (11.8.20)
∂e j k ∂σ k ∂e j k
74
Man beachte, dass Spannung und Dehnung eigentlich Tensoren 2. Stufe sind und der Elastizitäts-
modul dadurch ein Tensor 4. Stufe. Da es sich aber bei Spannung und Dehnung um symmetrische
Tensoren handelt, reduziert man sie mit Hilfe der Voigt-Notation (11 = 1, 22 = 2, 33 = 3, 13 = 4,
23 = 5, 12 = 6) zu 6-komponentigen Vektoren. Der Elastizitätsmodul ist dann eine 6×6-Matrix.
11.8 Ferroelektrizität 655
gegeben. Die beiden Koeffizienten sind also über die elastischen Konstanten des Materials
verknüpft.
Piezoelektrische Materialien finden vielfältige Anwendungen in der Sensorik und Aktorik.
Im Bereich der Aktorik sind zwei Haupteffekte relevant, für welche die Gleichung für die
Dehnung vereinfacht werden kann. Für den piezoelektrischen Quer- oder Transversaleffekt
(d 31 -Effekt), bei dem die Dehnung quer zum angelegten Feld auftritt, gilt
e 1 = C 11
E
⋅ σ1 + d 31 ⋅ E ext,3 . (11.8.21)
Beim piezoelektrischer Längs- oder Longitudinaleffekt (d 33 -Effekt), bei dem die Dehnung
parallel zum angelegten Feld auftritt, gilt
e 3 = C 33
E
⋅ σ3 + d 33 ⋅ E ext,3 . (11.8.22)
In der Aktorik dienen Piezoelemente zur genauen Positionierung. Ein bekanntes Beispiel
ist die Positionierung der Tunnelspitze bei der Rastertunnelmikroskopie. Weitere wichtige
Anwendungen sind Tintenstrahldrucker und Piezolautsprecher, bei denen die Schallwellen
durch eine tonfrequente Wechselspannung erzeugt werden. Auch Dieseleinspritzsysteme ar-
beiten mit piezoelektrischen Aktoren (keramische Vielschichtbauteile mit Edelmetallinnen-
elektroden) und haben die so genannte Common-Rail-Technik verbessert. Dabei wird die
Einspritzung von Diesel über Ventile teilweise ersetzt. Seit 2005 werden auch beim Pumpe-
Düse-System Piezoaktoren eingesetzt. Industrieunternehmen, die derartige Piezoaktoren in
großen Stückzahlen fertigen, sind die Firmen Epcos und Bosch.
In der Sensorik wird das Auftreten der piezoelektrischen Ladung bei mechanischer Ver-
formung in Kraft-, Druck- und Beschleunigungssensoren ausgenutzt. Die Piezoelemente
dienen zur Wandlung von mechanischem Druck in elektrische Spannung. Einige Beispiele
sollen im Folgenden kurz diskutiert werden. In der Musik werden Piezoelemente als Ton-
abnehmer für akustische Instrumente genutzt, hauptsächlich bei Saiteninstrumenten wie
Gitarre, Geige oder Mandoline. Die dynamische Verformung des Instrumentes (Vibrati-
on des Klangkörpers) wird dabei in eine geringe Wechselspannung umgewandelt, die dann
elektrisch verstärkt wird. Bei piezoelektrischen Beschleunigungssensoren bzw. -aufnehmern
kommt es bei einer mechanischen Deformation (Kompression oder Scherung) durch die
Beschleunigung zu einer Ladungstrennung und damit zu einer abgreifbaren Ladung (bzw.
Spannung). Bei Schwingquarzen kann der Einfluss verschiedener Größen auf die Resonanz-
frequenz, bei akustischen Oberflächenwellenbauteilen der Einfluss auf die Verzögerungszeit
ausgenutzt werden. Eine wichtige Anwendung ist die Messung der auf dem Quarz aufge-
brachten Masse, z. B. bei industriellen Beschichtungsverfahren zur Bestimmung der Schicht-
dicke.
656 11 Dielektrische Eigenschaften
Literatur
A. S. Alexandrov, N. Mott, Polarons and Bipolarons, World Scientific, Singapore (1996).
D. Bohm, T. Staver, Application of Collective Treatment of Electron and Ion Vibrations to Theo-
ries of Conductivity and Superconductivity, Phys. Rev. B 84, 836 (1950).
R. W. Boyd, Nonlinear Optics, 3. Auflage, Academic Press, New York (2008).
D. Damjanovic, Ferroelectric, dielectric and piezoelectric properties of ferroelectric thin films
and ceramics, Rep. Prog. Phys. 61, 1267–1324 (1998).
J. T. Devreese, A. S. Alexandrov, Fröhlich Polaron and Bipolaron: Recent Developments, Rep.
Prog. Phys. 72, 066501 (2009).
J. T. Devreese, Polarons, in R. G. Lerner, G. L. Trigg, Encyclopedia of Physics (3. Auflage),
Wiley-VCH, Weinheim, S. 2004-2027 (2005).
P. P. Edwards, C. N. R. Rao (Hrsg.), Metal-Insulator Transitions Revised, Taylor & Francis,
Bristol (1995).
H. Friedrich, Theoretische Atomphysik, Springer, Berlin, Heidelberg (1994).
W. Gebhardt, U. Krey, Phasenübergänge und kritische Phänomene – Eine Einführung, Vieweg
(1980).
E. Hecht, Optik, Oldenbourg Wissenschaftsverlag, München (2009).
J. C. Joshi, A. L. Dawar, Pyroelectric Materials, Their Properties and Applications, phys. stat.
sol. (a) 70, 353 (1982).
H. A. Kramers, La diffusion de la lumière par les atomes, Atti Cong. Intern. Fisica, Como,
Bd. 2, S. 545–557 (1927).
R. de L. Kronig, On the theory of the dispersion of X-rays, J. Opt. Soc. Am. 12, 547556 (1926).
L. D. Landau, Theory of Fermi-Liquids, Sov. Phys. JETP 3, 920 (1957).
L. D. Landau, Oscillations in a Fermi-Liquid, Sov. Phys. JETP 5, 101 (1957).
L. D. Landau, On the Theory of the Fermi-Liquid, Sov. Phys. JETP 8, 70 (1959).
L. D. Landau, E. M. Lifschitz, Lehrbuch der theoretischen Physik V. Statistische Physik, Aka-
demie Verlag, Berlin (1970).
L. D. Landau, I. M. Lifshitz, Statistical Physics, Addison-Wesley, Reading, MA (1980).
J. Lindhard, On the Properties of a Gas of Charged Particle, Mat. Fys. Medd. Dan. Vid. Selsk.
28, No. 8 (1954).
M. Lines, A. Glass, Principles and applications of ferroelectrics and related materials, Claren-
don Press, Oxford (1979).
S. Maier, Plasmonics: Fundamentals and Applications, Springer Verlag, Berlin (2007).
N. F. Mott, Proc. Roy. Soc. London A 382, 1 (1980).
Literatur 657
der erkannte, dass die Funktion des Kompasses auf dem Erdmagnetismus beruhte. Ein wei-
terer großer Fortschritt wurde durch André-Marie Ampère2 gemacht, der entdeckte, dass
magnetische Felder durch sich bewegende Ladungen erzeugt werden, die später dann als
Elektronen identifiziert wurden. Die Faszination des Phänomens Magnetismus hat ganz we-
sentlich zur Entwicklung unseres heutigen Verständnisses des Elektromagnetismus und des
magnetischen Verhaltens von Festkörpern beigetragen.3
1
William Gilbert, geboren am 24. Mai 1544 in Colchester, England, gestorben am 10. Dezember
1603 in London.
Im Jahre 1600 veröffentlichte William Gilbert, der spätere Leibarzt von Königin Elizabeth I von
England, seine große Studie über den Magnetismus, „De Magnete“ – „Über den Magneten“. Dieses
Werk gab zum ersten Mal eine rationale Erklärung für die mysteriöse Eigenschaft der Kompassna-
del, sich in Nord-Süd-Richtung auszurichten: die Erde selbst ist magnetisch. „De Magnete“ leitete
die Ära der modernen Physik und Astronomie ein und führte in ein neues Jahrhundert, das ge-
prägt war von den großen Leistungen bedeutender Naturforscher wie Galileo, Kepler, Newton und
anderer.
Gilbert erklärte die Abweichung der Kompassnadel von der wahren (astronomischen) Nordrich-
tung durch die Anziehungskraft der Kontinente, was in Übereinstimmung mit den Beobachtun-
gen im Nordatlantik stand. Die Nadel wich nahe Europa nach Osten ab und nahe Amerika nach
Westen. Die Beobachtung, dass nahe den Inseln von Novaja Semlja, nördlich von Rußland, die
Kompassnadel eine Abweichung nach Westen aufwies, veranlasste Gilbert zur Hypothese einer
„Nord-Ost-Passage“ um Rußland, die einen direkteren Seeweg zu den Gewürzinseln des Fernen
Ostens ermöglicht hätte. Einige Jahrzehnte früher hatten Frobisher und Davis erfolglos eine ähn-
liche „Nord-West-Passage“ um den amerikanischen Kontinent gesucht.
2
André-Marie Ampère, geboren am 22. Dezember 1775 in Poleymieux-au-Mont-d’or bei Lyon,
Frankreich, gestorben am 10. Juni 1836 in Marseille.
3
Auch heute verknüpfen viele Menschen mit Magnetismus immer noch etwas Mystisches und ver-
trauen zum Beispiel auf die heilenden Kräfte von statischen Magnetfeldern, obwohl diese wissen-
schaftlich nicht belegbar ist.
660 12 Magnetismus
Nachdem wir im vorangegangenen Kapitel die Wechselwirkung eines Festkörpers mit einem
elektrischen Feld diskutiert haben, wollen wir in diesem Kapitel das Verhalten von Festkör-
pern in äußeren Magnetfeldern betrachten. Wir werden uns dabei wieder auf die lineare
Antwort von Festkörpern auf von außen wirkende Magnetfelder beschränken und auf die
Betrachtung nicht-linearer Effekte weitgehend verzichten. Wir haben ferner bereits in Ka-
pitel 9 die Dynamik von Kristallelektronen unter dem Einfluss von durch Magnetfelder er-
zeugten äußeren Kräften diskutiert. Dort haben wir uns aber im Wesentlichen auf die Be-
schreibung der Bewegung von einzelnen Kristallelektronen in Metallen unter der Wirkung
einer äußeren Kraft beschränkt. Dadurch konnten wir den Einfluss von Magnetfeldern auf
die elektrischen Transporteigenschaften klären. In diesem Kapitel wollen wir unsere Dis-
kussion auf die Beschreibung der Reaktion eines Festkörpers als Ganzem auf ein von außen
wirkendes magnetisches Feld ausdehnen. Dadurch erhalten wir zum Beispiel eine Beschrei-
bung der magnetischen Suszeptibilität von Festkörpern.
Bei der Diskussion der Bandstruktur von Festkörpern und der elektrischen Transporteigen-
schaften haben wir überwiegend eine so genannte Einelektronen-Näherung benutzt, mit der
wir die Energieniveaus von Kristallelektronen in einem effektiven Potenzial bestehend aus
dem periodischen Potenzial der Ionenrümpfe und einem mittleren Potenzial aller anderen
Elektronen berechnet haben. Innerhalb des Einelektronen-Modells konnten wir die angereg-
ten Zustände eines Elektronensystems verstehen, die z. B. durch Wechselwirkung mit Licht
oder durch thermische Anregung erzeugt werden. Mit dem Einelektronen-Modell konnten
wir in Kapitel 11 auch die Reaktion eines Festkörpers auf oszillierende und statische elektri-
sche Felder beschreiben. Bei der Diskussion von magnetischen Phänomenen spielen häufig
Korrelationen im Elektronensystem eine wichtige Rolle, weshalb magnetische Phänomenen
meist nicht mehr im Rahmen einer Einteilchen-Theorie beschrieben werden können, son-
dern einer wesentlich komplizierteren Vielteilchenbeschreibung bedürfen. Auf diese Aspek-
te können wir hier aber nur am Rande eingehen.
Ein wichtiger Aspekt, der unabhängig voneinander von Niels Bohr4 (1911) und J. H. van
Leeuwen5 (1919) in ihren Doktorarbeiten bewiesen wurde, ist die Tatsache, dass das
Phänomen Magnetismus untrennbar mit der Quantenmechanik verbunden ist. Das Bohr-
van Leeuwen Theorem besagt, dass bei endlichen Temperaturen und in allen endlichen
elektrischen oder thermischen Feldern die Nettomagnetisierung eines Ensembles von Elek-
tronen im thermischen Gleichgewicht identisch gleich null ist. Da sich die Bewegungsenergie
einer Ladung im Magnetfeld nicht ändert, ist anschaulich klar, dass die Magnetisierung
bei Anwendung einer klassischen Statistik verschwinden muss. Das heißt, dass ein rein
klassisches Elektronensystem im thermischen Gleichgewicht kein magnetisches Moment
zeigen kann. Magnetismus ist also ein Quantenphänomen.
Bei der Diskussion der magnetischen Eigenschaften von Festkörpern ist es zweckmäßig, zwi-
schen dem Magnetismus quasi-gebundener und quasi-freier Elektronen zu unterscheiden.
Diese Vorgehensweise haben wir auch bei der Beschreibung der dielektrischen Eigenschaf-
4
Niels Bohr, geboren am 7. Oktober 1885 in Kopenhagen, gestorben am 18. November 1962 in
Kopenhagen, Nobelpreis für Physik 1922.
Niels Bohr, Doktorarbeit Studier over Metallernes Elektrontheori, Københavns Universitet (1911).
5
Johanna Hendrika van Leeuwen, Problèmes de la théorie électronique du magnétisme, J. de Phys. et
le Radium 2, 361–377 (1921).
12 Magnetismus 661
ten in Kapitel 11 verwendet. Die quasi-gebundenen Elektronen sind dabei einzelnen Gitter-
atomen zugeordnet und die mit ihnen verknüpften magnetischen Eigenschaften lassen sich
als atomarer Magnetismus der Gitteratome beschreiben. Die quasi-freien Elektronen sind
z. B. die Leitungselektronen in Metallen. Bei der Beschreibung ihrer magnetischen Eigen-
schaften müssen wir die Fermi-Statistik anwenden, da die Fermi-Temperatur des Elektro-
nengases üblicherweise weit oberhalb von Raumtemperatur liegt. Im Gegensatz dazu kön-
nen wir bei der Beschreibung des atomaren Magnetismus der Gitteratome die Boltzmann-
Statistik verwenden, da für die Gitteratome aufgrund ihrer wesentlich größeren Masse die
Fermi-Temperatur üblicherweise klein gegenüber Raumtemperatur ist.
662 12 Magnetismus
wirkt. Das Magnetfeld ruft im Festkörper eine Magnetisierung M hervor, die mit dem anre-
genden Feld durch einen Tensor 2. Stufe verknüpft ist:
Hierbei ist χ i j der Tensor der magnetischen Suszeptibilität. Im Vergleich zum Ausdruck für
die elektrische Polarisation P [siehe (11.1.2)], wo auf der rechten Seite die elektrische Feld-
konstante є 0 auftaucht, enthält der Ausdruck für die Magnetisierung nicht die magnetische
Feldkonstante µ 0 . Eine völlige Analogie würde man erhalten, wenn wir anstelle der Magneti-
sierung auf der linken Seite von (12.1.2) die magnetische Polarisation Jpol = µ 0 M verwenden
würden. Diese hat die Einheit Vs/m2 in Analogie zur Einheit As/m2 der elektrischen Pola-
risation. Die Magnetisierung M ist definiert als das magnetische Moment m pro Volumen:
m
M≡ . (12.1.3)
V
Das magnetische Moment m ist klassisch nach Ampère äquivalent zu einem zirkulierenden
elektrischen Strom I. Der infinitesimale Beitrag dm ist dabei mit dem vom Strom überstri-
chenen Flächenelement dA über
dm = IdA (12.1.4)
verbunden. Solange der Strom in einer Ebene fließt ist die genaue Form der Fläche unwichtig
und wir erhalten das magnetische Moment
m = ∮ IdA = I ⋅ A⧹︂
n, (12.1.5)
wobei A die umschlossenen Fläche und ⧹︂ n der auf der Fläche senkrecht stehende Einheits-
vektor ist. Eine Verallgemeinerung von (12.1.5) ist
1
m= ∫ r × J(r) d r ,
3
(12.1.6)
2
12.1 Makroskopische Größen 663
m
wobei J(r) die Stromdichte am Ort r der Schleife ist. Wir
sehen, dass für eine ebene, beliebig geformte Stromschlei- n
fe das infinitesimales Stromelement durch dI = Idℓ = A
JdV gegeben ist, so dass 12 ∫ r × J(r) d 3 r = 12 ∫ r × Idℓ =
I ∫ dA = m. dA
I
Schreiben wir den Strom einer in einem Zentralpotenzi-
al umlaufenden Ladung q als I = q⇑T, so erhalten wir mit Abb. 12.1: Magnetisches Moment.
der Umlaufzeit T = 2πr⇑v und dem quantisierten Bahndrehimpuls L = r × mv mit (12.1.6)
das magnetische Moment m = 2m ∫ r × mv 2πr dℓ = 2m L⇑ħ. Für Elektronen ist q = −e, so
q 1 qħ
dass m = − 2m
eħ
L⇑ħ = −µ B L⇑ħ, d.h., m und L sind antiparallel. Das gesamte magnetische Mo-
ment m eines Festkörpers ist durch die Summe von atomaren Momenten µ i gegeben:6
q i ħ ri × pi Li
m = ∑ µi = ∑ = ∑ g i µB . (12.1.7)
i i 2m ħ i ħ
Hierbei ist L i = r i × p i der mit dem atomaren Moment µ i verbundene Drehimpuls7 und
eħ
µB = = 9.274 009 994(57) × 10−24 J⇑T
2m
= 5.788 381 8012(26) × 10−5 eV⇑T (12.1.8)
das Bohrsche Magneton.8
Analog zu Abschnitt 11.1.1 erhalten wir für die Fourier-Komponenten
M i (q, ω) = ∑ χ i j (q, ω)H j (q, ω) . (12.1.9)
j
Der zum Dielektrizitätstensor analoge Tensor ist der Tensor der magnetischen Permeabilität.
Dieser Tensor ist definiert durch
B i (q, ω) = ∑ µ 0 µ i j (q, ω)H j (q, ω) , (12.1.10)
j
wobei B i (q, ω) die Fourier-Transformierte der magnetischen Flussdichte ist, die definiert ist
durch:
B(r, t) = µ 0 H(r, t) + µ 0 M(r, t) = µ 0 (︀H(r, t) + M(r, t)⌋︀ . (12.1.11)
6
Wir können die Summe auch in ein Integral überführen und m = ∫V M(r)d 3 r schreiben, wobei
die lokale Magnetisierung M(r) als lokale Dichte der magnetischen Momente interpretiert werden
muss.
7
In Gleichung (12.1.7) haben wir nur den Bahndrehimpuls L betrachtet. Da für Bahndrehimpulse
der g-Faktor eins ist, kann in (12.1.7) g i weggelassen werden. Im Allgemeinen müssen wir aber
den Gesamtdrehimpuls J betrachten, der sich aus Bahndrehimpuls L und Spin S zusammensetzt.
Eine genaue Diskussion hierzu folgt später.
8
Hinweis: Das magnetische Moment eines Elektrons mit Bahndrehmoment L ist µ = −µ B L. Das
negative Vorzeichen resultiert dabei aus der Tatsache, dass der elektrische Strom aufgrund der
Ladung −e der Elektronen das entgegengesetzte Vorzeichen zum Teilchenstrom besitzt. Die Ele-
mentarladung e verwenden wir wie immer als positive Zahl.
664 12 Magnetismus
Hierbei ist µ 0 = 4π × 10−7 Vs/Am die magnetische Feldkonstante. Aufgrund der Definitio-
nen (12.1.9) und (12.1.10) sind χ i j (q, ω) und µ i j (q, ω) verknüpft durch
In Analogie zum Dielektrizitätstensor werden wir im Folgenden den Real- und Imaginärteil
des Permeabilitätstensors mit µ r (q, ω) und µ i (q, ω) bezeichnen. In Fällen, wo die Tensor-
eigenschaften nicht relevant sind, werden wir µ i j (q, ω) durch die skalare Funktion µ(q, ω)
ersetzen.
∇ × B = µ 0 (Jc + J M ) . (12.1.13)
Hierbei ist Jc die Stromdichte aufgrund eines in einem Leiter fließenden elektrischen Stroms
und J M diejenige Stromdichte, die mit der Magnetisierung eines Mediums verknüpft ist. Das
Problem besteht nun darin, dass wir Jc einfach messen können, J M dagegen nicht, da die
Magnetisierung ja aus zirkulierenden mikroskopischen Strömen im Inneren eines Mediums
resultiert. Da
JM = ∇ × M (12.1.14)
9
Wir beschränken uns hier auf die Magnetostatik, ansonsten müssten wir noch zeitabhängige elek-
trische Felder als Quellen berücksichtigen.
12.1 Makroskopische Größen 665
Jc = ∇ × H (12.1.16)
∇ ⋅ B = µ 0 ∇ ⋅ (H + M) = 0 , (12.1.17)
folgt unmittelbar ∇ ⋅ H = −∇ ⋅ M. Wir sehen, dass das H-Feld im Gegensatz zum B-Feld
nicht quellenfrei ist. Insbesondere entspricht die Diskontinuität des H-Felds an der Ober-
fläche eines magnetisierten Körpers einer Schicht von Quellen und Senken des H-Felds.
Ähnlich zum elektrischen Feld können wir uns deshalb das H-Feld als durch positive und
negative „magnetische Ladungen“ verursacht denken. Diese fiktiven magnetischen Ober-
flächenladungen werden meist als Nord- und Südpole bezeichnet und haben, obwohl sie
physikalisch nicht existieren, die Betrachtungsweise magnetischer Phänomene stark beein-
flusst. Im Gegensatz zu elektrischen Ladungen treten magnetische Ladungen aber nie alleine
sondern immer paarweise auf, da es keine magnetischen Monopole gibt.
B H M
Hs
M
+ + + + + + + + + + + + + + + HN
HN
B
Abb. 12.2: Zur Veranschaulichung der Entmagnetisierungs- und Streufelder einer homogen magneti-
sierten Scheibe. Das Feld HN im Inneren der Scheibe wird Entmagnetisierungsfeld genannt, da es der
Magnetisierung der Scheibe entgegengerichtet ist. Das Feld Hs im Außenraum wird Streufeld genannt.
Die Feldlinien des Streufeldes verbinden die Quellen und Senken der Magnetisierung, die wir als fikti-
ve positive (Nordpol) und negativen (Südpol) magnetische Oberflächenladungen betrachten können.
Ganz rechts sind die Größenverhältnisse von B, H und M im Inneren der Scheibe gezeigt.
Durchflutungsgesetz
∮ H ⋅ ds = 0 . (12.1.20)
Diese Bedingung können wir nur erfüllen, wenn HN antiparallel zu Hs ist. Das bedeutet,
dass HN antiparallel zur Magnetisierung M sein muss. Deshalb wird das Feld HN Entmagne-
tisierungsfeld genannt. Wenn wir anstelle einer Scheibe einen langen und sehr dünnen Stab
mit Magnetisierung parallel zum Stab verwendet hätten, würde das Streufeld sehr klein wer-
den, da wir jetzt ganz wenige magnetische Oberflächenladungen haben. Dadurch wird auch
das Entmagnetisierungsfeld verschwindend klein. Ganz allgemein können wir für einen ho-
mogen magnetisierten Festkörper
H N,i = −N i j M j (12.1.21)
Feld benutzen müssen. In Analogie zu (11.1.44) können wir das lokale magnetische Feld
schreiben als
Hierbei ist Hmak = Hext + H N das makroskopische Feld, das sich aus dem externen Feld und
dem Entmagnetisierungsfeld H N = −NM zusammensetzt. Das Feld HL = M⇑3 ist das zum
Lorentz-Feld EL analoge innere Feld. Dieses Feld ist für para- und diamagnetische Materia-
lien (die Suszeptibilität dieser Materialien ist typischerweise kleiner als 10−4 ) allerdings so
klein, dass Hlok ≃ Hmak in der Regel eine sehr gute Näherung ist.11 Bei der Diskussion der
di- und paraelektrischen Eigenschaften von Festkörpern konnte diese Vereinfachung nicht
gemacht werden, da hier die Suszeptibilität in der Größenordnung von eins ist.
E = − 12 µ 0 ∫ HN ⋅ MdV − 16 µ 0 ∫ M 2 dV . (12.1.23)
V V
Der Faktor 12 stellt dabei sicher, dass wir Beiträge nicht doppelt zählen, da ja jedes Moment µ
sowohl als Feldquelle als auch als Moment eingeht. Der zweite Term in (12.1.23) ist unwich-
tig. Er führt zu einer parallelen Ausrichtung der Momente über die Dipol-Dipol-Wechsel-
wirkung. Diese ist aber so schwach (typischerweise 0.1 meV oder 1 K pro atomares Moment,
vergleiche hierzu Abschnitt 12.5.1), dass sie gegenüber der Austauschkopplung (typischer-
weise 100 meV oder 1000 K) vernachlässigt werden kann. Die magnetostatische Selbstener-
gie wird üblicherweise als
E M = E + 16 µ 0 ∫ M 2 dV (12.1.24)
V
definiert, so dass
E M = − 12 µ 0 ∫ HN ⋅ M dV = 12 µ 0 ∫ M ⋅ N ⋅ M dV . (12.1.25)
V V
Wichtig ist, dass die magnetostatische Selbstenergie immer positiv ist. Das Vorzeichen des
Integrals in (12.1.25) ist zwar negativ, E M ist aber positiv, da HN antiparallel zu M ist. Für
11
Für dia- und paramagnetische Materialien ist ohne äußeres Feld M = 0, so dass H N = 0 und H s = 0.
Wenn ein äußeres Feld H ext angelegt wird, ist M ≪ H ext da ⋃︀χ⋃︀ ≪ 1. Wir erhalten dann H mak =
H ext + H N ≃ H ext , also H N ≃ 0. Ferner gilt für das Streufeld H s ≃ H ext .
668 12 Magnetismus
den Fall eines homogen magnetisierten Ellipsoids ist HN = −N ⋅ M und (12.1.25) ergibt
E M = 12 µ 0 ∫ M ⋅ N ⋅ M dV = 12 µ 0 V N M 2 . (12.1.26)
V
Da ein magnetischer Körper versucht seine Selbstenergie zu minimieren, richtet sich die
Magnetisierung entlang der Achse aus, für die N minimal ist. Dies bezeichnet man als For-
manisotropie (vergleiche Abschnitt 12.7.3).
Da µ 0 M = B − µ 0 HN , können wir das Integral (12.1.25) umschreiben in12
wobei die Integration jetzt über den gesamten Raum erfolgen muss. Wir sehen, dass wir
die Selbstenergie, die mit einem magnetisierten Körper verbunden ist, entweder durch ein
Integral von H N2 über den gesamten Raum oder von −HN ⋅ M über das Volumen des Körpers
ausdrücken können.
∎ diamagnetische Festkörper:
In diamagnetischen Festkörpern liegen ohne äußeres Magnetfeld keine magnetischen
Momente vor. Erst durch die Wirkung des äußeren Magnetfeldes werden magnetische
Momente im Festkörper induziert, wodurch eine endliche Magnetisierung entsteht. Die
induzierten magnetischen Momente sind dem sie induzierenden Magnetfeld entgegen-
gesetzt (Lenzsche Regel). Das heißt, die magnetische Suszeptibilität von diamagnetischen
Festkörpern ist negativ:
12
Um zu zeigen, dass ∫ B ⋅ HdV = 0, benutzen wir B = ∇ × A und die Vektoridentität H ⋅ (∇ × A) =
∇ ⋅ (A × H) + A ⋅ (∇ × H), wobei der zweite Term bei Abwesenheit von Strömen verschwindet.
Wir erhalten dann ∫ B ⋅ HdV = ∫ ∇ ⋅ (A × H)dV . Mit Hilfe des Divergenztheorems können wir
das Volumenintegral in ein Oberflächenintegral ∫F (A × H)dF umwandeln. In großer Entfernung
vom Magneten ist A ∼ 1⇑r 2 und H ∼ 1⇑r 3 , so dass das Integral über eine Oberfläche mit unendlich
großem Radius verschwindet.
12.2 Mikroskopische Theorie 669
Isolatoren Metalle
quasi-gebundene Elektronen quasi-freie Elektronen
Paramagnetismus
Materialien mit nicht-wechsel- Langevin- Pauli-
wirkenden magnetischen Paramagnetismus Paramagnetismus
Momenten
Abb. 12.3: Zur Klassifizierung der mikroskopischen Ursachen unterschiedlicher magnetischer Phäno-
mene. Wir unterscheiden grob zwischen Diamagnetismus, Paramagnetismus und kooperativen ma-
gnetischen Phänomenen (Ferro-, Antiferro- und Ferrimagnetismus). Diese Phänomene können wie-
derum mit induzierten oder permanenten magnetischen Momenten quasi-gebundener Elektronen in
Isolatoren oder quasi-freier Elektronen in Metallen zusammenhängen. Kernmomente werden wir bei
unserer Diskussion nicht berücksichtigen.
Wie in Abb. 12.3 gezeigt ist, werden wir im Folgenden zwischen dem atomaren oder Lar-
mor-Diamagnetismus von Isolatoren und dem Landau-Diamagnetismus von Metallen
unterscheiden. Im ersten Fall betrachten wir nur den Effekt der fest an die Gitteratome
gebundenen Elektronen in Isolatoren und im letzteren den Effekt von frei beweglichen
Leitungselektronen in einem Metall. Dies ist wiederum analog zu unserer Diskussion
der dielektrischen Eigenschaften in Kapitel 11, wo wir auch zunächst die dielektrischen
Eigenschaften von Isolatoren und später diejenigen von Metallen diskutiert haben.
∎ paramagnetische Festkörper:
In paramagnetischen Festkörpern liegen bereits ohne äußeres Magnetfeld magnetische
Momente vor. Diese magnetischen Momente können zum Beispiel aus der Bahnbewe-
gung oder dem Spin der Kristallelektronen resultieren. Für das Bahn- und Spinmoment
gebundener Elektronen können wir schreiben:
ℓ
µ ℓ = −g ℓ µ B ∐︀ℓ 2 ̃︀ = ℓ(ℓ + 1)ħ 2 (12.2.2)
ħ
s
µ s = −g s µ B ∐︀s2 ̃︀ = s(s + 1)ħ 2 (12.2.3)
ħ
Hierbei sind ℓ und s der Bahndrehimpuls und der Spin eines Elektrons und g ℓ und g s
die zugehörigen g-Faktoren mit
α
g s = 2 ]︀1 + + O(α 2 ) + . . .{︀ = 2.0023 (12.2.4)
2π
670 12 Magnetismus
1 0
⋃︀↑̃︀ = ( ) , ⋃︀↓̃︀ = ( ) (12.2.6)
0 1
ħ
sz = σz , (12.2.7)
2
wobei σ z eine der Paulischen Spin-Matrizen ist:
0 1 0 −ı 1 0
σx = ( ), σy = ( ), σz = ( ). (12.2.8)
1 0 ı 0 0 −1
Die Eigenzustände der Spin-Operatoren sx und s y können als symmetrische und anti-
symmetrische Superpositionen der Spinoren (12.2.6) ausgedrückt werden.
In einem Atom sind üblicherweise die einzelnen Bahndrehimpulse ℓ i und Spins s i der
Hüllenelektronen eines Atoms zu einem Gesamtbahndrehimpuls L = ∑ i ℓ i und Gesamt-
spin S = ∑ i s i gekoppelt, die wiederum zu einem Gesamtdrehimpuls J = L + S gekoppelt
sind (Russel-Saunders-Kopplung), so dass das magnetische Moment des Atoms gegeben
ist durch
J
µ J = −g J µ B ∐︀J2 ̃︀ = J(J + 1)ħ 2 . (12.2.9)
ħ
Hierbei ist g J der Landésche g-Faktor13 [vergleiche (12.3.36)]. Ein äußeres Magnetfeld
bewirkt eine Ausrichtung der vorhandenen magnetischen Momente in Richtung des an-
gelegten Feldes. Die magnetische Suszeptibilität ist deshalb positiv:
Es ist anschaulich klar, dass wir eine rein diamagnetische Antwort eines Festkörpers nur
dann erhalten können, wenn keine magnetischen Momente im Festkörper vorhanden
sind. Dies ist nur dann der Fall, wenn die Summe von Spin- und Bahnmoment ver-
schwindet. Dies gilt für Atome mit komplett gefüllten Schalen, zum Beispiel Edelgase.14
13
Alfred Landé, geboren am 13. Dezember 1889 in Elberfeld, gestorben am 30. Oktober 1976 in
Columbus/Ohio.
14
In diesem Fall können immer noch Kernmomente vorhanden sein. Diese sind aber, da µ K =
eħ⇑2M K ≪ µ B = eħ⇑2m, um mehr als 3 Größenordnungen kleiner als die elektronischen Momen-
te und sollen im Folgenden vernachlässigt werden.
12.3 Atomarer Dia- und Paramagnetismus 671
15
Paul Langevin, geboren am 23. Januar 1872 in Paris, gestorben am 19. Dezember 1946 in Paris.
16
Wolfgang Pauli, siehe Kasten auf Seite 694.
672 12 Magnetismus
Lz e 2 B 2z
𝒯 = 𝒯0 + µ B Bz + ∑(x + y i ) = 𝒯0 + ∆ℋℓ .
2 2
(12.3.4)
ħ 8m i i
Wir müssen jetzt ferner noch berücksichtigen, dass die Elektronen einen Spin besitzen. Die
Wechselwirkung des äußeren Feldes mit dem Spin führt zu der Zusatzenergie
si Sz
∆ℋs = g s µ B ∑ ⋅ Bext = g s µ B B z . (12.3.5)
i ħ ħ
Hierbei ist Sz = ∑ i (s i )z . Insgesamt erhalten wir somit für die Änderung der Energie durch
das angelegte Magnetfeld:
µB e 2 B 2z
∆ℋ = ∆ℋℓ + ∆ℋs = (Lz + g s Sz )B z + ∑(x + y i ) .
2 2
(12.3.6)
ħ 8m i i
Die magnetische Suszeptibilität χ können wir mit Hilfe von Störungstheorie 2. Ordnung be-
rechnen. Eine störungstheoretische Behandlung ist hierbei möglich, da die Energieänderun-
gen aufgrund des angelegten Magnetfeldes wesentlich kleiner sind als die atomaren Energi-
en E n der elektronischen Niveaus. Die Energieänderung ∆E n eines Zustandes ⋃︀ñ︀ erhalten
wir zu
⋃︀∐︀n ⋃︀∆ℋ⋃︀ n′ ̃︀⋃︀
2
∆E n = ∐︀n ⋃︀∆ℋ⋃︀ ñ︀ + ∑ . (12.3.7)
n≠n ′ E n − E n′
17
Wir betrachten Elektronen mit Ladung q = −e.
12.3 Atomarer Dia- und Paramagnetismus 673
µB Bz
∆E n = ∐︀n⋃︀Lz + g s Sz ⋃︀ñ︀
ħ
µ B2 B 2z ⋃︀∐︀n⋃︀(Lz + g s Sz )⋃︀n′ ̃︀⋃︀2
+ ∑
ħ 2 n≠n ′ E n − E n′
e 2 B 2z
+ ∐︀n⋃︀∑(x i2 + y 2i )⋃︀ñ︀ . (12.3.8)
8m i
Mit Hilfe diesen Ausdrucks können wir die magnetische Suszeptibilität von Festkörpern dis-
kutieren, bei denen nur die an die Atome gebundenen Elektronen zum Magnetismus beitra-
gen. Der 1. Term in Gleichung (12.3.8) resultiert aus den mit dem Spin- und Bahndrehimpuls
der Elektronen verbundenen, auch ohne äußeres Magnetfeld vorhandenen magnetischen
Momenten. Er ist verantwortlich für den atomaren oder Langevin-Paramagnetismus. Der
2. Term resultiert im so genannten Van Vleck Paramagnetismus.18 Der 3. Term ist schließlich
verantwortlich für den Larmor-Diamagnetismus.
12.3.1.1 Größenordnungen
Wir wollen kurz die Größenordnung der drei Terme in Gleichung (12.3.8) für den Grund-
zustand ⋃︀0̃︀ abschätzen.
1. Der 1. Term Bħ z ∐︀0⋃︀Lz + g s Sz ⋃︀0̃︀ ist wegen ∐︀0⋃︀Lz + g s Sz ⋃︀0̃︀ ≃ ħ von der Größenord-
µ B
nung µ B B z = 2meħ
B z ≃ ħω c , wobei wir ω c = eB z ⇑m benutzt haben. Für ein Magnetfeld
von 1 Tesla erhalten wir also eine Energieänderung von etwa 10−4 eV, was etwa 1 K
entspricht.
2. Der 2. Term ist um den Faktor ħω c ⇑(E n − E n ′ ) kleiner als der 1. Term. Da die Diffe-
renz (E n − E n ′ ) der atomaren Energien typischerweise im Bereich von eV liegt, ist der
2. Term für ein Feld im Bereich von 1 T um 4 bis 5 Größenordnungen kleiner als der
1. Term.
3. Im 3. Term können wir ⋃︀∐︀n⋃︀ ∑ i (x i2 + y 2i )⋃︀n′ ̃︀⋃︀2 ≃ a B2 setzen, wobei a B = 4πє 0 ħ 2 ⇑me 2 der
Bohrsche Radius ist. Damit ist (ħeB z ⇑m)2 ⇑(ħ 2 ⇑2ma B2 ) ≃ (ħω c )2 ⇑E H , wobei E H ∼ 13 eV
die Rydberg-Energie ist. Damit ist auch dieser Term um mehrere Größenordnungen klei-
ner als der 1. Term und liegt in der gleichen Größenordnung wie der zweite Term.
Aus unserer Abschätzung der Größenordnung der drei Terme in (12.3.8) können wir schlie-
ßen, dass der 1. Term klar dominiert. Die anderen Terme können deshalb nur dann beobach-
tet werden, wenn der 1. Term verschwindet. Dies ist für Atome oder Ionen mit vollkommen
gefüllten Elektronenschalen der Fall.
18
John H. van Vleck, geboren am 13. März 1899 in Middletown, Connecticut, gestorben am 27. Ok-
tober 1980 in Cambridge, Massachusetts. Van Vleck erhielt 1977 zusammen mit Sir Nevill F. Mott
und Philip W. Anderson den Nobelpreis für Physik „für die grundlegenden theoretischen Leistungen
zur Elektronenstruktur in magnetischen und ungeordneten Systemen“.
674 12 Magnetismus
ℱ = U − TS . (12.3.9)
Sie eignet sich besonders zur Beschreibung von Prozessen, die bei konstanter Temperatur
(also isotherm) ablaufen. Mit dU = TdS − pdV − V M ⋅ dBext erhalten wir das totale Diffe-
rential der freien Energie zu
Wir sehen, dass F = W + ∫T12 SdT. Das heißt, dass bei einem isothermen Prozess die Ände-
T
rung der freien Energie gleich der dem System bei reversibler Prozessführung entnomme-
nen bzw. zugeführten Arbeit (mechanisch, magnetisch, etc.) ist. Isotherme Prozessführun-
gen, bei denen ein System mit seiner Umgebung nur Wärme, aber keine Arbeit austauschen
kann, streben also nach einem Minimum der freien Energie, das heißt, gleichzeitig nach
minimaler innerer Energie und maximaler Entropie.
Betrachten wir einen Prozess, bei dem dT = 0 und dV = 0, so gilt19
1 ∂ℱ
Mi = − ( ) (12.3.11)
V ∂B ext,i V ,T
∂M i µ0 ∂2 ℱ
χ i j = µ0 ( ) =− ( ) . (12.3.12)
∂B ext,j V ,T V ∂B ext,i ∂B ext,j V ,T
Aus dieser Definition ergibt sich sofort eine Messvorschrift für die Magnetisierung. Bringen
wir einen Festkörper in einen Feldgradienten, so können wir schreiben:
∂ℱ ∂B ext ∂B ext
= dx = −V M dx . (12.3.13)
∂B ext ∂x ∂x
19
Prozesse mit dV = 0 sind experimentell oft schwierig zu realisieren. Deshalb ist es manchmal
zweckmäßiger, die freie Enthalpie (auch Gibbs Potenzial genannt, da diese Größe von J. W. Gibbs
im Jahr 1875 eingeführt wurde)
𝒢 = U − T S + pV − V M ⋅ Bext
zu betrachten, deren totales Differential gegeben ist durch
d𝒢 = dU − SdT − TdS + pdV + Vd p − V M ⋅ dBext − V Bext ⋅ dM
= −SdT + Vd p − V M ⋅ dBext .
Betrachten wir jetzt einen Prozess, der bei konstanter Temperatur und konstantem Druck
abläuft, was experimentell leichter zu realisieren ist, so ist M = − V1 ( ∂B∂𝒢ext ) p,T und χ i j =
∂2 𝒢
− µV0 ( ∂B ext,i ) . Wir werden im Folgenden trotzdem die freie Energie benutzen.
∂B ext,j p,T
12.3 Atomarer Dia- und Paramagnetismus 675
1 ∂ℱ ∂B ext
f =− =M , (12.3.14)
V ∂x ∂x
die auf den Festkörper in dem Feldgradienten wirkt. Diese Kraft ist direkt proportional zur
Magnetisierung und zum Feldgradienten. Auf ihr beruht das Prinzip der Faraday-Waage, bei
der ein Festkörper in ein Magnetfeld gebracht wird, dem ein Feldgradient überlagert ist. Man
misst dann die Auslenkung der Probe aus seiner Ruhelage durch die in dem Feldgradienten
wirkende Kraft.
Um die freie Energie bei einer endlichen Temperatur T zu bestimmen, müssen wir die Wahr-
scheinlichkeiten p n , mit der Zustände der Energie E n besetzt sind, verwenden. Sie sind ge-
geben durch
e−E n ⇑k B T e−E n ⇑k B T
pn = = , (12.3.15)
∑ e−E n ⇑k B T Z
n
Hierbei ist
die Zustandssumme und β ≡ 1⇑k B T. Es gilt ferner ∑n p n = 1. Für die mittlere Energie ∐︀Ẽ︀
erhalten wir damit
∑ E n e−E n ⇑k B T
∂Z⇑∂β ∂ ln Z
∐︀Ẽ︀ = =− =−
n
. (12.3.17)
∑ e−E n ⇑k B T Z ∂β
n
S̃ = −k B ∑ p n ln p n , (12.3.18)
n
wobei das Minuszeichen aus der Tatsache folgt, dass p n < 1. Unter Benutzung von (12.3.15)
erhalten wir daraus
−E n ⇑k B T
S̃ = −k B ∑
e En
]︀− − ln Z{︀ (12.3.19)
n Z kB T
und damit
∐︀Ẽ︀
S̃ = k B ln Z + . (12.3.20)
T
Wir betrachten nun ein System aus N unabhängigen unterscheidbaren Teilchen. Ihre innere
Energie U und Entropie S können wir schreiben als
U = N∐︀Ẽ︀ S = N S̃ . (12.3.21)
676 12 Magnetismus
und somit
ℱ = −N k B T ln Z = −k B T ln Z N . (12.3.23)
1 ∂ℱ N k B T ∂ ln Z
Mi = − ( ) = ( ) (12.3.24)
V ∂B ext,i T,V V ∂B ext,i T,V
und
∂M i µ0 ∂2 ℱ
χ i j = µ0 =− ( )
∂B ext,j V ∂B ext,i ∂B ext,j T,V
µ0 ∂ 2 ln Z
=− N kB T ( ) (12.3.25)
V ∂B ext,i ∂B ext,j T,V
sowie
∂ℱ ∂ ln Z
S = −( ) = N k B ln Z + N k B T ( ) . (12.3.26)
∂T V ,B ∂T V ,B
12.3.3 Larmor-Diamagnetismus
Der Larmor-Diamagnetismus tritt in Isolatoren auf, deren Atome oder Ionen im Grundzu-
stand ⋃︀0̃︀ vollkommen gefüllte Elektronenschalen haben, so dass L = S = J = 0 gilt. In diesem
Fall müssen wir nur den 3. Term in (12.3.8) betrachten. Da eine vollkommen gefüllte Elek-
tronenschale kugelsymmetrisch ist, können wir ferner ∐︀0⋃︀x i2 ⋃︀0̃︀ = ∐︀0⋃︀y 2i ⋃︀0̃︀ = 13 ∐︀0⋃︀r 2i ⋃︀0̃︀ setzen
und erhalten damit
µ0 ∂2 ℱ e2 N
χ dia = − ( 2 ) = −µ 0 ∑∐︀n⋃︀r i ⋃︀ñ︀ .
2
(12.3.27)
V ∂B ext V ,T 6m V i
Hierbei ist N⇑V die Anzahl der Atome bzw. Ionen pro Volumeneinheit. Wir sehen,
dass χ dia < 0 und unabhängig von der Temperatur ist. Da der Beitrag der Elektronen in
den äußersten Schalen aufgrund des größten r i dominiert, kann die Summe ∑ i ∐︀0⋃︀r 2i ⋃︀0̃︀
üblicherweise gut durch Z a r 2a angenähert werden, wobei Z a die Zahl der Elektronen in der
äußersten Schale und r a der Atom- bzw. Ionenradius ist. Wir erhalten dann
e2 N
χ dia ≃ −µ 0 Z a r 2a . (12.3.28)
6m V
Wir können das Ergebnis (12.3.28) näherungsweise auch mit Hilfe der klassischen
Physik ableiten, indem wir überlegen, zu welchem Kreisstrom I die Elektronen der
12.3 Atomarer Dia- und Paramagnetismus 677
Za e2
µ=I⋅A=− B ext ∐︀r 2a ̃︀ . (12.3.31)
6m
und damit die Zusatzenergie
Za e2 2 2
∆E = −µB ext = B ∐︀r ̃︀ . (12.3.32)
6m ext a
Durch zweimaliges Ableiten nach dem äußeren Feld und Multiplikation mit der Dichte N⇑V
der Atome erhalten wir dann bis auf einen Faktor zwei das Ergebnis (12.3.28) für die Sus-
zeptibilität.
Häufig werden auch die magnetische Massensuszeptibilität und die molare magnetische Sus-
zeptibilität benutzt. Die Massensuszeptibilität χmass
dia bezeichnet die Suszeptibilität pro Dichte
χ dia
dia =
χmass (12.3.33)
ρ
I-
Xe
Cs+
Br-
Kr
m /mol)
K+ Ar
F-
3
10
-11
Ne
Na+
- dia (10
Abb. 12.5: Molare diamagnetische
Suszeptibilität von Atomen und Io-
mol
nen mit abgeschlossener Elektro- He
nenschale aufgetragen gegen Z a r 2a .
Die Suszeptibilität eines Gases oder Li+
1
Festkörpers, der aus diesen Ato-
men oder Ionen zusammenge-
setzt ist, erhält man, indem man 1 10
mit ρ⇑M mol in mol/cm3 multipliziert. Zar2a (Å2)
25
sehr große Kernladungszahlen Z erhält man zuerst eine Kopplung von ℓ i und s i zu j i , die
dann erst zu einem Gesamtdrehimpuls J koppeln ( j j-Kopplung). Dies kommt durch eine
starke Spin-Bahn-Wechselwirkung (siehe Abschnitt 12.5.4) zustande.
Bei der Berechnung des zum Gesamtdrehimpuls J gehörenden magnetischen Moments µ J ist
zu beachten, dass die beteiligten g-Faktoren der Bahn- und Spin-Anteile verschieden groß
sind. Wir müssen deshalb einen von den Quantenzahlen L, S und J abhängigen g-Faktor
(Russel-Saunders-Kopplung)
J(J + 1) + S(S + 1) − L(L + 1)
gJ = 1 + (12.3.36)
2J(J + 1)
verwenden, welcher als Landéscher g-Faktor bezeichnet wird. Wir erhalten für das Gesamt-
moment
J
µ J = −g J µ B ∐︀J2 ̃︀ = J(J + 1)ħ 2 . (12.3.37)
ħ
Ferner ergibt sich für den Betrag des Gesamtmoments
⌈︂
µ J = g J µ B J(J + 1) = µ B p (12.3.38)
und für seine z-Komponente
µ z = −g J µ B m J . (12.3.39)
Pm3+ [Xe]4f4 ↑ ↑ ↑ ↑ 2 6 4 5I
4 2.68 --
Eu3+ [Xe]4f6 ↑ ↑ ↑ ↑ ↑ ↑ 3 3 0 7F
0 0 3.4
Gd3+ [Xe]4f7 ↑ ↑ ↑ ↑ ↑ ↑ ↑ 7/2 0 7/2 8S
7/2 7.94 8.0
Tb3+ [Xe]4f8 ↑↓ ↑ ↑ ↑ ↑ ↑ ↑ 3 3 6 7F
6 9.72 9.5
Lu3+ [Xe]4f14 ↑↓ ↑↓ ↑↓ ↑↓ ↑↓ ↑↓ ↑↓ 0 0 0 1S
0 0 0
einen m s = − 12 Zustand besetzen. Die 2. Hundsche Regel erfordert ferner, dass dabei das
Elektron in einen Zustand mit möglichst großer Quantenzahl m ℓ eingebaut wird, so dass
die Gesamtbahndrehimpulsquantenzahl L = ∑ i m ℓ i maximal wird. Das heißt, m ℓ = 3. Wir
erhalten insgesamt somit S = 3, L = 3 und J = 6. In spektroskopischer Notation 2S+1 L J ergibt
sich damit der Zustand 7 F6 .
Die Konfigurationen der anderen Ionen ergeben sich entsprechend und sind in Tabelle 12.1
zusammengestellt. Wir sehen, dass die effektive Magnetonenzahl, die wir aus der mit Hilfe
der Hundschen Regeln bestimmten Grundzustandskonfiguration berechnet haben, in den
meisten Fällen sehr gut mit dem experimentellen Wert übereinstimmt. Eine Ausnahme bil-
den Eu3+ und Sm3+ . Hier ist die Aufspaltung des LS-Multipletts so gering, dass bereits bei
Raumtemperatur höhere Multiplettniveaus besetzt sind und deshalb der aus der Grundzu-
standskonfiguration berechnete Wert eine schlechte Übereinstimmung ergibt.
12.3.4.3 Übergangsmetalle
Bei den 3d-Übergangsmetallen liegt die nicht abgeschlossene 3d-Schale ganz außen. Im
Gegensatz zu den 4 f -Elektronen der Seltenen Erden, die sich tief in den Atomrümpfen
aufhalten und durch die äußeren Elektronen abgeschirmt werden, sind die Elektronen der
3d-Schale somit den starken elektrischen Feldern der Nachbarionen ausgesetzt. Das resul-
tierende inhomogene elektrische Feld wird Kristallfeld genannt. Hierdurch kommt es zu
einer weitgehenden Entkopplung der mit den Quantenzahlen L und S verknüpften Bahn-
und Spin-Momente (die Kristallfeldaufspaltung ist wesentlich größer als die Spin-Bahn-
12.3 Atomarer Dia- und Paramagnetismus 683
Tabelle 12.2: Grundzustandskonfiguration und effektive Magnetonenzahl p einiger Ionen der 3d-
Übergangsmetalle.
Kopplung). Als Folge davon verliert die Quantenzahl J ihre Bedeutung. Im inhomogenen
Kristallfeld bleibt zwar der Betrag des Bahndrehimpulses erhalten, seine z-Komponente ist
aber keine Konstante der Bewegung mehr. Ihr zeitlicher Mittelwert und damit der Beitrag
der Bahnbewegung zum magnetischen Moment verschwindet. Gleichzeitig wird die Ent-
artung der reinen Bahndrehimpulszustände durch das Kristallfeld aufgehoben. Es entsteht
ein so genanntes Kristallfeld-Multiplett, auf das wir hier nicht näher eingehen wollen.22 Ist
der Grundzustand eines Kristallfeld-Multipletts ein Zustand mit der Orientierungsquanten-
zahl m ℓ = 0, d. h. ein so genanntes Kramers-Singulett,23 so ist überhaupt keine Spin-Bahn-
Wechselwirkung vorhanden und der Spin kann sich völlig frei nach dem äußeren Feld aus-
richten. Man spricht hier von einer Auslöschung der Bahnmomente. Die effektive Magneto-
nenzahl wird in diesem Fall durch
⌈︂
p = g s S(S + 1) (12.3.42)
mit g s ≃ 2 gegeben, sie ist also allein durch die Spin-Beiträge gegeben. Ist der Grund-
zustand dagegen ein Zustand mit m ℓ ≠ 0 (Kramers-Multiplett), so führt die jetzt noch
immer vorhandene Spin-Bahn-Kopplung zu einer effektiven Magnetonenzahl, die von der
durch (12.3.42) gegebenen abweicht. In Tabelle 12.2 sind die nach (12.3.40) und (12.3.42)
berechneten Magnetonenzahlen von Übergangsmetallionen mit den experimentellen Wer-
ten verglichen. Wir sehen, dass der experimentelle Wert in den meisten Fällen ganz gut mit
dem nach Gleichung (12.3.42) berechneten Wert übereinstimmt.
22
siehe z. B. Quantentheorie des Magnetismus I+II, W. Nolting, Teubner, Stuttgart (1986).
23
Hendrik Anthony Kramers, niederländischer Physiker, geboren am 17. Dezember 1894 in Rotter-
dam, gestorben am 24. April 1952 in Oegstgesst.
684 12 Magnetismus
12.3.5 Langevin-Paramagnetismus
Wir betrachten jetzt die Magnetisierung und magnetische Suszeptibilität eines Systems aus
Atomen mit J ≠ 0. In diesem Fall dominiert der 1. Term in (12.3.8) und wir können die
beiden weiteren Terme vernachlässigen.
Das mittlere magnetische Moment ∐︀µ z ̃︀ in Richtung des angelegten Feldes (z-Richtung), das
wir in einem Experiment messen, müssen wir mit Hilfe einer statistischen Betrachtung er-
mitteln. Es ist gegeben durch
1
∐︀µ z ̃︀ = ∫ µ cos θ p θ dΩ , (12.3.44)
4π
wobei dΩ für das Raumwinkelelement steht und
𝝁
𝝁 𝐜𝐨𝐬 𝛉
θ 𝐝𝛉
Hierbei ist C die Curie-Konstante. Die molare Suszeptibilität erhalten wir, indem wir
in (12.3.52) n durch die Avogadro-Konstante N A ersetzen.
Hierbei haben wir das effektive magnetische Moment µ eff = 12 g J µ B verwendet. Für den Mit-
telwert von m J erhalten wir
+1⇑2
∑ m J e−m J g J µ B B ext ⇑k B T
m J =−1⇑2
∐︀m J ̃︀ = . (12.3.54)
+1⇑2
∑ e−m J g J µ B B ext ⇑k B T
m J =−1⇑2
M µ eff B ext
= tanh ( ). (12.3.56)
Ms kB T
25
Wir verwenden tanh x = (ex − e−x )⇑(ex + e−x ).
12.3 Atomarer Dia- und Paramagnetismus 687
Für µ eff B ext ⇑k B T ≪ 1 können wir die Näherung tanh x ≃ x verwenden und erhalten wie-
derum das Curie-Gesetz
2
∂M µ 0 nµ eff C
χ = µ0 ( ) = = . (12.3.57)
∂B ext T,V kB T T
Wir erhalten also einen zur klassischen Ableitung sehr ähnlichen Ausdruck. Für Elektronen
mit L = 0 und S = 1⇑2 ist µ eff = 12 g s µ B ≃ µ B , da g s ≃ 2. Die molare Suszeptibilität erhalten
wir wiederum, indem wir in (12.3.57) n durch die Avogadro-Konstante N A ersetzen.
wobei Z = ∑m J e−m J x die Zustandssumme ist und x = g J µ B B ext ⇑k B T. Für die Magnetisie-
rung erhalten wir
N g J µ B ∂Z ∂B ext
M=− g J µ B ∐︀m J ̃︀ = n
V Z ∂B ext ∂x
∂ ln Z
= nk B T . (12.3.59)
∂B ext
Mit der Zustandssumme
sinh(︀(2J + 1) x2 ⌋︀
Z= (12.3.60)
sinh x2
g J µ B B ext
y = xJ = J (12.3.61)
kB T
M s = ng J µ B J (12.3.62)
erhalten wir
M 2J + 1 2J + 1 1 1
= B J (y) = coth ( y) − coth ( y) . (12.3.63)
Ms 2J 2J 2J 2J
Hierbei ist B J die Brillouin-Funktion, die in Abb. 12.7 zusammen mit dem klassischen Aus-
druck gezeigt ist. Gleichung (12.3.52) ist ein Spezialfall von (12.3.63) für J = 12 .
688 12 Magnetismus
Brillouin-Funktionen
1.0
𝑱 = 𝟏/𝟐
1
0.8 3/2
2
5
0.6 Langevin-Funktion
M / Ms
0.4
Abb. 12.7: Normierte Magne-
tisierung M⇑M s als Funktion
von g J µ B JB ext ⇑k B T für verschie- 0.2
dene Werte von J. Eingezeichnet
ist ferner das klassische Ergebnis 0.0
(Langevin-Funktion), das eine Nä- 0 1 2 3 4 5
herung für den Fall J ≫ 1 darstellt. gJ B JBext / kBT
Für y > 1 nähert sich die Brillouin-Funktion ihrem Sättigungswert an. Dies ist anschaulich 33
klar, da für große Werte von y alle magnetischen Momente in Richtung des angelegten Fel-
des ausgerichtet werden können. Für y ≪ 1 können wir wiederum die Näherung coth y ≃
+ 3 − . . . verwenden und erhalten B J (y) ≃ J+1 y = J+1
1 y
y 3J 3
x. Das heißt, die Brillouin-Funkti-
on nimmt linear mit y zu. Für die Suszeptibilität ergibt sich
∂M µ 0 nJ(J + 1)g J2 µ B2 C
χ = µ0 ( ) = = (12.3.64)
∂B ext T,V 3k B T T
∐︀n⋃︀(⧹︂
Lz + g s ⧹︂
µ B B ext
Ψ0′ = Ψ0 + Sz )⋃︀0̃︀Ψn (12.3.66)
E n − E0
und für den angeregten Zustand erhalten wir
Lz + g s ⧹︂
∐︀0⋃︀(⧹︂
µ B B ext
Ψn′ = Ψn − Sz )⋃︀ñ︀Ψ0 . (12.3.67)
E n − E0
Die zugehörigen magnetischen Momente sind
µ B ′ ⧹︂ 2µ 2 B ext
∐︀0 ⋃︀(Lz + g s ⧹︂
Sz )⋃︀0′ ̃︀ ≃ 2 B ⋃︀∐︀n⋃︀(⧹︂
Lz + g s ⧹︂
Sz )⋃︀0̃︀⋃︀2 (12.3.68)
ħ ħ (E n − E 0 )
und
µ B ′ ⧹︂ 2µ 2 B ext
∐︀n ⋃︀(Lz + g s ⧹︂
Sz )⋃︀n′ ̃︀ ≃ − 2 B ⋃︀∐︀n⋃︀(⧹︂
Lz + g s ⧹︂
Sz )⋃︀0̃︀⋃︀2 (12.3.69)
ħ ħ (E n − E 0 )
2nµ B2 B ext
⋂︀∐︀n⋃︀(⧹︂
Lz + g s ⧹︂
2
M= Sz )⋃︀0̃︀⋂︀ (12.3.70)
E n − E0
und die Suszeptibilität
2nµ 0 µ B2
⋂︀∐︀n⋃︀(⧹︂
Lz + g s ⧹︂
2
χ= Sz )⋃︀0̃︀⋂︀ . (12.3.71)
E n − E0
Dieser temperaturunabhängige paramagnetische Beitrag zur Suszeptibilität wird als Van
Vleck Beitrag bezeichnet.
wurde ursprünglich von Peter Debye26 und W. F. Giauque27 vorgeschlagen. Heute werden
zum Erreichen von Temperaturen bis etwa 10 mK überwiegend kontinuierlich arbeitende
Kühlverfahren wie 3 He/4 He-Mischkühler verwendet.
Um das physikalische Prinzip der adiabatischen Entmagnetisierung zu verstehen, müssen
wir die Entropie S des Systems betrachten. Nach (12.3.10) gilt
∂F ∂F dβ
S = −( ) = −( ) . (12.3.72)
∂T V ,B ∂β dT V ,B
∂F
S = kB β2 ( ) . (12.3.73)
∂β V ,B
N N m J =+J
F=− ln Z = − ln ∑ e−m J g J µ B B ext β
β β m J =−J
N m J =+J +µ J B ext β
=− ln ∑ e , (12.3.74)
β m J =−J
∂F N N ∂
= − (− 2 ln Z + ln Z) , (12.3.75)
∂β β β ∂β
Mit ∂β∂
ln Z = ∐︀µ J ̃︀B ext = −∐︀Ẽ︀ erhalten wir schließlich [vergleiche hierzu (12.3.17) und
(12.3.20)]
Die Entropie ist also nur eine Funktion der Größe βB ext = B ext ⇑k B T. Die Änderung der
Entropie als Funktion des Magnetfeldes und der Temperatur können wir anhand von
Abb. 12.8 verstehen:
1. T = const:
Für B ext = 0 sind die 2J + 1 möglichen Zustände alle entartet und die Gesamtzahl der
Zustände, die das System einnehmen kann, ist (2J + 1) N [N Spins auf (2J + 1) Zustände].
Für die Entropie folgt dann
S = N k B ln(2J + 1) . (12.3.77)
26
P. Debye, Einige Bemerkungen zur Magnetisierung bei tiefer Temperatur, Ann. Physik 81, 1154
(1926).
27
W. F. Giauque, A Thermodynamic Treatment of Certain Magnetic Effects: A Proposed Method of Pro-
ducing Temperatures Considerably Below 1 K, J. Am. Chem. Soc. 49, 1864 (1927).
12.3 Atomarer Dia- und Paramagnetismus 691
2. S = const:
Schalten wir das Magnetfeld bei konstanter Entropie aus (isentropische oder adiabatische
Entmagnetisierung), so muss die mittlere Zahl der dem System zugänglichen Zustände
konstant bleiben. Da die Aufspaltung der Zustände aber mit kleiner werdendem Feld ab-
nimmt, muss in gleicher Weise die Temperatur abnehmen. Da die Entropie eine Funktion
von βB ext ist, muss für β = const auch βB ext = const gelten. Daraus folgt wiederum, dass
bei einer isentropischen Änderung folgende Beziehung zwischen der Anfangstempera-
tur Ti und der Endtemperatur T f gelten muss:
Bi B f
= (12.3.78)
Ti T f
bzw.
Bf
T f = Ti . (12.3.79)
Bi
Die prinzipielle Funktionsweise des Verfahrens ist in Abb. 12.9 veranschaulicht. Wir küh-
len das paramagnetische Salz zunächst auf eine Temperatur Ti von etwa 1 K ab. Danach
wird das Magnetfeld bei gutem Wärmekontakt mit der Wärmesenke angeschaltet. Durch
das Anschalten des Magnetfeldes wird die Entropie verringert, da die Zahl der möglichen
Zustände wesentlich verringert wird. Die an die Wärmesenke abgegebene Wärmemenge
ist ∆Q = Ti ∆S.28 Nachdem das Magnetfeld seinen Höchstwert erreicht hat, entkoppeln wir
das paramagnetische Salz von der Wärmesenke und schalten das Feld langsam aus. Dabei
kühlt sich das System auf die Temperatur T f ab.
Die erreichbare Endtemperatur hängt von dem Feld B f ab, das nach Abschalten des äußeren
Feldes in der Probe wirkt. Dieses ist aufgrund der endlichen Wechselwirkung der magne-
tischen Momente natürlich immer endlich. Da die Wechselwirkungen der Kernmomente
28 ∂S B B
Es gilt ∆Q = Ti ∫0 ( ∂B )T dB = Ti ∫0 ( ∂M ) dB, wobei wir die Maxwell-Beziehung ( ∂B
∂T B
∂S
)T =
∂M C ∂M
( ∂T )B benutzt haben. Mit M = T B folgt dann ( ∂T )B < 0, das heißt ∆Q < 0. Wir haben es also
wirklich mit einer Wärmeabgabe zu tun.
692 12 Magnetismus
(a) 𝑺
Abb. 12.9: Entropie für ein Spin-1/2- 𝑺 = 𝑵𝒌𝐁 𝐥𝐧 𝟐𝑱 + 𝟏
𝚫𝑸 > 𝟎
System als Funktion der Tempera-
𝑩 = 𝑩𝒇
tur für zwei Magnetfelder B i ≫ B f . (a)
𝑻𝒊
Links ist der schematische Aufbau
eines Systems zur Kühlung mittels 𝑩𝒊 (b)
adiabatischer Entmagnetisierung (b)
gezeigt. In (a) ist das paramagneti-
𝚫𝑸 = 𝟎 𝑩 = 𝑩𝒊
sche Salz über einen Wärmeschal-
ter an eine Wärmesenke angekop-
pelt. In (b) ist der Wärmeschal- 𝑻𝒇
ter geöffnet, so dass bei ∆Q⇑T =
∆S = 0 entmagnetisiert wird. 𝑩𝒇 𝑻𝒇 𝑻𝒊 𝑻
35
wesentliche schwächer sind als diejenigen der elektronischen Momente, kann man mit Kern-
entmagnetisierungsstufen wesentlich niedrigere Temperaturen erreichen. Die ersten Expe-
rimente hierzu wurden von N. Kurti und Mitarbeitern durchgeführt.29 Sie erreichten durch
Abkühlen der Kernspins in Cu eine Endtemperatur von 1.2 µK. Der derzeitige Rekord für
die Spin-Temperatur ist 2.8 pK in Rhodium.30
Elektronen innerhalb der Fermi-Kugel gegenüber dem feldfreien Zustand abgeändert. Die-
se Umbesetzung hängt vom Durchmesser der Landau-Zylinder und damit von der Größe
des Magnetfeldes ab und führt zum so genannten Landau-Diamagnetismus der Leitungs-
elektronen.
Gegenüber unserer Diskussion in Abschnitt 9.10, wo wir nur den Bahnanteil betrachtet ha-
ben, haben wir in Gleichung (12.4.1) jetzt noch als 3. Term den Beitrag addiert, der aus
dem mit dem Elektronenspin verknüpften magnetischen Moment µ s = −g s µ B m s ≃ ∓µ B re-
sultiert (g s ≃ 2, m s = ± 12 ). Wir sehen, dass dieser Term die Energie der Elektronen je nach
Spin-Richtung erniedrigt oder erhöht. Dieser Term führt zum so genannten Pauli-Parama-
gnetismus der Leitungselektronen.
12.4.1 Pauli-Paramagnetismus
Wir betrachten zunächst nur den Spin-Beitrag. Das mit dem Spin verknüpfte magnetische
Moment eines Kristallelektrons kann in Feldrichtung nur die beiden Werte
µ s = −g s µ B m s = ∓µ B (12.4.2)
M = (n+ − n− )µ B , (12.4.3)
wenn n+ die Dichte der Elektronen mit µ s in Feldrichtung und n− die Dichte mit µ s entge-
gen der Feldrichtung ist. Bei einer naiven Betrachtung würden wir ein ähnliches Ergebnis
erwarten wie für ein atomares Spin-1/2-System, das heißt M = C⇑T. Im Experiment wird
allerdings ein temperaturunabhängiger Beitrag gemessen. Die Ursache dafür ist die Fermi-
Statistik der Leitungselektronen. Da µ B B ext ⇑k B ≃ 1 K bei B ext ≃ 1 T, gilt für Metalle bei nicht
allzu tiefen Temperaturen µ B B ext ⇑k B ≪ T ≪ TF , wobei TF = E F ⇑k B die Fermi-Temperatur
ist. Es können deshalb nur wenige Elektronen in einem Energieintervall um die Fermi-
Energie ihren Spin ändern. Ihren Anteil können wir grob mit k B T⇑E F = T⇑TF angeben, wes-
halb sich gerade ein temperaturunabhängiger Beitrag CT ⋅ TTF ergibt.
Wir machen jetzt eine genauere Betrachtung anhand von Abb. 12.10. Schalten wir das äuße-
re Magnetfeld ein, so erhalten wir eine energetische Verschiebung der Elektronen mit ent-
gegengesetzter Richtung ihrer Spins bzw. der damit verbundenen magnetischen Momente.
Da die Elektronen untereinander im thermischen Gleichgewicht sind, muss das chemische
(a) 𝑬 (b) 𝟏 E
𝑫 𝑬𝐅
𝟐
𝑬𝐅
Abb. 12.10: Zur Erklärung des Pau-
lischen Paramagnetismus. Die Pfeile
deuten die Richtung der magnetischen
Momente der Elektronen an. Man
beachte, dass die Richtung des ma-
𝝁𝐁 𝑩𝐞𝐱𝐭
gnetischen Moments für Elektronen
𝑫 𝑬 𝑫 𝑬 antiparallel zur Spin-Richtung ist.
694 12 Magnetismus
Potenzial waagrecht verlaufen. Das heißt, wir erhalten im Magnetfeld einen Überschuss an
Elektronen mit magnetischen Momenten parallel zum angelegten Feld. Die Größenverhält-
nisse in Abb. 12.10 sind allerdings nicht richtig wiedergegeben. Die Energie µ B B ext beträgt
bei einem Feld von 1 T weniger als 0.1 meV und ist deshalb verschwindend klein gegenüber
der Fermi-Energie von typischerweise einigen eV.
12.4 Para- und Diamagnetismus von Metallen 695
Für die Dichten n+ und n− der Elektronen mit magnetischen Momenten parallel und anti-
parallel zur Feldrichtung können wir allgemein schreiben
∞
1
n+ = ∫ D(E + µ B B ext ) f (E)dE (12.4.4)
2V
0
∞
1
n− = ∫ D(E − µ B B ext ) f (E)dE , (12.4.5)
2V
0
Für niedrige Temperaturen können wir die Näherung −∂ f ⇑∂E ≃ δ(E − E F ) verwenden und
erhalten
µ B2 B ext
M= D(E F ) . (12.4.7)
V
Mit der Zustandsdichte des freien Elektronengases [vergleiche (7.1.18)]
V 2m 3⇑2 1⇑2 3 nV
D (E F ) = ( ) EF = (12.4.8)
2π 2 ħ 2 2 k B TF
erhalten wir
3nµ B2 B ext
M= (12.4.9)
2k B TF
und damit die temperaturunabhängige Paulische Spin-Suszeptibilität
∂M D(E F ) 3µ 0 µ B2
χP = µ0 ( ) = µ 0 µ B2 =n = const . (12.4.10)
∂B ext T,V V 2k B TF
Vergleichen wir dieses Ergebnis mit dem für ein Spin-1⇑2-System aus gebundenen Elektro-
nen, so sehen wir, dass der wesentliche Unterschied gerade ein Faktor T⇑TF ist. Dieser be-
rücksichtigt, dass für das Fermi-Gas freier Elektronen nur ein geringer Bruchteil T⇑TF der
Elektronen zur Suszeptibilität beitragen kann.
696 12 Magnetismus
Für höhere Temperaturen wird die Näherung −∂ f ⇑∂E ≃ δ(E − E F ) schlechter. Allerdings
sind die Korrekturen zum Ergebnis (12.4.10) sehr gering.31 Der Paramagnetismus der Lei-
tungselektronen ist also praktisch unabhängig von der Temperatur. Im Experiment stellt
man fest, dass Übergangsmetalle eine hohe Paulische Spin-Suszeptibilität besitzen. Dies liegt
hauptsächlich an der hohen Zustandsdichte der Übergangsmetalle, die sich z.B. durch Mes-
sung der spezifischen Wärme des Elektronengases bestimmen lässt.
12.4.2 Landau-Diamagnetismus
Wir haben bisher nur den Spin-Beitrag der Leitungselektronen diskutiert. Um den orbitalen
Beitrag zu bestimmen, müssen wir die Gesamtenergie der Leitungselektronen als Funktion
des angelegten Magnetfeldes berechnen. Dies haben wir in Abschnitt 9.10 bereits getan und
gesehen, dass die freie Energie ℱ und damit die Magnetisierung M = −(1⇑V )(∂ℱ⇑∂B ext )T,V
für tiefe Temperaturen und reine Proben (ħω c ≫ k B T, ω c τ ≫ 1) eine oszillierende Funktion
von B ext ist. Bei höheren Temperaturen und üblichen Proben sind diese Bedingungen zwar
nicht erfüllt, trotzdem mittelt sich die Magnetfeldabhängigkeit von ℱ nicht heraus und wir
erhalten deshalb nach wie vor eine endliche Magnetisierung. Es kann gezeigt werden, dass
diese Magnetisierung antiparallel zu B ext ist. Der Einfluss des äußeren Feldes auf die Orbi-
talbewegung der Elektronen führt zum Landauschen Diamagnetismus.
Es kann gezeigt werden, dass die mit dem Landauschen Diamagnetismus verbundene Sus-
zeptibilität für ein freies Elektronengas dem Betrag nach genau ein Drittel der paramagne-
tischen Suszeptibilität nach Gleichung (12.4.10) beträgt:
χ L = − 13 χ P . (12.4.11)
Für das Elektronengas erhalten wir dann insgesamt eine paramagnetische Suszeptibilität von
µ 0 µ B2
χ = χP + χL = n . (12.4.12)
k B TF
Setzen wir charakteristische Zahlenwerte für die Elektronendichte n und die Fermi-Tempe-
ratur TF von Metallen ein, so sehen wir, dass χ in der Größenordnung 10−6 liegt. Größere
Werte treten bei einigen Übergangsmetallen auf, die wie bereits erwähnt eine sehr hohe Zu-
standsdichte D(E F ) am Fermi-Niveau besitzen.
Bei der bisher geführten Diskussion sind wir von freien Elektronen ausgegangen. Für Kris-
tallelektronen gibt es durch die Wechselwirkung mit dem periodischen Potenzial des Gitters
Abweichungen. Das Verhältnis von χ P und χ L ist hier nicht exakt 3:1. Die Abweichung von
diesem Wert wird um so größer, je größer die effektive Masse m∗ der Leitungselektronen
wird, wobei in etwa
1 m 2
χL = − χP ( ∗ ) (12.4.13)
3 m
2
31 π2
Im Rahmen einer Sommerfeld-Entwicklung erhalten wir χ P (T) = χ P (0) ]︀1 − 12
( TTF ) + . . .{︀. Da
bei Raumtemperatur T⇑TF ≃ 0.01 ist der Korrekturfaktor verschwindend klein.
12.5 Kooperativer Magnetismus 697
gilt. Weitere Abweichungen entstehen durch Wechselwirkungen unter den Elektronen, die
meist zu einer Erhöhung der Paulischen Spinsuszeptibilität führen und mit einem so ge-
nannten Austauschparameter berücksichtigt werden können.
Die gesamte, in einem Experiment gemessene Suszeptibilität ergibt sich schließlich aus der-
jenigen der freien und gebundenen Elektronen. Die Atomrümpfe der Metallionen haben
häufig eine geschlossenene Elektronenschale, so dass der Anteil der gebundenen Elektronen
rein diamagnetisch ist. Der Gesamtbeitrag der Leitungselektronen ist dagegen paramagne-
tisch. Da beide Beiträge in der gleichen Größenordnung liegen, können Metalle aber sowohl
dia- als auch paramagnetisch sein. Alkalimetalle sind z. B. mit Ausnahme von Cs alle para-
magnetisch. Edelmetalle wie Cu, Ag und Au sind dagegen diamagnetisch.
relationen und somit Mehrelektronenaspekte eine entscheidende Rolle spielen. Wir werden
im Folgenden wie bei der Diskussion des Dia- und Paramagnetismus wiederum zwischen
der Austauschwechselwirkung von lokalisierten Elektronen (Abschnitt 12.5.2) und deloka-
lisierten Elektronen in einem freien Elektronengas (Abschnitt 12.5.6.2) unterscheiden. Da-
bei können wir aufgrund der Komplexität des Problems nur die Grundzüge behandeln.
Zusätzlich werden wir kurz die Dzyaloshinskii-Moriya Wechselwirkung (Abschnitt 12.5.3),
die Spin-Bahn-Wechselwirkung (Abschnitt 12.5.4) und die Zeeman-Wechselwirkung (Ab-
schnitt 12.5.5) diskutieren.
12.5.1 Dipol-Dipol-Wechselwirkung
Wenn wir mögliche Wechselwirkungen diskutieren, die zu einer Kopplung der magneti-
schen Momente führen, müssen wir zunächst die Dipol-Dipol-Wechselwirkung betrachten.
Diese ist gegeben durch
µ 1 ⋅ µ 2 − 3(µ 1 ⋅⧹︂
r)(µ 2 ⋅⧹︂
r)
E dd = µ 0 3
. (12.5.1)
r
Hierbei ist ⧹︂
r der Einheitsvektor in Richtung des Verbindungs-
vektors der beiden magnetischen Momente µ 1 und µ 2 an den
Orten r1 und r2 . Setzen wir µ 1 ≃ µ 2 ≃ µ B und r ≃ 2 Å ein, so erhal-
𝝁𝟏 𝝁𝟐
ten wir eine maximale Wechselwirkungsenergie in der Größenord- 𝒓ො
nung von weniger als 0.1 meV, die wesentlich kleiner als die ther-
mische Energie k B T ≃ 25 meV bei Raumtemperatur ist. Das heißt,
dass die Dipol-Dipol-Wechselwirkung viel zu schwach ist, um die
für manche Materialien auch bei Temperaturen weit oberhalb von Abb. 12.11: Zur dipo-
Raumtemperatur beobachtete magnetische Kopplung zu erklären. laren Wechselwirkung
zwischen zwei magne-
tischen Momenten.
12.5.2 Austauschwechselwirkung
zwischen lokalisierten Elektronen
Wir diskutieren in diesem Abschnitt zunächst die Wechselwirkung zwischen den magne-
tischen Momenten lokalisierter Elektronen. Dabei betrachten wir Paarwechselwirkungen
zwischen lokalisierten Momenten, die durch unterschiedliche Austauschwechselwirkungs-
arten (siehe Abschnitt 12.5.2.3) vermittelt werden. Wir werden erst später in Abschnitt 12.5.6
die bekannten metallischen Ferromagnete wie Fe oder Ni behandeln, bei denen wir es mit
der Austauschwechselwirkung zwischen itineranten Leitungselektronen zu tun haben. Da-
bei versagt der auf Paarwechselwirkungen basierende Ansatz. Wir müssen dort vielmehr das
kollektive Verhalten aller Leitungselektronen diskutieren. Die Austauschwechselwirkung
zwischen lokalisierten Elektronen haben wir bei der Diskussion der kovalenten Bindung
in Abschnitt 3.4 ausführlich diskutiert. Qualitativ kann die physikalische Ursache der
Austauschwechselwirkung auf die Coulomb-Wechselwirkung in Verbindung mit der Hei-
senbergschen Unschärferelation und dem Paulischen Ausschließungsprinzip zurückgeführt
werden.
12.5 Kooperativer Magnetismus 699
𝒑𝒙
Betrachten wir z. B. zwei Elektronen an benachbar-
ten Gitterplätzen, so könnten wir aufgrund der Hei-
senbergschen Unschärfe-Beziehung ∆p ⋅ ∆x ≥ ħ de-
ren kinetische Energie p2 ⇑2m ∼ ħ 2 ⇑2m e (∆x)2 er-
𝜟𝒑𝒙
niedrigen, wenn wir die Ortsunschärfe ∆x erhö- 𝒙
hen, also die Elektronen delokalisieren und quasi
auf beide Gitterplätze verteilen. Allerdings verbie-
tet das Pauli-Prinzip, dass wir zwei Elektronen im
gleichen Quantenzustand am gleichen Ort haben.
Dies können wir dadurch vermeiden, dass wir für die 𝜟𝒙
Zweielektronen-Wellenfunktion eine symmetrische
Ortsfunktion und eine antisymmetrische Spin-Funktion verwenden. Für den antisymme-
trischen Spin-Singulett-Zustand haben die beiden Elektronen entgegengesetzten Spin und
können sich somit auf die beiden Gitterplätze verteilen ohne das Pauli-Prinzip zu verlet-
zen. Ferner ergibt sich für die symmetrische Ortsfunktion eine erhöhte Ladungsdichte ge-
nau zwischen den positiv geladenen Gitteratomen, was zu einer Reduzierung der Coulomb-
Abstoßung führt. Der Zustand mit antiparalleler Spin-Stellung (Spin-Singulett-Zustand) der
Elektronen ist also in diesem Beispiel energetisch wesentlich günstiger als der Zustand mit
paralleler Spinstellung (Spin-Triplett-Zustand). Allgemein können wir sagen, dass die Ge-
samtwellenfunktion der Elektronen (Fermionen) antisymmetrisch sein muss und damit eine
symmetrische Ortsfunktion eine antisymmetrische Spin-Funktion und umgekehrt bedingt.
Da aber die elektrostatische Wechselwirkung von der Ortsfunktion bestimmt wird, hängt
diese auch von der Spin-Funktion ab.
Um den Energieunterschied zwischen Spin-Singulett-Zustand (symmetrische Ortsfunkti-
on Ψ s ) und dem Spin-Triplett-Zustand (antisymmetrische Ortsfunktion Ψ a ) näher zu ana-
lysieren, verwenden wir den bereits in Abschnitt 3.4.2 beschriebenen Ansatz von Heitler
und London
wobei das Pluszeichen für die symmetrische (s) und das Minuszeichen für die antisymmetri-
sche (a) Ortswellenfunktion steht, c eine Normierungskonstante ist und ϕ A und ϕ B die ato-
maren Wellenfunktionen sind. Mit diesem Ansatz können wir die potenzielle Energie des
Grundzustandes berechnen. Dabei gehen wir davon aus, dass das Potenzial V (r1 , r2 ), das
sowohl die Wechselwirkung der Elektronen mit den Ionen als auch zwischen den Elektro-
nen beschreibt, symmetrisch bezüglich des Austausches der Elektronen ist, d. h. V (r1 , r2 ) =
V (r2 , r1 ). Wir erhalten damit
s,a
E pot = 2c 2 ∫ ϕ∗A (r1 )ϕ∗B (r2 )V (r1 , r2 )ϕ A (r1 )ϕ B (r2 )dV1 dV2
± 2c 2 ∫ ϕ∗A (r1 )ϕ∗B (r2 )V (r1 , r2 )ϕ B (r1 )ϕ A (r2 )dV1 dV2 , (12.5.3)
wobei das Pluszeichen in der zweiten Zeile für den Singulett- und das Minuszeichen für
den Triplett-Zustand gilt. Da sich die kinetische Energie der beiden Zustände kaum unter-
scheidet, ergibt sich die Differenz E s − E a der Energieeigenwerte im Wesentlichen aus der
700 12 Magnetismus
J A = E s − E a ≃ 4c 2 ∫ ϕ∗A (r1 )ϕ∗B (r2 )V (r1 , r2 )ϕ B (r1 )ϕ A (r2 )dV1 dV2 . (12.5.4)
Hierbei haben wir für die Energiedifferenz die Austauschkonstante J A eingeführt, deren
Größe und Vorzeichen von der speziellen Form der Wellenfunktionen und des Potenzials
abhängt. Abhängig vom Vorzeichen von J A ist eine parallele oder antiparallele Orientierung
der Spins energetisch günstiger. Da J A > 0 gleichbedeutend mit E s > E a ist, erhalten wir
Wie wir in Abschnitt 3.4 bereits gezeigt haben, ist die Austauschenergie z. B. für ein Was-
serstoffmolekül immer negativ, d. h. der symmetrische Spin-Singulett-Zustand besitzt die
niedrigere Energie. Für andere Systeme kann dies auch umgekehrt sein.
Das Potenzial V (r1 , r2 ) können wir in drei Anteile Vi (r1 ) + Vi (r2 ) + Ve e (r1 , r2 ) zerlegen,
wobei die beiden ersten Terme die Wechselwirkung der Elektronen mit den Ionen und der
letzte Term die gegenseitige Wechselwirkung der Elektronen beschreibt. Da Ve e (r1 , r2 ) =
e 2 ⇑4πє 0 ⋃︀r1 − r2 ⋃︀, bewirkt die Coulomb-Wechselwirkung zwischen den Elektronen immer
einen positiven Beitrag zur Austauschkonstanten und damit eine parallele Ausrichtung der
Elektronenspins. Die Wechselwirkung der Elektronen mit den Ionen ist dagegen attraktiv
und bewirkt einen negativen Beitrag zu J A . Sie führt deshalb zu einer Energieabsenkung bei
antiparalleler Ausrichtung der Spins. Welches Vorzeichen letztendlich J A besitzt, hängt von
der relativen Größe der entgegengesetzt wirkenden Beiträge ab.
12.5.2.1 Heisenberg-Modell
Aufgrund des Pauli-Prinzips sind mit den symmetrischen und antisymmetrischen
Ortswellenfunktionen in eindeutiger Weise antisymmetrische und symmetrische Spin-
Wellenfunktionen verknüpft. Mit Hilfe der Austauschkonstante J A können wir dann formal,
ohne auf die Details der Austauschwechselwirkung einzugehen, einen Modell-Hamilton-
Operator einführen, der nur auf die Spin-Funktionen wirkt und die gleiche energetische
Aufspaltung zwischen den beiden Energieniveaus für parallele und antiparallele Spin-
Stellung bewirkt.34 Bezeichnen wir die Spin-Operatoren der beiden Elektronen mit s1
und s2 , so gilt für den Gesamtspin S2 = (s1 + s2 )2 = 23 ħ 2 + 2s1 ⋅ s2 .35 Es lässt sich leicht
zeigen, dass der Operator s1 ⋅ s2 die Eigenwerte − 34 ħ 2 für den Singulett- und + 14 ħ 2 für den
Triplett-Zustand besitzt.36 Damit können wir den Spin-Hamilton-Operator schreiben als
1 1 1 1
ℋspin = (E s + 3E a ) − (E s − E a ) 2 s1 ⋅ s2 = (E s + 3E a ) − J A 2 s1 ⋅ s2 . (12.5.6)
4 ħ 4 ħ
Setzen wir die Eigenwerte des Operators s1 ⋅ s2 ein, so sehen wir sofort, dass dieser Ope-
rator in der Tat die Eigenwerte E s und E a für den Singulett- und Triplett-Zustand ergibt.
Der Term 14 (E s + 3E a ) führt nur zu einer Verschiebung des Energienullpunkts und kann
weggelassen werden. Wir erhalten dann den Modell-Hamilton-Operator zu
1
ℋ A = −J A s1 ⋅ s2 , (12.5.7)
ħ2
der die Paarwechselwirkung zwischen den beiden Spins s1 und s2 angibt. Unsere Vorgehens-
weise lässt sich auf beliebige Spin-Operatoren S i und S j auf den Gitterplätzen i und j und un-
ij
terschiedliche Austauschkonstanten J A erweitern. Um die gesamte Wechselwirkungsenergie
34
Ein Beweis für diese Aussage kann gefunden werden in Quantum Theory of Magnetism,
R. M. White, Springer Ser. Solid-State Sci., Vol. 32, Springer, Berlin, Heidelberg (1983), oder in
The Theory of Magnetism I and II, D. C. Mattis, Springer, Berlin, Heidelberg (1988).
35
Es gilt (s1 + s2 )2 = s21 + s22 + 2s1 ⋅ s2 = 34 ħ 2 + 34 ħ 2 + 2s1 ⋅ s2 = 32 ħ 2 + 2s1 ⋅ s2 .
36
Es gilt (s1 + s2 )2 = s21 + s22 + 2s1 ⋅ s2 und damit s1 ⋅ s2 = 21 )︀(s1 + s2 )2 − s21 − s22 ⌈︀. Für s1 ∥ s2 folgt
daraus s1 ⋅ s2 = 12 )︀2ħ 2 − 34 ħ 2 − 34 ħ 2 ⌈︀ = 14 ħ 2 . Für s1 ∥ −s2 folgt daraus s1 ⋅ s2 = 12 )︀0 − 34 ħ 2 − 34 ħ 2 ⌈︀ =
− 34 ħ 2 .
702 12 Magnetismus
1
ℋA = − ∑ J A Si ⋅ S j .
ij
(12.5.8)
j≠i,i> j ħ2
Die Summation erfolgt dabei über alle Atome i und alle Nachbarn j, wobei die Einschrän-
kung i > j verhindert, dass Paare doppelt gezählt werden.37 Gleichung (12.5.8) ist der Aus-
gangspunkt zahlreicher theoretischer Modelle. Wichtig ist, dass in diese Modelle nur die
paarweise Wechselwirkung zwischen Elektronen eingeht.
Beim Ising-Modell wird also die Zahl der Spin-Komponenten auf eins reduziert (d. h. pa-
rallel oder antiparallel zu einer ausgezeichneten Quantisierungsachse, in unserem Fall zur
z-Achse).
12.5.2.2 Hubbard-Modell
Im Heisenberg-Modell wird der effektive Hamilton-Operator explizit durch die Spin-Opera-
toren ausgedrückt. Im Hubbard-Modell wird dieser dagegen anders formuliert (vergleiche
hierzu Abschnitt 8.3.2). Der Spin wird hier nicht explizit benutzt, obwohl er bei der Be-
rechnung von Matrixelementen berücksichtigt wird. Die zentrale Idee ist zu untersuchen,
inwieweit das Wechselspiel zweier konkurrierender Energien den elektronischen Zustand
eines mehratomigen Mehrelektronensystems bestimmt. Die eine Energie ist die elektrostati-
sche Coulomb-Wechselwirkung zwischen Elektronen, die andere die kinetische Energie der
Elektronen. Die Minimierung der Coulomb-Energie U führt zu einem möglichst großen
Abstand der Elektronen und damit einer Lokalisierung der Elektronen auf den Gitterplät-
zen. Die Reduzierung der kinetischen Energie erfordert eine Delokalisierung der Elektronen
und damit ein Hüpfen zwischen den einzelnen Gitterplätzen, das mit der Hüpfenergie t cha-
rakterisiert wird. Da die Reduzierung der kinetischen Energie umso größer ist je größer t,
gilt ∆E kin ∝ −t. Der Spin kommt dadurch ins Spiel, dass beim Hüpfen der Elektronen das
Pauli-Prinzip beachtet werden muss. Unter Berücksichtigung dieser beiden Energien erhal-
ten wir den Hubbard-Hamilton-Operator zu
N
ℋHubbard = −t ∑ (c †i,σ c j,σ + c †j,σ c i,σ ) + ∑ Un i,↑ n i,↓ . (12.5.10)
∐︀i, j̃︀,σ i
37
Wird die Einschränkung i > j weggelassen, so muss ein Faktor 1⇑2 vor der Summe zugefügt wer-
den.
38
Ernst Ising, deutscher Mathematiker und Physiker, geboren am 10. Mai 1900 in Köln; gestorben
am 11. Mai 1998 in Peoria, Illinois, USA.
12.5 Kooperativer Magnetismus 703
Hierbei bezeichnet ∑∐︀i, j̃︀ die Summation über nächste Nachbarn und σ =↓, ↑. Die Opera-
toren c †i,σ (c i,σ ) erzeugen (vernichten) dabei ein Elektron mit Spin σ am Gitterplatz i. Der
Operator n i,σ = c †i,σ c i,σ ist der Teilchenzahloperator, der die Besetzung auf Platz i angibt. Der
erste Term in (12.5.10) beschreibt das Hüpfen von Elektronen von Gitterplatz zu Gitterplatz
ohne Änderung des Spins, da jeweils ein Elektron mit Spin σ auf einem Platz erzeugt und
auf dem anderen vernichtet wird. Der zweite Term beschreibt die Coulomb-Wechselwirkung
von Elektronen mit entgegengesetztem Spin auf dem gleichen Gitterplatz.
Die Analyse von (12.5.10) für t, U > 0 zeigt sofort, dass für U ≫ t die Elektronen nach Mög-
lichkeit eine Doppelbesetzung von Gitterplätzen vermeiden wollen. In diesem Fall werden
die Elektronen auf den einzelnen Gitterplätzen lokalisiert, wobei die verbleibende endliche
Hüpfamplitude in einer antiferromagnetischen Ausrichtung der Elektronenspins resultiert
und für die Austauschkonstante J A = −4t 2 ⇑U gilt. Wir erhalten also einen antiferromagne-
tischen Isolator. Für t ≫ U verhindert das im Vergleich zur Hüpfenergie kleine U jetzt nicht
eine Delokalisierung der Elektronen. Wir erhalten einen nichtmagnetischen metallischen
Zustand.
12.5.2.3 Austauschwechselwirkungsarten
Die Austauschkonstante J A hängt von der Überlappung der Elektronenwellenfunktionen der
beteiligten Gitteratome ab. Dabei muss die Überlappung der Elektronenhüllen der Gitter-
atome mit magnetischen Momenten nicht direkt sein, sondern kann auch über dazwischen
liegende Atome vermittelt werden. Man unterscheidet folgende Wechselwirkungstypen:
(a) (d)
1
(b)
0
JA
-1
0 4 8 12 16 20
Mn2+ O2- Mn2+ O2- Mn2+ 2kFr
(c)
Entscheidend beim Superaustausch ist, dass ein Elektron, das vom Sauerstoffion zum Mn-
Ion hüpft, dort eine stark erhöhte Coulomb-Energie besitzt. Es muss sozusagen für den Ver-
such, durch Hüpfen zum Nachbaratom, also durch Delokalisieren seine kinetische Energie
zu reduzieren, eine hohe Coulomb-Energie U bezahlen. Ein realer Hüpfprozess ist deswe-
gen energetisch verboten, er kann aber virtuell innerhalb der Energie-Zeit-Unschärferela-
tion trotzdem stattfinden. Mit Störungsrechnug 2. Ordnung kann man zeigen, dass die ef-
fektive Austauschkonstante J A ∝ −t 2 ⇑U ist, wobei t die Hüpfwahrscheinlichkeit zwischen
Sauerstoff- und Manganion angibt. Es ist anschaulich klar, dass der Hüpfprozess der beiden
Elektronen mit antiparallelem Spin im Sauerstoff 2p-Orbital nur dann zu beiden Nachbar-
Manganionen stattfinden kann, wenn diese antiparallel ausgerichtete Momente haben.
42
C. Zener, Interaction between the d-Shells in the Transition Metals. II. Ferromagnetic Compounds of
Manganese with Perovskite Structure, Phys. Rev. 82, 403–405 (1951).
12.5 Kooperativer Magnetismus 705
der Doppelaustausch zwischen den Mn3+ - und Mn4+ -Ionen zu einer parallelen Ausrichtung
der Mn-Momente. Bei antiparalleler Ausrichtung könnte nämlich vom linken Manganion
kein Spin-↑-Elektron nachhüpfen, da dort dann ja nur Spin-↓-Elektronen vorhanden wären.
ℋDM = D i j ⋅ (S i × S j ) . (12.5.11)
Hierbei ist D i j ein zeitunabhängiger aber möglicherweise räumlich inhomogener Vektor, der
die Wechselwirkung zwischen den beiden Spins S i und S j beschreibt.
Wir machen nun einige einfache Symmetriebetrachtungen, um uns klar zu machen, unter
welchen Bedingungen dieser Term auftreten kann. Hierzu müssen wir alle Symmetrieope-
rationen in Betracht ziehen, die in Abb. 12.13 den Mittelpunkt M auf der Verbindungslinie
der beiden Spins fest lassen. Der Hamilton-Operator des Systems und insbesondere der DM-
Term müssen unter diesen Symmetrieoperationen unverändert bleiben. In Abb. 12.13a liegt
das rote Atom (z.B. ein Sauerstoffatom, das eine Austauschwechselwirkung zwischen den
beiden Spins vermittelt) genau im Mittelpunkt M, so dass ein Inversionszentrum vorliegt.
43
M. A. Ruderman and C. Kittel, Indirect Exchange Coupling of Nuclear Magnetic Moments by Con-
duction Electrons, Phys. Rev. 96, 99 (1954).
44
T. Kasuya, A Theory of Metallic Ferro- and Antiferromagnetism on Zener’s Model, Prog. Theor.
Phys. 16, 45–57 (1956).
45
K. Yosida, Magnetic Properties of Cu-Mn Alloys, Phys. Rev. 106, 893 (1957).
46
I. E. Dzyaloshinskii, Thermodynamic theory of weak ferromagnetism in antiferromagnetic substan-
ces, Sov. Phys. JETP 5, 1259 (1957).
47
T. Moriya, Anisotropic superexchange interaction and weak ferromagnetism, Phys. Rev. 120, 91-98
(1960).
706 12 Magnetismus
(a) 𝑰
𝑴
Abb. 12.13: Zur Veranschaulichung der
Dzyaloshinskii-Moriya Wechselwirkung. In 𝑺𝒊 𝑫𝒊𝒋 𝑺𝒋 𝑧
(a) liegt das rote Atom im Mittelpunkt M der 𝑦
Verbindungslinie der beiden Spins, so dass ein (b)
𝑥
Inversionszentrum vorliegt. In (b) liegt kein
Inversionszentrum mehr vor und C 2 ist eine 𝑴
zweifache Drehachse, die senkrecht auf der Ver- 𝑫𝒊𝒋
bindungslinie zwischen den beiden Spins steht. 𝑺𝒊 𝑪𝟐 𝑺𝒋
Durch eine Inversionsoperation werden die beiden Spins zwar ausgetauscht, bleiben aber
ansonsten gleich (Spins sind Pseudovektoren). Das heißt, wir erhalten
Si × S j → S j × S i = −S i × S j .
Inversion
(12.5.12)
Wir sehen sofort, dass ℋDM unter der Symmetrieoperation der Inversion nur dann unverän-
dert bleibt, wenn D i j = 0. Eine endliche DM-Wechselwirkung erfordert also eine gebrochene
Inversionssymmetrie.
Wir betrachten nun ein System mit gebrochener Inversionssymmetrie (siehe Abb. 12.13b).
Um etwas über die Richtung von D i j aussagen zu können, betrachten wir eine zweifache
Drehachse C 2 durch M, die senkrecht auf der Verbindungslinie steht. Führen wir die Sym-
metrieoperation aus, so transformieren sich die Komponenten der Spins wie
C2 C2 C2
S i,x → −S j,x S i, y → −S j, y S i,z → +S j,z (12.5.13)
und wir erhalten
ℋDM = D i j,x (S i, y S j,z − S i,z S j, y ) + D i j, y (S i,z S j,x − S i,x S j,z )
+ D i j,z (S i,x S j, y − S i, y S j,x ) . (12.5.14)
Mit (12.5.13) folgt sofort, dass der 3. Term unter C 2 sein Vorzeichen ändert, während die bei-
den anderen Terme gleich bleiben. Das bedeutet, dass ℋDM unter C 2 nur dann unverändert
bleibt, wenn D i j,z = 0. Folglich muss der Vektor D i j in der Ebene senkrecht zur Drehachse
C 2 liegen. Um die Richtung innerhalb der Ebene zu bestimmen, müssten wir eine weiter-
führende Symmetriebetrachtung machen, auf die wir hier aber verzichten wollen.
Aus der Form (12.5.11) der DM-Wechselwirkung können wir folgern, dass diese versucht,
die beiden Spins aus einer kollinearen Anordnung herauszukippen, da ihr Beitrag ansons-
ten verschwindet. Optimal wäre eine rechtwinklige Anordnung der Spins, wobei diese dann
in einer Ebene liegen sollten, die senkrecht auf D i j steht. In Antiferromagneten führt eine
endliche DM-Wechselwirkung zu einer Verkantung der Spins, d. h. einer Verdrehung der
Spins aus ihrer antiparallelen Stellung. Dadurch entsteht ein schwaches ferromagnetisches
Moment, welches senkrecht auf der Spin-Achse des Antiferromagneten steht. In einer Kette
von parallel (ferromagnetisch) angeordneten Spins würde die DM-Wechselwirkung je nach
Richtung von D i j in einer helikalen oder zykloidalen Spin-Anordnung resultieren, wobei
der Drehsinn durch das Vorzeichen von D i j gegeben ist. Wir weisen abschließend darauf
hin, dass die Inversionssymmetrie immer an Oberflächen und Grenzflächen gebrochen ist,
weshalb die DM-Wechselwirkung für die Spin-Ordnung an Ober- und Grenzflächen oft eine
wichtige Rolle spielt.
12.5 Kooperativer Magnetismus 707
12.5.4 Spin-Bahn-Wechselwirkung
Die Spin-Bahn-Wechselwirkung verursacht eine Kopplung zwischen dem Spin s und Bahn-
drehimpuls ℓ eines Elektrons zu einem Gesamtdrehimpuls j = ℓ + s. Die Spin-Bahn-Wech-
selwirkung ist typischerweise um den Faktor 10 bis 100 kleiner als die Austauschkopplung,
die wir in Abschnitt 12.5.2 diskutiert haben. Trotzdem spielt sie für die magnetischen Ei-
genschaften von Festkörpern eine wichtige Rolle. Wir werden sie hier zuerst anhand einer
semiklassischen Betrachtung einführen (siehe hierzu Abb. 12.14). Wir stellen uns dazu vor,
dass der im Ruhesystem des Elektrons um dieses kreisende Kern mit Ladung Ze einen Kreis-
strom I verursacht, der ein Magnetfeld Borb = (µ 0 I⇑2r)⧹︂
n im Zentrum der Kreisbahn erzeugt
(der Einheitsvektor ⧹︂
n steht senkrecht auf der von der Kreisbahn umschlossenen Fläche).
Die Wechselwirkungsenergie zwischen dem Spin-Moment µ s = −g s µ B s⇑ħ des Elektrons und
diesem Feld können wir schreiben als
Ze 2
E so = −µ s ⋅ Borb = ℓ⋅s. (12.5.17)
4πє 0 m 2e c 2 r 3
Für µ s ≃ µ B erhalten wir E so ≃ 5.788 × 10−5 eV⋅B orb [T]. Da die gemessenen Werte von E so
im Bereich zwischen 10 und 100 meV liegen, sind die effektiven Felder B orb beträchtlich.
𝒔
𝑰 𝜃
ℓ, 𝝁ℓ
𝑩𝐨𝐫𝐛
𝒓 Abb. 12.14: Zur Veranschaulichung der physikalischen Ursache
der Spin-Bahn-Wechselwirkung. Im Ruhesystem des Elektrons
𝒆− bewegt sich der Kern mit Ladung Ze um das Elektron und ver-
ursacht an dessen Position ein Magnetfeld Borb , das mit dem
Spin-Moment µ s des Elektrons wechselwirkt. Den Kreisstrom
können wir mit einem magnetischen Moment µ ℓ und dieses
wiederum mit einem Bahndrehimpuls ℓ assoziieren, so dass wir
𝝁𝒔 𝒁𝒆 die Spin-Bahn-Wechselwirkung als λℓ ⋅ s schreiben können.
resultiert, wobei E(r, t) = −∇ϕ el (r, t). Den Operator für die Spin-Bahn-Wechselwirkung
erhalten wir, indem wir die Wechselwirkung dieses Feldes mit dem Spin-Moment µ s =
−g s µ B s⇑ħ = −(e⇑m e )s eines Elektrons betrachten. Mit ∇ϕ el (r) = (r⇑r)dϕ el (r)⇑dr für ein
Zentralpotenzial und (r × p) = ℓ erhalten wir
e e 1 dϕ el (r)
ℋso = 2 2
s ⋅ (p × ∇ϕ el ) = ℓ ⋅ s = λ(r)ℓ ⋅ s . (12.5.19)
2m e c 2m 2e c 2 r dr
gegeben und hängt von den Quantenzahlen n und l der jeweiligen radialen Wellenfunk-
tion der Elektronenzustände ab. Verwenden wir ϕ el (r) = Ze⇑4πє 0 r, so erhalten wir λ(r) =
Ze 2 ⇑8πє 0 m 2e c 2 r 3 . Dieser Wert weicht vom klassisch ermittelten Wert um den so genannten
Thomas-Faktor 2 ab.48 Wichtig ist, dass die Spin-Bahn-Wechselwirkungsstärke proportional
zum Gradienten dϕ el ⇑dr des Coulomb-Potenzials ist, welcher für große Kernladungszah-
len besonders groß ist. Im Rahmen des Bohrschen Atommodells gilt ∐︀r̃︀ = n 2 aZB (n: Haupt-
quantenzahl, a B : Bohrscher Radius). Daher ist λ am größten für die innerste Bohrsche Bahn
(n = 1). Insgesamt wächst die Aufspaltung durch die Spin-Bahn-Kopplung mit steigender
Ordnungszahl Z also wie Z 4 an.49
Gemäß der Definition der magnetostatischen Energie E = −µ ⋅ Bext eines magnetischen Mo-
ments µ in einem externen Feld Bext entspricht die Energie E so = −µ s ⋅ Borb dem Energiege-
winn, den wir erhalten, wenn wir den Spin s von einer zu ℓ senkrechten in eine zu ℓ parallelen
Stellung bringen. Da das Bahnmoment häufig eine bestimmte kristallographische Richtung
bevorzugt, wird sich auch der Spin s parallel zu dieser Vorzugsrichtung einstellen wollen.
Die Spin-Bahn-Wechselwirkung bewirkt somit eine magnetokristalline Anisotropie, auf die
wir in Abschnitt 12.7.2 noch eingehen werden. Die magnetokristalline Anisotropie ist von
enormer Bedeutung für technische Anwendungen, da sie eine Vorzugsrichtung für die Ma-
gnetisierung festlegt und verhindert, dass die Magnetisierung ohne Energieaufwand in eine
andere Richtung gedreht werden kann.
12.5.4.1 Rashba-Effekt
Eine interessante Manifestation der Spin-Bahn-Kopplung ist der Rashba-Effekt50 , 51 in
zweidimensionalen (2D) Elektronengasen (vergleiche Abschnitt 7.4). Entscheidend für das
Auftreten des Rashba-Effekts ist das Vorliegen einer gebrochenen Inversionssymmetrie.
Ein zweidimensionales Elektronengas, wie es zum Beispiel in Halbleiter-Heterostrukturen
auftritt, ist innerhalb der Bandverbiegungszone lokalisiert. Diese Bandverbiegung ent-
spricht einem Potenzialgradienten, der senkrecht zur Grenzfläche ausgerichtet ist. Er führt
zu einer Inversionsasymmetrie (wir sprechen hier von einer senkrechten strukturellen
Inversionsasymmetrie, SIA) und resultiert im so genannten Rashba-Beitrag zur Spin-Bahn-
Kopplung. Es ist bekannt, dass bei gleichzeitigem Vorliegen von Inversionssymmetrie
[E(k ↑) = E(−k ↑)] und Zeitumkehrsymmetrie [Kramers-Entartung: E(k ↑) = E(−k ↓)]
eine Entartung E(k ↑) = E(k ↓) der beiden Spin-Zustände vorliegt. Der Rashba-Effekt hebt
diese Entartung auf, was durch Messung des de Haas-van Alphen-Effekts nachgewiesen wer-
den kann. Er führt damit zu spinpolarisierten elektronischen Zuständen. Wir weisen aber
darauf hin, dass für inversionsasymmetrische Systeme bei gegebener Zeitumkehrsymmetrie
(B = 0) nach wie vor eine Kramers-Entartung vorliegt (siehe Abb. 12.16).
Die Brechung der Inversionssysmmetrie kann außer durch eine strukturelle Inversionasym-
metrie (SIA) auch durch eine gitterbedingte Asymmetrie (BIA: bulk inversion asymmetry)
oder eine grenzflächenbedingte Asymmetrie (IIA: interface inversion asymmetry) verur-
sacht werden. Die BIA ist unabhängig von jeglichen makroskopischen elektrischen Feldern
und tritt in Kristallstrukturen ohne Inversionszentrum wie z. B. in der Zinkblendestruktur
(GaAs, InSb, Hgx Cd1−x Te) auf. Sie führt z. B. zur Dresselhaus-Spin-Bahn-Kopplung,52 auf
die wir hier nicht eingehen wollen.
Wir diskutieren im Folgenden kurz den Rashba-Effekt für ein isotropes zweidimensionales
Elektronengas. Der Gradient des Potenzials senkrecht zur Bewegungsebene (x y-Ebene) des
Elektronensystems entspricht einem elektrischen Feld E. Nach (12.5.18) resultiert dieses in
einem effektiven Magnetfeld B∗ im Ruhesystem des Elektrons, welches wiederum in einer
Aufspaltung
e
E so = −µ s ⋅ B∗ = − (v × E) ⋅ s . (12.5.21)
2m e c 2
50
E. I. Rashba, Properties of Semiconductors with an Extremum Loop. 1. Cyclotron and Combinational
Resonance in a Magnetic Field Perpendicular to the Plane of the Loop, Sov. Phys. Solid State. 20,
1109-1122 (1960).
51
Roland Winkler, Spin–Orbit Coupling Effects in Two-Dimensional Electron and Hole Systems, Sprin-
ger Verlag, Berlin (2003).
52
G. Dresselhaus, Spin-Orbit Coupling Effects in Zinc Blende Structures, Phys. Rev. 100, 580-586
(1955).
710 12 Magnetismus
𝑘𝑦
𝑘𝑥
Abb. 12.16: Dispersionsrelation eines 2D-Elektronengases mit endlicher Rashba-Kopplung, die zu ei-
ner Aufspaltung von Zuständen mit entgegengesetzter tangentialer Spin-Richtung führt (blauer und
roter Paraboloid). Rechts ist ein Schnitt für E(k) = const. gezeigt. Die Spin-Richtung (rote und blaue
Pfeile) stehen jeweils senkrecht auf dem k-Vektor (braune Pfeile), sind aber für die beiden Paraboloide
74
resultiert, wobei µ s = −g s µ B s⇑ħ = −(e⇑m e )s das Spin-Moment des Elektrons ist. Wir kön-
nen deshalb den Hamilton-Operator für den Rashba-Effekt allgemein schreiben als
ℋRashba = α (⧹︂
E × k) ⋅ σ , (12.5.22)
wobei k = mv⇑ħ, ⧹︂ E der Einheitsvektor in Feldrichtung und σ = (σx , σ y , σz ) der Vektor der
Pauli-Matrizen ist. Die Stärke des Rashba-Effekts wird durch den Rashba-Parameter α =
eE⇑2m 2e c 2 quantifiziert.
In der Dispersionsrelation des 2D-Elektronengases (siehe Abb. 12.16) äußert sich der
Rashba-Effekt in einer gegenseitigen Verschiebung der zunächst für beide Spin-Richtungen
entarteten Bandparabeln. Die Impulsverteilung für konstante Energie besteht aus konzentri-
schen Kreisen. Die Spin-Polarisation dieser beiden elektronischen Zustände ist vollständig
(100%) und tangential ausgerichtet (innerhalb der x y-Ebene und senkrecht zur Ausbrei-
tungsrichtung). Aufgrund der Zeitumkehrsymmetrie bleibt das System nichtmagnetisch.
Ähnliche Effekte wie in Halbleiter-Heterostrukturen erwarten wir für Metalloberflächen.
Dabei übernehmen Oberflächenzustände die Rolle des zweidimensionalen Elektronengases.
Unter Oberflächenzuständen verstehen wir elektronische Zustände, die auf wenige Atom-
schichten an der Probenoberfläche lokalisiert sind. Der Potenzialgradient wird durch die
Oberflächenbarriere zum Vakuum, das so genannte Bildladungspotenzial, erzeugt. Der dar-
aus resultierende Rashba-Effekt führt zu einer spinpolarisierten, aufgespaltenen Oberflä-
chenbandstruktur.
12.5.5 Zeeman-Wechselwirkung
Als weitere magnetische Wechselwirkung betrachten wir die Zeeman-Wechselwirkung von
magnetischen Momenten mit einem äußeren Magnetfeld. Der Wechselwirkungsoperator ist
12.5 Kooperativer Magnetismus 711
gegeben durch
ℋZeeman = −µ ⋅ Bext . (12.5.23)
Die Wechselwirkungsenergie entspricht derjenigen eines magnetischen Dipols mit einem
externen Magnetfeld. Falls die Spin-Bahn-Kopplung klein gegen die Zeeman-Energie ist,
können wir ungekoppelte Spin- und Bahnmomente betrachten und erhalten
µB µB
ℋZeeman = g L L ⋅ Bext + g S S ⋅ Bext . (12.5.24)
ħ ħ
Falls die Spin-Bahn-Kopplung groß gegen die Zeeman-Energie ist, können wir gekoppelte
Spin- und Bahnmomente, J = L + S, betrachten und erhalten
µB
ℋZeeman = g J J ⋅ Bext . (12.5.25)
ħ
Wir weisen ferner darauf hin, dass in die Zeeman-Wechselwirkung nur reale Magnetfel-
der eingehen und keine fiktiven Austausch- oder Molekularfelder (vergleiche hierzu Ab-
schnitt 12.6.2.1). Letztere wirken nur auf das Spin-Moment, während reale Felder sowohl
auf das Spin- als auch das Bahnmoment wirken.
Die Zeeman-Wechselwirkung hat eine große Bedeutung für Ferromagnete. Wir werden spä-
ter sehen, dass in Ferromagneten die spontane Magnetisierung üblicherweise in so genann-
te Domänen zerfällt, in denen die Magnetisierung unterschiedlich orientiert ist und die
durch Domänenwände getrennt sind. Beim Anlegen eines externen Magnetfeldes führt die
Zeeman-Energie zu einem Ausrichten der Magnetisierung in den Domänen parallel zur
Feldrichtung und zu einer Verschiebung von Domänenwänden. Diese Prozesse bestimmen
zusammen mit der magnetokristallinen Anisotropie die Form der gemessenen M(B ext )-
Hysteresekurven (vergleiche Abschnitte 12.7.2 und 12.8.5).
Hierbei ist n↑ = n⇑2 die Dichte der Spin-↑-Elektronen. Statt von der Wahrscheinlichkeit P
können wir auch von einer effektiven Elektronendichte ρ sprechen, die auf das Spin-↑-
Elektron wirkt:
en
ρ(r) = (︀1 − cos(k i − k j ) ⋅ r⌋︀
2
)︀ [︀
en ⌉︀
⌉︀ 1 1 +ı(k i −k j )⋅r −ı(k i −k j )⋅r ⌉︀
⌉︀
= ⌋︀1 − 2 ∫ d 3
k i∫ d 3
k (e + e )⌈︀
2 ⌉︀ ⌉︀
j
⌉︀
]︀ )︀ 4
3
πk F
3 ⌈︀ 2 ⌉︀
⌊︀
)︀
⌉︀ [︀
⌉︀
en ⌉︀ 1 ⌉︀
= ⌋︀1 − ∫ d 3 k i e ık i ⋅r i ∫ d 3 k j e ık j ⋅r j ⌈︀ . (12.5.29)
⌉︀
2 ⌉︀ )︀ 43 πk F3 ⌈︀
2 ⌉︀
⌉︀
]︀ ⌊︀
Lösen des Integrals ergibt
Die gesamte Ladungsdichte, die von dem Spin-↑-Elektron gesehen wird, setzt sich
aus (12.5.30) und der homogenen Dichte e2n der Spin-↓-Elektronen zusammen. Wir
12.5 Kooperativer Magnetismus 713
1.0
0.8
eff / en
Diese Ladungsdichte ist in Abb. 12.17 gezeigt. Wir sehen, dass in der unmittelbaren Um-
gebung eines Elektrons die Ladungsdichte aufgrund der Austauschwechselwirkung redu-
ziert ist. Wir sprechen von einem „Austauschloch“. Die räumliche Ausdehnung dieses Aus-
tauschlochs beträgt etwa 2⇑k F ∼ 1 − 2 Å.53
Um abzuleiten, ob durch die Austauscheffekte im Elektronengas eine parallele oder anti-
parallele Spin-Orientierung bevorzugt wird, müssen wir eine energetische Betrachtung ma-
chen. Wenn das Austauschloch die Energie des Systems verringert, werden alle Elektronen
versuchen hiervon Gebrauch zu machen und ihre Spins in eine Richtung zu stellen. Falls
das Austauschloch die Energie erhöhen sollte, werden die Elektronen die Energie dadurch
minimieren, dass sie ihre Spins antiparallel stellen. Die Energie des Austauschlochs besteht
aus zwei Beiträgen, der Coulomb-Energie und der kinetischen Energie. Auf der einen Seite
erfolgt durch das Austauschloch eine Energieabsenkung aufgrund der verringerten Abschir-
mung der Ionenrümpfe. Auf der anderen Seite lokalisieren wir das Elektron im Austausch-
loch, was aufgrund der Unschärferelation zu einer Erhöhung der kinetischen Energie führt.
Da der Radius des Austauschlochs etwa 1⇑k F beträgt, können wir δ p ∼ ħ⇑∆x ∼ ħk F schrei-
ben und erhalten die Erhöhung der kinetischen Energie zu ∆E kin ∼ δ p2 ⇑2m∗ ∝ k F2 ⇑m∗ . Um
die Erhöhung der kinetischen Energie klein zu halten, brauchen wir also eine große effektive
Masse und einen kleinen Fermi-Wellenvektor, d. h. eine niedrige Elektronendichte. Die Ab-
senkung der Coulomb-Energie geht proportional zum inversen Radius des Austauschlochs,
also proportional zu k F . Wir stellen also insgesamt fest, dass es vorteilhaft für die Elektro-
nen ist, ihre Spins parallel auszurichten, wenn die effektive Masse groß und/oder die Elek-
tronendichte klein ist, denn dann ist die Energieabsenkung durch die reduzierte Coulomb-
Energie größer als die Energieerhöhung durch die Zunahme der kinetischen Energie. Eine
53
Wir wollen noch darauf hinweisen, dass die effektive Ladungsdichte ρ eff dazu benutzt werden kann,
eine neue, renormalisierte Schrödinger-Gleichung zu formulieren. Dies führt uns zur Hartree-
Fock-Näherung. Ferner sei darauf hingewiesen, dass die in (12.5.31) enthaltenen Korrelationen
zwischen beliebig weit voneinander entfernten Elektronen daher resultieren, dass wir den unrea-
listischen Ansatz ebener Wellen gemacht haben.
714 12 Magnetismus
große effektive Masse erhalten wir für flache Energiebänder, die wiederum mit einer hohen
Zustandsdichte verbunden sind. Dieses Szenario liegt z. B. bei Systemen mit Leitungselek-
tronen vor, die aus relativ stark lokalisierten 3d, 4 f oder 5 f Zuständen stammen.
erhöht und die Zahl der Spin-↓-Elektronen um die gleiche Zahl erniedrigt. Dies führt zu
einer Erhöhung der kinetischen Energiedichte des Elektronensystems um
∆E kin δN 1
= ⋅ δE = D(E F )(δE)2 . (12.5.33)
V V 2V
Wir müssen nun überlegen, unter welchen Bedingungen diese Erhöhung der kinetischen
Energie durch eine Erniedrigung der potenziellen Energie kompensiert werden kann, so dass
insgesamt eine Energieerniedrigung stattfindet. Mit den Elektronenzahlen
N 1 N
N↑,↓ = ± D(E F )δE = ± δN (12.5.34)
2 2 2
𝑬
𝟏
𝑫 𝑬𝑭
𝟐
𝑬𝑭 𝜹𝑬
54
Edmund Clifton Stoner, geboren am 2. Oktober 1899 in Surrey, England, gestorben am 27. De-
zember 1968 in Leeds, England.
55
E. C. Stoner, Proc. Roy. Soc. London A 165 372–414 (1938) und Proc. Roy. Soc. London A 169,
339–371 (1939).
12.5 Kooperativer Magnetismus 715
N 1 n
n↑,↓ = ± D(E F )δE = ± δn (12.5.35)
2V 2V 2
für die beiden Spin-Richtungen erhalten wir die Magnetisierung56
1 D(E F )
M A = − g s µ B (n↑ − n↓ ) = −µ B δE . (12.5.36)
2 V
Hierbei haben wir g s ≃ 2 verwendet. Wir können nun auch so argumentieren, dass diese
Magnetisierung durch ein fiktives inneres Molekularfeld B A = µ 0 γM A zustande gekommen
ist, wobei γ die Molekularfeldkonstante ist. Die mittlere Erniedrigung der potenziellen Ener-
giedichte können wir dann schreiben als
BA MA
∆E pot 1
= − ∫ MdB = −µ 0 γ ∫ MdM = − µ 0 γM A2 . (12.5.37)
V 2
0 0
D(E F )
2
∆E pot 1 1
= − µ 0 µ B2 γ ⌊︀ δE}︀ = − U(2δN)2
V 2 V 4V
1 1
=− U(N↑ − N↓ )2 = − UV (n↑ − n↓ )2 . (12.5.38)
4V 4
Hierbei ist
U = 2µ 0 µ B2 γ⇑V (12.5.39)
56
Hierbei müssen wir wiederum beachten, dass das magnetische Moment antiparallel zur Spin-
Richtung orientiert ist.
716 12 Magnetismus
D(EF) / 2N (1/eV)
3
Ni
2
Abb. 12.19: Zustandsdich- UD(EF) / 2 Fe
te pro Atom und Spin-
Richtung (a) und Stoner- 1 Sc Pd
Parameter 12 U D(E F ) Li Co Rb
Na
als Funktion der Ord-
nungszahl Z (Daten
aus J. F. Janak, Phys. 0
0 10 20 30 40 50
Rev. B 16, 255–262 (1977)). Z
Für die gesamte Änderung der Energiedichte erhalten wir mit Hilfe von (12.5.33) und
(12.5.38)
∆E ∆E kin ∆E pot 1 1
= + = D(E F )(δE)2 ]︀1 − U D(E F ){︀ . (12.5.40)
V V V 2V 2
Wir sehen, dass wir insgesamt eine Absenkung der Energiedichte erhalten, wenn wir die
Bedingung
1
2
U D(E F ) >1 (12.5.41)
erfüllen. Diese Bedingung bezeichnet man als Stoner-Kriterium. Ist die Stoner-Bedingung
erfüllt, ist es für das Elektronengas vorteilhaft, seine Spins parallel auszurichten, da die damit
verbundene Erhöhung der kinetischen Energiedichte durch die Absenkung der potenziellen
Energiedichte überkompensiert wird. Das Elektronengas nimmt dann einen ferromagne-
tischen Zustand ein.57 Wie Abb. 12.19 zeigt, ist das nur für Fe, Co und Ni der Fall. Glei-
chung (12.5.41) zeigt, dass wir das Stoner-Kriterium erfüllen können, wenn wir eine hohe
Zustandsdichte am Fermi-Niveau und/oder eine hohe Korrelationsenergie U haben. Dies
57
Unsere Überlegungen haben wir nur für die Temperatur T = 0 gemacht. Die Betrachtung kann
aber leicht auf endliche Temperaturen ausgedehnt werden. Man muss dazu bei der Berechnung
der Differenz der Besetzungszahlen von Spin-↑-Elektronen und Spin-↓-Elektronen die Fermi-Ver-
teilung berücksichtigen. Tut man das, so erhält man ein Stoner-Kriterium
∞
1 ∂ f (E, T)
U dE D(E) ( ) >1,
2 ∫ ∂E T
0
in dem auch die Temperatur auftaucht. Das Kriterium wird dann nur unterhalb einer bestimmten
Temperatur, der Curie-Temperatur TC erfüllt. Das heißt, der ferromagnetische Zustand ist nur
für T ≤ TC stabil.
12.5 Kooperativer Magnetismus 717
wird für einige 3d-Übergangsmetalle (Z = 21 bis 30) erfüllt, die aufgrund der schmalen d-
Bänder eine sehr hohe Zustandsdichte pro Atom und Spin-Richtung haben (siehe Abb. 12.19
oben).
12.5.6.3 Suszeptibilität
Um einen Ausdruck für die Suszeptibilität abzuleiten, betrachten wir das Elektronensystem
in einem äußeren Magnetfeld. Wir erhalten dann einen zusätzlichen Beitrag −MB ext zur
Energiedichte, also insgesamt
∆E 1 1
= D(E F )(δE)2 ]︀1 − U D(E F ){︀ − MB ext
V 2V 2
1 M2 1
= ]︀1 − U D(E F ){︀ − MB ext . (12.5.42)
2 µ B (D(E F )⇑V )
2 2
Der Wert der Magnetisierung wird durch das Minimum von ∆E bestimmt. Durch Differen-
zieren nach M und Nullsetzen der Ableitung erhalten wir
B ext D(E F )
M= µ B2 . (12.5.43)
1 − 12 U D(E F ) V
Für die Suszeptibilität χ = µ 0 ∂M⇑∂B ext ergibt sich dann
µ 0 µ B2 (︀D(E F )⇑V ⌋︀ χP
χ= = . (12.5.44)
1 − 12 U D(E F ) 1 − 12 U D(E F )
Hierbei haben wir die Pauli-Suszeptibilität (12.4.10) benutzt. Den Faktor (︀1 − 12 U D(E F )⌋︀−1
bezeichnet man als Stoner-Faktor. Durch die Austauschwechselwirkung im Elektronengas
wird das Elektronengas leichter polarisierbar und dadurch die Suszeptibilität größer als die
Pauli-Suszeptibilität, die wir ja für ein System ohne jegliche Austauschwechselwirkung er-
halten haben. Wir sehen ferner, dass wir für 12 U D(E F ) = 1 eine Polarisationskatastrophe
erhalten, die zu einem ferromagnetischen Zustand führt. Dies ist völlig analog zu Polarisa-
tionskatastrophe in ferroelektrischen Materialien (vergleiche Abschnitt 11.8).
3.46 eV 𝑬𝐅 𝑬𝐅
𝟑𝒅↓ 𝟑𝒅↑
𝟒𝒔 𝟒𝒔 𝟑𝒅↓ 𝟑𝒅↑ 𝟒𝒔 𝟑𝒅↓ 𝟑𝒅↑
3 3
(d) Ni 𝑬𝐅 Cu 𝑬𝐅
2 2
DOS (1 / eV Atom Spin)
1 1
0 0
-1 -1
-2 -2
-3 -3
-10 -5 0 5 -10 -5 0 5
E (eV) E (eV)
81
Abb. 12.20: Schematische Darstellung der Besetzung der 3d- und 4s-Niveaus bei Cu (a) und Ni im
paramagnetischen (b) und ferromagnetischen Zustand (c). In (d) ist die berechnete Zustandsdichte
der 3d- und 4s-Elektronen von Cu und Ni gezeigt (nach J. Callaway und C. S. Wang, Phys. Rev. B 7,
1096–1103 (1983)). Die 4s-Elektronen resultieren in einer geringen Zustandsdichte, die sich über einen
weiten Energiebereich (große Bandbreite) von etwa -10 bis +7 eV erstreckt. Die 3d-Elektronen resul-
tieren dagegen in einer hohen Zustandsdichte in einem schmalen Band mit einer Breite von etwa 4 eV.
⌈︂
Bei Ni sind die Verhältnisse wesentlich schwieriger. Aus dem gemessenen Wert M s (0) =
510 kA/m erhält man aus M s (0) = ng J µ B J(J + 1) für J = 1⇑2 den g-Faktor g J = 1.2. Die-
ser Wert erscheint zunächst unverständlich zu sein. Ni hat ein Elektron weniger als Cu, bei
dem die 3d-Schale mit 10 Elektronen vollkommen gefüllt ist und ein Elektron das 4s-Niveau
bevölkert (siehe Abb. 12.20a). Zu Ni kommen wir, indem wir dem Cu-Atom ein Elektron
wegnehmen. Bandstrukturrechnungen zeigen nun, dass dieses eine Elektron im parama-
gnetischen Zustand zu 46% aus dem 4s- und zu 54% aus dem 3d-Niveaus kommt. Im 4s-
Band verbleiben also 0.54 Elektronen pro Atom, während wir im 3d-Band 0.54 Löcher pro
Atom haben (siehe Abb. 12.20b). Im ferromagnetischen Bereich haben wir nach wie vor
0.54 Elektronen im 4s-Band und insgesamt 0.54 Löcher im 3d-Band, allerdings kommen
jetzt die 0.54 Löcher vollständig aus dem 3d ↓-Band, da es im ferromagnetischen Zustand
aufgrund der Austauschwechselwirkung zu einer Verschiebung der 3d ↑- und 3d ↓-Bänder
um etwa 0.5 eV kommt. Dies ist in Abb. 12.20d gezeigt, wo wir die berechnete Zustands-
dichte pro Energie, Atom und Spin-Richtung für Cu und Ni gegen die Energie aufgetragen
haben. Das heißt, dass wir für Ni insgesamt einen Überschuss von etwa 0.54 Elektronen pro
Atom mit einer präferentiellen Spin-Richtung in eine Richtung haben und wir deshalb jedem
Ni-Atom ein effektives magnetisches Moment µ eff = 0.54g J µ B J ≃ 0.6µ B (J = 1⇑2, g J = 2) zu-
ordnen können. Die Größe 0.54g J stimmt gut mit dem aus der gemessenen Sättigungsma-
gnetisierung bestimmten Wert 1.2 des „effektiven“ g-Faktors überein.
12.6 Magnetische Ordnungsphänomene 719
(a) (b)
Materialien sind die magnetischen Momente zwar geordnet, sie summieren sich aber alle
zu einem verschwindenden Gesamtmoment auf. Das heißt, die Magnetisierung von Anti-
ferromagneten ist wie diejenige von Paramagneten null, wobei in paramagnetischen Ma-
terialien aber wegen der fehlenden Wechselwirkung keine magnetische Ordnungsstruktur
auftritt. Ferrimagnetische Materialien besitzen wie ferromagnetische eine endliche Magneti-
sierung, in dieser Materialklasse besitzen aber nicht alle magnetischen Momente eine endli-
che Komponente in eine bestimmte Richtung. Im einfachsten Fall favorisiert die Austausch-
wechselwirkung in Ferrimagneten eine antiparallele Ausrichtung benachbarter Momente,
die aber unterschiedlich groß sind und somit zu einer endlichen Nettomagnetisierung füh-
ren. Im Einzelfall können magnetische Ordnungsstrukturen sehr komplex sein. Beispiele
sind helikale und zykloidale Strukturen, die wir formal zu den antiferromagnetischen Ord-
nungsstrukturen zählen können, da sie keine Nettomagnetisierung besitzen. Eine interessan-
te Ordnungstruktur stellt das Anfang 2009 an der TU München in MnSi entdeckte Skyrmio-
nengitter dar.58 Skyrmionen sind wirbelartige Spintexturen in magnetischen Materialien, die
dank ihrer besonderen Struktur stabil sind und deshalb für die magnetische Datenspeiche-
rung interessant sind.
Ähnliche Unterscheidungen können wir auch für magnetische Ordnungsstrukturen in
Metallen machen. Die Ordnungsstruktur können wir anhand einer Spin-Dichte s z (r) =
1
2
(︀n↑ (r) − n↓ (r)⌋︀ entlang einer bestimmten Richtung, in unserem Fall der ⧹︂z-Richtung,
beschreiben. Hierbei sind n↑ (r) und n↓ (r) die Beiträge der Spin-Populationen mit Spin
parallel und antiparallel zur z-Achse. In ferromagnetischen Metallen ist die integrierte
Spin-Dichte ∫ s z (r)d 3 r in eine bestimmte Richtung endlich, während sie in antiferroma-
gnetischen Metallen für jede beliebige Richtung verschwindet. Die Details der magnetischen
Ordnungsstrukturen können wiederum sehr komplex sein. So besitzt zum Beispiel anti-
ferromagnetisches Chrom eine endliche periodische Spin-Dichte, deren Periode aber nicht
mit der Periodizität des Gitters übereinstimmt. Wir sprechen dann von einer inkommensu-
rablen Spin-Struktur.
12.6.2 Ferromagnetismus
Eine ferromagnetische Ordnung tritt immer nur unterhalb einer für jedes ferromagneti-
sche System charakteristischen Temperatur, der Curie-Temperatur TC auf. Oberhalb dieser
Temperatur wird die ferromagnetische Ordnung durch thermische Fluktuationen zerstört.
Wir wollen in diesem Abschnitt nun die Temperaturabhängigkeit der Suszeptibilität für den
Temperaturbereich oberhalb und unterhalb von TC diskutieren. Oberhalb und nicht allzu
weit unterhalb von TC ist eine einfache Beschreibung mit Hilfe einer Molekularfeld-Nähe-
rung möglich. Weit unterhalb von TC ist dagegen eine quantitative Beschreibung mit der
Molekularfeldtheorie schwierig. Wir werden in Abschnitt 12.10 sehen, dass wir in diesem
Temperaturbereich die Änderung der Magnetisierung durch die Anregung von Spinwellen
beschreiben können.
58
S. Mühlbauer, B. Binz, F. Jonietz, C. Pfleiderer, A. Rosch, A. Neubauer, R. Georgii, P. Böni, Skyrmion
Lattice in a Chiral Magnet, Science 323, 915–919 (2009).
12.6 Magnetische Ordnungsphänomene 721
12.6.2.1 Molekularfeld-Näherung
Die Molekularfeld-Näherung wurde bereits im Jahr 1907 von Pierre Weiss59 zur phänome-
nologischen Beschreibung des Ferromagnetismus entwickelt und erhielt erst später durch
die Einführung der Austauschwechselwirkung seine physikalische Berechtigung. Wir gehen
bei der Molekularfeld-Näherung davon aus, dass zusätzlich zum äußeren Magnetfeld B ext
ein inneres Feld B A wirkt, durch das die endliche Austauschwechselwirkung erfasst wird.
Wir müssen nun zuerst überlegen, wie groß dieses fiktive Austausch- oder Molekularfeld
ist.
Wir haben bereits diskutiert, dass wir die Austauschwechselwirkung zwischen magnetischen
Momenten durch das Heisenberg-Modell beschreiben können. Beschränken wir uns auf
Wechselwirkungen zwischen nächsten Nachbarn, ist die Austausch-Konstante zwischen al-
len wechselwirkenden Paaren gleich. Wir erhalten für die Austauschenergie des i-ten Gitter-
atoms mit seinen z nächsten Nachbarn
JA z
Ei = − ∑ Ji ⋅ J j . (12.6.1)
ħ 2 j=1
Wir betrachten jetzt nur Mittelwerte und ersetzen die Momentanwerte der Drehimpulsvek-
toren J j durch ihre Mittelwerte ∐︀J j ̃︀ und erhalten somit eine mittlere Austauschenergie
JA
E i = −z ∐︀J j ̃︀ ⋅ J i . (12.6.2)
ħ2
Für die Magnetisierung gilt ferner
∐︀J j ̃︀
M = −ng J µ B , (12.6.3)
ħ
wobei n die Dichte der Gitteratome und g J der Landé-Faktor ist. Wir können diesen Aus-
druck nach ∐︀J j ̃︀ auflösen und dann in (12.6.2) einsetzen. Wir erhalten
g J µB Ji zJ A
E i = − (− ) ⋅ 2 2 M = −µ i ⋅ B A . (12.6.4)
ħ ng J µ B
59
Pierre Ernest Weiss, geboren am 25. März 1865 in Mühlhausen, gestorben am 24. Oktober 1940
in Lyon.
Als Jahrgangsbester schloss Weiss 1887 am Züricher Polytechnikum sein Ingenieurstudium ab. Im
Jahr 1888 wurde er an die École Normale Supérieure in Paris berufen. Seine folgenden Stationen
waren die Universitäten Rennes (1895) und Lyon (1899), bis er 1902 an das Polytechnikum in Zü-
rich berufen wurde, an welchem auch Albert Einstein tätig war. Dort bekam er ein großes Labor zur
Untersuchung von magnetischen Phänomenen, welches eine große Anzahl an bekannten Physi-
kern anzog. Im Jahr 1919 etablierte er das physikalische Institut an der Universität Straßburg. 1926
wurde er in die Pariser Akademie aufgenommen. Er führte grundlegende Untersuchungen über
den Para- und Ferromagnetismus (entdeckte dabei die nach ihm benannten Weissschen Bezirke),
sowie zur Temperaturabhängigkeit der Magnetisierung durch. Er entwickelte das Curie-Weisssche
Gesetz und entdeckte den quantenhaften Charakter der magnetischen Momente der Atome. Seine
wichtigste Veröffentlichung war das Werk „Le magnetisme‘“ (1926).
722 12 Magnetismus
Wir sehen also, dass wir die Austauschenergie formal als Produkt eines magnetischen Mo-
ments µ i = −g J µ B J i ⇑ħ und einem effektiven Magnetfeld B A schreiben können. Wir bezeich-
nen dieses effektive Magnetfeld als Austauschfeld oder Molekularfeld. Es ist gegeben durch
zJ A
BA = M = µ 0 γM . (12.6.5)
ng J2 µ B2
Hierbei ist
1 zJ A
γ= (12.6.6)
µ 0 ng J2 µ B2
die Molekularfeldkonstante. Das Molekularfeld ist natürlich nur ein fiktives Magnetfeld, das
in einem Festkörper die gleiche magnetische Ordnung schaffen würde wie die vorliegen-
de Austauschwechselwirkung, deren Stärke durch die Austauschkonstante J A charakteri-
siert wird. Die von ihrem Charakter her nicht-magnetische Austauschwechselwirkung eines
Atoms mit allen anderen Atomen wird somit durch ein mittleres effektives Magnetfeld be-
schrieben. Damit wird das komplexe Problem der Wechselwirkung eines Atoms mit allen
anderen Atomen formal auf das Verhalten des magnetischen Moments eines Atoms in ei-
nem mittleren Feld (mean field) reduziert. Das fiktive Molekularfeld geht natürlich nicht in
die Maxwell-Gleichungen ein.
Mit dem Molekularfeld können wir das effektive Magnetfeld am Ort eines Gitteratoms
schreiben als
In der von uns gemachten Betrachtung (mean-field Theorie) ist also der einzige Effekt der
Austauschwechselwirkung derjenige, dass wir Bext durch Beff ersetzen müssen.60 Die Magne-
tisierung eines Systems aus magnetischen Dipolen können wir nach (12.3.62) und (12.3.63)
andererseits schreiben als
M = ng J µ B JB J (y) , (12.6.8)
wobei wir in den Ausdruck für y jetzt das effektive Magnetfeld einsetzen müssen:
g J µ B JB eff g J µ B J(B ext + µ 0 γM)
y= = . (12.6.9)
kB T kB T
Wir können aus (12.6.8) die Magnetisierung und damit die Suszeptibilität als Funktion
von T und B ext nicht explizit ermitteln, da ja M auch im Argument der Brillouin-Funkti-
on B J (y) steht. Wir können aber in einfacher Weise eine grafische Lösung durchführen.
Lösen wir (12.6.9) nach M auf, so erhalten wir
kB T B ext
M= y− . (12.6.10)
µ 0 γg J µ B J µ0 γ
60
In einigen Fällen ist diese Annahme nicht realistisch. Sie erfordert nämlich, dass einzelne Spin-
Richtungen nicht stark vom Mittelwert abweichen oder dass die Wechselwirkung langreichweitig
ist, so dass wir zur Ermittlung von B A über viele Spins mitteln müssen.
12.6 Magnetische Ordnungsphänomene 723
1.0 1.0
𝑻 > 𝑻𝑪
𝑻 = 𝑻𝑪
𝑩𝑱 𝒚
0.8 0.8
𝑩𝑱 𝒚 𝑻 < 𝑻𝑪
0.6 0.6
M / Ms
M / Ms
0.4 0.4
𝐵ext ≠ 0 𝐵ext = 0
0.2 0.2
(a) (b)
0.0 0.0
0 2 4 6 0 2 4 6
y y
Abb. 12.22: Zur grafischen Bestimmung der Magnetisierung eines Ferromagneten als Schnittpunkt der
Brillouin-Funktion B J (y) und einer Geraden nach Gleichung (12.6.10) für B ext ≠ 0 (a) und B ext = 0 (b).
84
Wir können jetzt M als Funktion von y sowohl nach Gleichung (12.6.10) als auch nach Glei-
chung (12.6.8) auftragen, wie dies in Abb. 12.22a gezeigt ist. Die Schnittpunkte der beiden
Kurven ergeben dann gerade den gesuchten Magnetisierungswert. Hierzu müssen natürlich
die Werte für γ, J und g J bekannt sein.
Setzen wir in (12.6.10) B ext = 0, so können wir die spontane Magnetisierung eines Ferro-
magneten in Abhängigkeit von der Temperatur bestimmen. Der in Abb. 12.22b gezeigte Kur-
venverlauf zeigt, dass wir eine spontane Magnetisierung nur dann erhalten, wenn die Stei-
gung der durch (12.6.10) gegebenen Geraden kleiner als die Steigung der Brillouin-Funktion
für kleine Feldwerte ist. Für y ≪ 1 können wir die Brillouin-Funktion in eine Reihe ent-
wickeln und erhalten B J (y) ≃ J+1
3J
y. Mit dieser Näherung ergibt sich für die Steigung der
Brillouin-Funktion
dM dB J J+1
⋁︀ = ng J µ B J ⋁︀ = ng J µ B . (12.6.11)
d y y=0 d y y=0 3
µ 0 g J2 J(J + 1)µ B2
TC = nγ =γ⋅C (12.6.14)
3k B
724 12 Magnetismus
liegt. Hierbei ist TC die ferromagnetische Curie-Temperatur und C die Curie-Konstante [ver-
gleiche (12.3.65)]. Gleichung (12.6.14) beschreibt das anschaulich erwartete Ergebnis, dass
Materialien mit einer hohen Molekularfeldkonstante γ, d. h. mit einer hohen Austausch-
kopplung J A eine hohe Curie-Temperatur besitzen.
Für den paramagnetischen Bereich erhalten wir mit der Näherung B J (y) ≃ J+1
3J
y für y ≪ 1
1 µ 0 g J2 J(J + 1)µ B2 1 C
M= n (B ext + µ 0 γM) = (B ext + µ 0 γM) . (12.6.15)
µ0 3k B T µ0 T
Lösen wir diese Gleichung nach M auf und verwenden TC = γC, so erhalten wir
1 C
M= B ext (12.6.16)
µ 0 T − TC
C
χ= . (12.6.17)
T − TC
Aus Gleichung (12.6.14) lässt sich mit Hilfe der gemessenen Werte von TC und der Curie-
Konstanten C die Molekularfeldkonstante γ bestimmen. Mit den Werten aus Tabelle 12.3
erhalten wir für Ni γ = 1070. Mit diesem Wert lässt sich ferner mit der gemessenen Sätti-
gungsmagnetisierung M s (T = 0) = 510 kA/m das Austauschfeld zu B A = µ 0 γM s (0) = 685 T
abschätzen. Für Fe ergibt sich γ = 470 und B A = 1030 T. Wir sehen, dass das Austauschfeld
bei Temperaturen nicht allzu nahe bei TC wesentlich größer ist als externe Felder, die mit gän-
gigen Labormagneten erzeugt werden können (typischerweise einige Tesla). Deshalb haben
12.6 Magnetische Ordnungsphänomene 725
in diesem Temperaturbereich externe Felder kaum mehr einen Einfluss auf das Verhalten
eines Ferromagneten.
87
Den Übergang vom paramagnetischen in den ferromagnetischen Zustand können wir auch
als einen Phasenübergang 2. Ordnung beschreiben. Die unterhalb von TC auftretende spon-
tane Magnetisierung M s ist dabei der Ordnungsparameter. Nach der Landau-Theorie der
Phasenübergänge (vergleiche Abschnitt 11.8.1) würden wir
⌈︂
⋃︀M s ⋃︀ ∝ TC − T . (12.6.18)
erwarten. Dies stimmt mit der gemessenen Abhängigkeit nicht überein. In der Nähe von TC
weicht ferner die gemessene Temperaturabhängigkeit der Suszeptibilität von einem einfa-
chen 1⇑T-Verhalten ab. Man beobachtet vielmehr χ ∝ (T − TC )−α mit α = 4⇑3 für T > TC
und χ ∝ (TC − T) β mit β = 1⇑3 für T < TC . Hierbei sind α und β die so genannten kri-
tischen Exponenten, die man aus der Theorie der Phasenübergänge erhält. Die einfache
Landau-Theorie liefert β = 1⇑2. Das tatsächliche Verhalten kann im Rahmen dieser einfa-
chen Molekularfeld-Näherung nicht richtig beschrieben werden, da sie Fluktuationen, die
im Temperaturbereich nahe TC wichtig werden, nicht berücksichtigt. Die Behandlung der
Temperaturabhängigkeit im kritischen Bereich nahe bei TC soll hier aber nicht diskutiert
werden. Es sei abschließend noch darauf hingewiesen, dass bei der Diskussion des Tempe-
raturverhaltens von Bandferromagneten berücksichtigt werden muss, dass die Zahl δN↑,↓
der umverteilten Elektronen temperaturabhängig ist. Dies wurde bei unserer Betrachtung
in Abschnitt 12.5.6.2 nicht berücksichtigt.
Für T ≪ TC wird das Argument der tanh-Funktion groß. Wir können dann die Nähe-
rung tanh x ≃ 1 − 2e−2x verwenden und erhalten
µ eff γµ 0 M
M = nµ eff (1 − 2 exp ]︀−2 {︀) . (12.6.20)
kB T
Wir sehen, dass
2
nµ eff γµ 0
∆M = M(0) − M(T) ≃ 2nµ eff exp ⌊︀−2 }︀ (12.6.21)
kB T
sehr klein wird, da das Argument der Exponentialfunktion etwa 2TC ⇑T entspricht und
für T ≪ TC sehr groß wird. Hierbei haben wir im Argument der Exponentialfunkti-
on M ≃ nµ eff gesetzt. Für T = 0.1TC erwarten wir deshalb ∆M⇑nµ eff ∼ 10−9 . Das heißt,
für T ≪ TC sollte sich die Sättigungsmagnetisierung über einen weiten Temperaturbereich
kaum ändern. Im Experiment wird aber eine wesentlich stärkere Abnahme der Sättigungs-
magnetisierung mit zunehmender Temperatur beobachtet, die die Form
∆M
= AT 3⇑2 (12.6.22)
nµ eff
besitzt. Wir werden in Abschnitt 12.10 sehen, dass diese Temperaturabhängigkeit durch die
Anregung von Spinwellen erklärt werden kann.
12.6.3 Ferrimagnetismus
In vielen magnetischen Kristallen stimmt die Sättigungsmagnetisierung bei T = 0 K nicht
mit dem Wert überein, den man bei einer parallelen Anordnung der atomaren magneti-
𝑺 = 𝟓/𝟐
Fe(B)
8Fe3+
B-Plätze, oktaedrisch
𝑺=𝟐 O 2-
𝑺 = 𝟓/𝟐
Abb. 12.24: (a) Spin-Anordnung in Magnetit, FeO⋅Fe2 O3 . Die Spins der tetraedrisch und oktaedrisch
koordinierten Fe3+ -Ionen stehen antiparallel, so dass zur Sättigungsmagnetisierung effektiv nur die
Magnetit:
Spin-Momente der oktaedrisch koordinierten Fe2+ -Ionen beitragen. (b) Inverse Spinellstruktur von
Magnetit. Bei der inversen Spinellstruktur werden die tetraedrisch koordinierten A-Plätze von drei-
wertigen und die oktaedrisch koordinierten B-Plätze zu jeweils 50% von drei- und zweiwertigen Ionen
Fe2+: Sdagegen
besetzt. Bei der normalen Spinellstruktur werden Fe3+: S = 5/2, Lkoordinierten
= 2, L = 0 die tetraedrisch =0 A-Plätze nur
von zweiwertigen und die oktaedrisch koordinierten B-Plätze nur von dreiwertigen Ionen 88besetzt.
12.6 Magnetische Ordnungsphänomene 727
schen Momente erwartet. Ein typisches Beispiel ist Magnetit, Fe3 O4 oder Fe2+ O2− ⋅Fe3+ 2−
2 O3 .
Aus Tabelle 12.2 folgt, dass Fe einen Grundzustand mit S = 5⇑2 und L = 0 einnimmt. Jedes
3+
Fe3+ -Ion sollte deshalb ein magnetisches Moment von 5µ B beitragen. Fe2+ hat einen Grund-
zustand mit S = 2 und L = 0 und sollte 2µ B beitragen. Deshalb erwarten wir insgesamt eine
Sättigungsmagnetisiertung von 2 ⋅ 5 + 4 = 14 Bohrschen Magnetonen pro Formeleinheit. Im
Experiment gemessen werden dagegen nur etwa 4µ B . Dieser Unterschied kann dadurch er-
klärt werden, dass die magnetischen Momente der Fe3+ -Ionen antiparallel zueinander ste-
hen (siehe Abb. 12.24a), so dass nur das Moment der Fe2+ -Ionen übrig bleibt, das gerade 4µ B
beträgt. Neutronenbeugungsexperimente an Magnetit haben diese Vorstellung bestätigt.
Eine systematische Untersuchung der Konsequenzen der für Magnetit gefundenen Spin-
Ordnung wurde von Louis Néel61 im Zusammenhang mit der Materialklasse der Ferrite
durchgeführt. Ferrite sind magnetische Oxide der Form MO⋅Fe2 O3 , wobei das zweiwerti-
ge Metallion M = Zn, Cd, Fe, Ni, Cu, Co, Mg sein kann. Die Bezeichnung Ferrimagnetismus
wurde ursprünglich eingeführt, um die magnetische Ordnung in den Ferriten zu beschrei-
ben. Heute bezeichnen wir ganz allgemein solche Substanzen als Ferrimagnete, bei denen
die magnetischen Momente einiger Ionen der strukturellen Einheitzelle antiparallel zu den-
jenigen der übrigen stehen.
Viele Ferrimagnete, insbesondere die Ferrite, haben eine schlechte elektrische Leitfähigkeit
und kommen deshalb z. B. in Hochfrequenztransformatoren zum Einsatz. In Abb. 12.24b ist
die Kristallstruktur von Magnetit gezeigt. Magnetit ist ein kubischer Ferrit mit einer inver-
sen Spinellstruktur. In einer Einheitszelle befinden sich 8 tetraedrisch (A-Plätze) und 16 ok-
taedrisch koordinierte Fe-Plätze (B-Plätze) in einem Würfel mit einer Seitenlänge von etwa
8 Å. Bemerkenswert ist, dass die Austauschkonstanten J AA , J BB und J AB alle negativ sind und
damit eine antiparallele Anordnung der Spins auf den A-Plätzen, den B-Plätzen sowie eine
antiparallele Anordnung zwischen A- und B-Plätzen favorisieren. Dies ist natürlich nicht
möglich. Aufgrund des wesentlich geringeren AB-Abstands dominiert allerdings die Kopp-
lungskonstante J AB und erzwingt eine antiparallele Ausrichtung des A- und B-Untergitter.
Die Spins auf dem A- und dem B-Untergitter stehen damit trotz negativer Kopplungskon-
stanten J AA und J BB jeweils parallel zueinander.
12.6.3.1 Molekularfeld-Näherung
Wir wollen im Folgenden zeigen, dass die drei antiferromagnetischen Wechselwirkun-
gen J AB , J AA , J BB < 0 in einer ferrimagnetischen Ordnung resultieren können. Wir werden
für unsere Analyse die Molekularfeldnäherung benutzen. In dieser Näherung können
wir ein mittleres Austauschfeld definieren, das auf das A- und B-Spin-Untergitter wirkt
[vergleiche hierzu (12.6.5) und (12.6.6)]:
B Aa = µ 0 γ AA M A + µ 0 γ AB MB (12.6.23)
BBa = µ 0 γ BB MB + µ 0 γ BA M A . (12.6.24)
61
Louis Eugène Felix Néel, französischer Physiker, geboren am 22. November 1904 in Lyon, gestor-
ben am 14. November 2000. Néel erhielt 1970 den Physik-Nobelpreis für seine grundlegenden
Leistungen und Entdeckungen betreffend des Antiferromagnetismus und des Ferromagnetismus,
die zu wichtigen Erkenntnissen in der Festkörperphysik geführt haben.
728 12 Magnetismus
Hierbei sind nach (12.6.6) die Molekularfeldkonstanten γ AA , γ BB und γ AB alle negativ we-
gen J AB , J AA , J BB < 0. Ferner gilt γ AB = γ BA .
Die Wechselwirkungsenergiedichte beträgt
U = − 12 (B Aa ⋅ M A + BBa ⋅ MB )
= − 12 µ 0 γ AA M A2 − µ 0 γ AB M A ⋅ MB − 12 µ 0 γ BB M B2 . (12.6.25)
Da alle Molekularfeldkonstanten negativ sind, kann U nur dann negativ werden, wenn M A
antiparallel zu MB ist. Für diesen Fall erhalten wir eine Absenkung der Gesamtenergiedichte,
wenn
µ 0 γ AB M A ⋅ MB > − 12 µ 0 (γ AA M A2 + γ BB M B2 ) . (12.6.26)
Diese Bedingung können wir erfüllen, wenn ⋃︀γ AB ⋃︀ ≫ ⋃︀γ AA ⋃︀, ⋃︀γ BB ⋃︀ gilt, das heißt, wenn die
Austauschkopplung zwischen dem A- und B-Untergitter gegenüber der Austauschkopplung
innerhalb des A- und B-Untergitters dominiert. Dies ist in Magnetit aufgrund des geringeren
AB-Abstandes der Fall.
A = Bext + µ 0 γ AB M B + µ 0 γ AA M A
Beff (12.6.27)
Beff
B = Bext + µ 0 γ BA M A + µ 0 γ BB MB . (12.6.28)
A = Bext + µ 0 γ AB M B
Beff (12.6.29)
B = Bext + µ 0 γ BA M A .
Beff (12.6.30)
Für die Magnetisierung auf den beiden Untergittern ergibt sich damit
C A eff CA
MA = B = (Bext + µ 0 γ AB MB ) (12.6.31)
µ0 T A µ0 T
C B eff CB
MB = BB = (Bext + µ 0 γ AB M A ) . (12.6.32)
µ0 T µ0 T
Hierbei haben wir χ A = C A ⇑T bzw. χ B = C B ⇑T benutzt. Für B ext = 0 hat das Gleichungssys-
tem genau dann nichtverschwindende Lösungen für M A und M B , wenn
T −γ AB C A
⋁︀ ⋁︀ = 0 . (12.6.33)
−γ AB C B T
12.6 Magnetische Ordnungsphänomene 729
Damit erhalten wir die ferrimagnetische Curie-Temperatur (siehe hierzu Tabelle 12.4) zu
⌈︂
TC = ⋃︀γ AB ⋃︀ C A C B . (12.6.34)
Wir sehen, dass wir für einen Ferrimagneten eine Temperaturabhängigkeit der Suszeptibili-
tät erhalten, die vom Curie-Weiss-Gesetz eines Ferromagneten, χ = C⇑(T − TC ), abweicht.
Insbesondere erhalten wir, wie in Abb. 12.25 gezeigt ist, keine Gerade mehr, wenn wir den
Kehrwert der Suszeptibilität gegen T auftragen. Eine gekrümmte χ−1 (T) Kurve ist ein Cha-
rakteristikum von Ferrimagneten.
3
Fe3O4
2
(10 )
-4
-1
91
12.6.3.4 Eisengranate
Eine wichtige Familie von ferrimagnetischen Oxiden sind die Eisengranate der Zusammen-
setzung M 3 Fe5 O12 , wobei M ein dreiwertiges Ion ist und Eisen als dreiwertiges Ion vorliegt.
730 12 Magnetismus
Ein wichtiger Vertreter ist Y3 Fe5 O12 , das als YIG (engl. Yttrium Iron Garnet) bezeichnet
wird. Die Sättigungsmagnetisierung von YIG resultiert aus zwei entgegengesetzt ausgerich-
teten Fe3+ Untergittern. Bei T = 0 trägt jedes Fe3+ -Ion zur Magnetisierung mit 5µ B bei, wo-
bei die 3 Fe3+ -Ionen auf den so genannten A-Plätzen in die eine und die beiden Fe3+ -Ionen
auf den so genannten D-Plätzen in die entgegengesetzte Richtung ausgerichtet sind, so dass
ein magnetisches Moment von 5µ B pro Formeleinheit verbleibt.
Die Molekularfeldkonstante γ AB beträgt für YIG etwa −1.5 × 104 und die Curie-Temperatur
ist TC = 560 K. YIG zeigt einen starken Faraday-Effekt, hat eine hohe Güte im Mikrowellen-
bereich und eine sehr kleine Linienbreite in der ferromagnetischen Resonanz (FMR). Das
Material wird in Mikrowellen- sowie in optischen und magnetooptischen Bauelementen ein-
gesetzt, z. B. als Resonator in Filtern und Oszillatoren für Frequenzen im Gigahertz-Bereich.
12.6.4 Antiferromagnetismus
Wir betrachten als letzte magnetische Ordnung den Antiferromagnetismus. Wie beim Fer-
rimagnetismus ist die Austauschkopplung benachbarter Atome negativ, so dass eine antipar-
allele Orientierung der magnetischen Momente bevorzugt wird. Im Gegensatz zu ferrima-
gnetischen Substanzen befinden sich aber auf den beiden antiparallel orientierten Unter-
gittern die gleichen magnetischen Momente, so dass sich diese gerade kompensieren. Vom
physikalischen Standpunkt aus können wir also antiferromagnetische Substanzen wie fer-
rimagnetische Substanzen behandeln, allerdings mit der Vereinfachung, dass C A = C B = C
gilt.
Das Paradebeispiel für eine antiferromagnetische Substanz ist das in Abb. 12.26 gezeigte
MnO, das bei Raumtemperatur eine NaCl-Struktur mit einer Gitterkonstanten a = 4.43 Å
besitzt. In Neutronenbeugungsexperimenten wurden bei 80 K zusätzliche Beugungsrefle-
xe bei jeweils dem halben Winkel gefunden, was einer Verdopplung der Einheitszelle ent-
spricht. Röntgenbeugungsexperimente zeigten dagegen diese Beugungsreflexe nicht. Die Ur-
sache dafür ist das Auftreten einer antiferromagnetischen Ordnungsstruktur unterhalb von
etwa 120 K, die von den Neutronen, nicht aber von den Röntgenquanten gesehen wird. Die
Anordnung der Spins ist in Abb. 12.26 gezeigt. Innerhalb einer (111)-Ebene sind die Spins
parallel angeordnet, wobei die Spin-Richtung in benachbarten (111)-Ebenen gerade ent-
gegengesetzt ist. Die magnetische Einheitzelle hat genau die doppelte Abmessung wie die
strukturelle Einheitszelle.
12.6.4.1 Néel-Temperatur
Wir gehen von Gleichung (12.6.27) und (12.6.28) für die effektiven Felder auf den beiden
Untergittern aus und verwenden γ AA = γ BB sowie M A = −MB . Damit erhalten wir
A = Bext + µ 0 (γ AB − γ AA )M B
Beff (12.6.36)
B = Bext + µ 0 (γ AB − γ AA )M A .
Beff (12.6.37)
12.6 Magnetische Ordnungsphänomene 731
chemische Einheitszelle
magnetische Einheitszelle
Diese beiden Gleichungen entsprechen gerade (12.6.29) und (12.6.30), wenn wir γ AB
durch (γ AB − γ AA ) ersetzen. Für die Ordnungstemperatur ergibt sich dann
99
Hierbei ist zu beachten, dass sich die Curie-Konstante C nur auf ein Untergitter bezieht,
und aufgrund der antiferromagnetischen Kopplung γ AB , γ AA < 0. Bezieht man C auf dass
gesamte Gitter, muss auf der rechten Seite noch der Faktor 12 eingefügt werden. Die Ord-
nungstemperatur wird nach Louis Néel als Néel Temperatur bezeichnet. Wir sehen, dass
eine zusätzliche antiferromagnetische Kopplung γ AA zwischen den Spins auf dem gleichen
Untergitter zu einer Reduktion von TN führt. Für das in Abb. 12.26 gezeigte MnO bedeutet
dies, dass in der Richtung senkrecht zu den (111)-Ebenen die Kopplung sowohl zwischen
den nächsten als auch den übernächsten Nachbarn antiferromagnetisch ist. Dies führt zu
Frustration, da sich ein Spin nicht gleichzeitig zum nächsten und übernächsten Nachbarn
antiparallel ausrichten kann. Falls γ AB ≃ γ AA führt die Frustration dazu, dass sich trotz einer
starken antiferromagnetischen Austauschwechselwirkung bis zu tiefen Temperaturen kein
Ordnungszustand einstellt.
12.6.4.2 Suszeptibilität
Suszeptibilität oberhalb von TN : Für T > TN , also im paramagnetischen Bereich, ist in
einem äußeren Magnetfeld M A = M B und somit M = M A + M B = 2M A . Setzen wir diese in
Gleichung (12.6.36) ein, so erhalten wir
A = Bext + µ 0 (γ AB + γ AA )M A = B B = B
Beff eff eff
. (12.6.39)
1 2C eff
M = 2M A = B , (12.6.40)
µ0 T
1 2C M 1 2C
M= ]︀Bext + µ 0 (γ AB + γ AA ) {︀ = Bext . (12.6.41)
µ0 T 2 µ 0 T − C(γ AB + γ AA )
732 12 Magnetismus
∂M 2C
χ = µ0 = (12.6.42)
∂B ext T + Θ
Hierbei ist wieder zu beachten, dass sich C nur auf ein Untergitter bezieht und dass aufgrund
der antiferromagnetischen Kopplung γ AB , γ AA < 0.
Wir sehen sofort, dass die paramagnetische Néel-Temperatur Θ immer größer als die Néel-
Temperatur TN ist, falls sowohl γ AB als auch γ AA negativ sind, das heißt, falls sowohl die
Kopplung zwischen nächsten (AB) als auch diejenige zwischen den übernächsten Nach-
barn (AA) antiferromagnetisch ist. Für das Verhältnis der beiden Temperaturen erhalten
wir
Θ ⋃︀γ AB + γ AA ⋃︀
= . (12.6.44)
TN ⋃︀γ AB − γ AA ⋃︀
Nur wenn wir die Wechselwirkung mit den übernächsten Nachbarn vernachlässigen kön-
nen, d. h. γ AA ≃ 0, erhalten wir Θ ≃ TN . In Tabelle 12.5 sind die beiden Temperaturen und
ihr Verhältnis für einige Substanzen angegeben. Die Tatsache, dass für alle betrachteten Ma-
terialien Θ⇑TN > 1 zeigt, dass für diese Materialien sowohl γ AB als auch γ AA negativ ist.
Suszeptibilität unterhalb von TN : Oberhalb von TN ist die Suszeptibilität fast unabhängig
von der Richtung des äußeren Feldes relativ zur Spin-Richtung auf den Untergittern. Dies
ändert sich für T < TN . Hier müssen wir die beiden Fälle mit dem äußeren Feld parallel und
senkrecht zur Spin-Richtung unterscheiden.
Bext ⊥ Spin-Richtung: Die Energiedichte können wir in diesem Fall wie folgt angeben:
1
U = − (B Aa ⋅ M A + BBa ⋅ MB ) − Bext ⋅ (M A + MB ) . (12.6.45)
2
12.6 Magnetische Ordnungsphänomene 733
𝑴𝑨 𝑩𝐞𝐱𝐭 𝑴𝑩
𝝋 𝝋
Abb. 12.27: Zur Herleitung der Suszeptibilität
𝝋 eines Antiferromagneten.
Setzen wir hier die Ausdrücke (12.6.23) und (12.6.24) für die Austauschfelder auf den A-
und B-Plätzen ein, so erhalten wir bei Vernachlässigung der Terme mit γ AA und γ BB
U = −µ 0 γ AB M A ⋅ MB − Bext ⋅ (M A + MB ) . (12.6.46)
Mit M = ⋃︀M A ⋃︀ = ⋃︀M B ⋃︀ können wir für kleine Winkel φ folgende Näherungen verwenden (sie-
he hierzu Abb. 12.27):
1
M A ⋅ MB = −M 2 cos 2φ ≃ −M 2 (1 − (2φ)2 ) (12.6.47)
2
M A + MB = M sin 2φ ≃ M2φ . (12.6.48)
103
Damit erhalten wir
U ≃ −µ 0 γ AB M 2 (1 − 2φ 2 ) − 2B ext Mφ . (12.6.49)
Setzen wir die Ableitung dieses Ausdrucks nach φ gleich null, so erhalten wir das Minimum
der Energiedichte für den Winkel
B ext
φ= . (12.6.50)
2µ 0 ⋃︀γ AB ⋃︀M
Setzen wir diesen Ausdruck in (12.6.48) ein, so ergibt sich
B ext
M A + M B = M2φ = (12.6.51)
µ 0 ⋃︀γ AB ⋃︀
und damit die Suszeptibilität zu
∂M 1
χ⊥ = µ 0 = . (12.6.52)
∂B ext ⋃︀γ AB ⋃︀
Wir sehen, dass die Suszeptibilität χ⊥ unabhängig von der Temperatur ist.
Bext ∥ Spin-Richtung: Falls das Magnetfeld parallel zur Untergittermagnetisierung ausge-
richtet ist, ändert sich die magnetische Energie nicht, wenn die Spins auf dem A- und B-
Untergitter gleiche Winkel mit dem Feld einnehmen. Das bedeutet, dass für T = 0
χ∥ = 0 . (12.6.53)
Für T > 0 nimmt χ∥ mit der Temperatur zu und erreicht dann bei T = TN den Wert 1⇑⋃︀γ AB ⋃︀.
Dies liegt daran, dass mit zunehmendem Magnetfeld im statistischen Mittel durch thermi-
sche Aktivierung immer mehr Momente parallel zum Magnetfeld ausgerichtet werden. Die
734 12 Magnetismus
Magnetisierung nimmt mit dem anliegenden Magnetfeld zu und resultiert in einer endli-
chen Suszeptibilität χ∥ > 0.62 In Abb. 12.28 ist der Verlauf der Suszeptibilität oberhalb und
unterhalb von TN schematisch dargestellt.
Spin-Flop Übergang: Da χ⊥ > χ∥ , erwarten wir für T < TN , dass die Untergittermagneti-
sierungen MA,B immer senkrecht zu Bext sind. Diese Phase nennt man die Spin-Flop-Phase.
Dies wird allerdings meist durch eine magnetokristalline Anisotropie K∥ verhindert, die ver-
sucht, MA,B parallel zur leichten antiferromagnetischen Achse auszurichten. Legen wir dann
Bext ∥ MA,B an, so erhalten wir einen Spin-Flop-Übergang bei dem Feldwert B sf , bei dem die
parallele und senkrechte Konfiguration energetisch entartet sind. Mit den Energiedichten
E∥ = −2K∥ − 2µ1 0 χ∥ B 2sf und E⊥ = − 2µ1 0 χ⊥ B 2sf erhalten wir das Spin-Flop-Feld
⌉︂
B sf = 4µ 0 K∥ ⇑(χ⊥ − χ∥ ) , (12.6.54)
𝑯𝐞𝐱𝐭 = 𝟎
leichte 𝑴
Achse
schwere Achse
𝑯𝐞𝐱𝐭 ≠ 𝟎
𝑴
leichte
Achse
schwere Achse
Abb. 12.29: Veranschaulichung der magnetischen Anisotropie anhand der Ausrichtung von Kompass-
nadeln. Rechts sind die Konturlinien konstanter magnetischer freier Energie als Funktion der Magne-
tisierungsrichtung gezeigt. Oben: Ohne äußeres Feld richten sich die Nadeln aufgrund der dipolaren
105
Wechselwirkung parallel zu ihrer Verbindungsachse aus. Dies entspricht einem Minimum der freien
Energie und somit einer magnetisch leichten Achse. Unten: Die Magnetisierung zeigt entlang der ma-
gnetisch schweren Achse. Dieser Zustand kann nur durch ein genügend hohes äußeres Magnetfeld
erzwungen werden.
In Abb. 12.29 ist ein einfaches Beispiel zur Veranschaulichung der magnetischen Anisotro-
pie dargestellt. Aufgrund der dipolaren Wechselwirkung richten sich die Kompassnadeln
bevorzugt parallel zu ihrer Verbindungsachse aus. Diese Richtung stellt also eine magne-
tisch leichte Achse dar, die durch ein Minimum der freien magnetischen Energiedichte ge-
kennzeichnet ist. Die Ausrichtung der Nadeln senkrecht zur Verbindungsachse ist dagegen
energetisch ungünstig, sie entspricht einer magnetisch schweren Achse. Diese Ausrichtung
kann nur mit einem genügend hohen äußeren Feld erzwungen werden.
Es gibt drei Hauptursachen für die magnetische Anisotropie, nämlich die magnetokristalline
Anisotropie (engl. magnetocrystalline anisotropy), die Formanisotropie (engl. shape aniso-
tropy) und eine durch äußere Einflüsse induzierte Anisotropie. Diese tragen mit den Beiträ-
gen fmc , fform und find zur magnetischen freien Energiedichte bei:
fani = fmc + fform + find + . . . . (12.7.1)
Die magnetokristalline Anisotropie stellt eine intrinsische Materialeigenschaft dar. Sie wird
durch Kristallfelder erzeugt, die zu einer Vorzugsrichtung des Bahndrehimpulses und über
die Spin-Bahn-Kopplung zu einer Vorzugsrichtung des Spins führen. Die Formanisotropie
hängt mit der speziellen Form eines Festkörpers zusammen. Sie wird durch die von der Form
abhängenden Entmagnetisierungsfelder verursacht. Die induzierte Anisotropie kann durch
elastischen Verspannungen erzeugt werden, die häufig in dünnen Filmen aufgrund der Git-
terfehlanpassung mit dem Substrat auftreten. Weitere Ursachen sind mechanischer Druck
oder Fluktuationen der chemischen Zusammensetzung. Zur induzierten Anisotropie kön-
nen wir auch die 1956 von Meiklejohn und Bean bei General Electric entdeckte unidirek-
tionale Austauschanisotropie63 , 64 rechnen, die in Zwei- oder Mehrlagensystemen aus ferro-
63
W. H. Meiklejohn, C. B. Bean, New Magnetic Anisotropy, Phys. Rev. 105, 904-913 (1957).
64
J. Nogués, I. K. Schuller, Exchange Bias, J. Magn. Magn. Mat. 192, 203-232 (1999).
736 12 Magnetismus
bestimmt. Wir werden im Folgenden die verschiedenen Beiträge zur freien Energiedichte
fani aufgrund der magnetokristallinen Anisotropie, der Formanisotropie und der induzier-
ten Anisotropie kurz diskutieren. Wir wollen hier auch noch darauf hinweisen, dass an Ober-
flächen und Grenzflächen aufgrund der dort gebrochenen Translationsinvarianz Anisotro-
piebeiträge auftreten können. Diese sind vor allem für sehr dünne magnetische Schichten
und Mehrschichtsysteme von Bedeutung, werden aber im Folgenden nicht diskutiert.
(a)
(b)
Abb. 12.30: Zur Ursache der magnetokristallinen Anisotropie. Aufgrund der endlichen Spin-Bahn-
Kopplung ist die Ladungsverteilung der Atome nicht mehr sphärisch. Die asphärische Ladungsver-
teilung (blau) ist über die Spin-Bahn-Kopplung an die Spin-Richtung (rot) gekoppelt und sorgt für
unterschiedliche Richtungen des Spins für eine unterschiedliche Austauschwechselwirkung und elek-
trostatische Wechselwirkungsenergie.
haben. Sie resultiert vielmehr aus der endlichen Spin-Bahn-Kopplung. Für das ferromagne-
tische Verhalten von z. B. Fe, Co oder Ni ist zwar hauptsächlich der Elektronenspin verant-
wortlich, durch die endliche Spin-Bahn-Kopplung ist aber die Spin-Richtung mit dem Bahn-
moment gekoppelt. Das bedeutet, dass das Kristallgitter über die Spin-Bahn-Kopplung auf
die Richtung der Spins einwirken kann. Für Elemente mit nicht vollständig gefüllten Schalen
(z. B. 3d-Elektronen in Übergangsmetallen oder 4 f -Elektronen in den Seltenen Erden) ist
die Elektronenverteilung eines Atoms nicht mehr sphärisch, wie in Abb. 12.30 schematisch
gezeigt ist. Dadurch resultiert eine Drehung der Bahnmomente in einer Änderung des Über-
lapps der Wellenfunktionen benachbarter Atome und damit in einer Änderung der elektro-
statischen Wechselwirkungsenergie. Die Bahnmomente haben deshalb bevorzugte kristallo-
graphische Richtungen und damit über die Spin-Bahn-Kopplung auch die Spin-Momente.
Insgesamt resultiert für verschiedene Spin-Richtungen relativ zu den kristallographischen
Achsen ein unterschiedlicher Überlapp der Elektronenwolken von benachbarten Atomen
und damit eine unterschiedliche Austauschenergie und elektrostatische Wechselwirkungs-
energie. Beide Effekte führen zur magnetokristallinen Anisotropie.
Die Berechnung der magnetokristallinen Anisotropie ist in der Regel schwierig. Es ist je-
doch anschaulich klar, dass der damit verbundene Beitrag fmc die Symmetrieeigenschaften
der elektronischen Struktur und damit des Kristallgitters aufweisen muss. Das bedeutet, dass
Symmetrieoperationen, die das Kristallgitter invariant lassen, auch fmc nicht ändern dürfen.
Wir können deshalb fmc nach geeigneten Funktionen f j (m(r)) entwickeln, die mit der Kris-
tallsymmetrie kompatibel sind:
fmc = K 0 + K 1 f 1 (m(r)) + K 2 f 2 (m(r)) + K 3 f 3 (m(r)) + . . . . (12.7.3)
Hierbei sind K j die Anisotropiekonstanten, welche die Einheit J/m3 besitzen. Da die Ma-
gnetisierungsrichtung m durch die Richtungskosinusse m i = cos α i = M i ⇑M der Winkel,
die eine willkürliche Magnetisierungsrichtung m = M⇑M mit den kartesischen Achsen ein-
schließt, ausgedrückt werden kann, werden meist Entwicklungen nach Potenzen der Rich-
tungskosinusse vorgenommen. Wir werden nur Systeme diskutieren, bei denen eine In-
versionssymmetrie vorliegt. In diesem Fall müssen alle f j gerade Funktionen der m i sein.
Statt einer Entwicklung nach Richtungskosinussen könnten wir auch eine Entwicklung nach
sphärischen Koordinaten vornehmen. In der Praxis wählt man natürlich eine Entwicklung,
die eine möglichst einfache Formulierung des Problems erlaubt. Wir betrachten im Folgen-
den einige einfache Fälle.
738 12 Magnetismus
mc = K 0 + K 1 sin ϑ + K 2 sin ϑ + . . . .
funi uni uni 2 uni 4
(12.7.4)
Hierbei ist K 0uni ein konstanter Beitrag, der auch weggelassen werden kann, und K 1uni
und K 2uni sind die uniaxialen Anisotropiekonstanten 1. und 2. Ordnung. Häufig ist es
ausreichend, nur den Term K 1uni sin2 ϑ zu berücksichtigen. Typische Beispiele der resultie-
renden Flächen konstanter freier Energiedichte sind in Abb. 12.31(a) und (b) für u parallel
zur z-Achse und unterschiedliches Vorzeichen von K 1uni gezeigt. Für K 1uni > 0 liegt die leichte
Achse in der x y-Ebene, für K 1uni < 0 senkrecht dazu.
mc = K 0
fkub + K 1kub (m 2x m 2y + m 2y m 2z + m 2z m 2x ) + K 2kub (m 2x m 2y m 2z ) + . . . ,
kub
(12.7.5)
wobei wir wieder berücksichtigt haben, dass für Systeme mit Inversionssymmetrie in der
Anisotropieenergie nur gerade Potenzen der Richtungskosinusse auftauchen dürfen. Fer-
ner haben wir ausgenutzt, dass die Anistotropieenergie invariant gegenüber einer Vertau-
schung der Richtungskosinusse sein muss. Diese Forderung wird in niedrigster Ordnung
durch die Kombination m 2x + m 2y + m 2z erfüllt. Diese ist allerdings immer gleich eins und
(a) z (c) z
𝑲𝐮𝐧𝐢
𝟏 >𝟎 𝑲𝐤𝐮𝐛
𝟏 >𝟎
108
12.7 Magnetische Anisotropie 739
führt zu einem isotropen Verhalten. Die nächst höheren Ordnungen sind die in (12.7.5) ent-
haltenen Kombinationen 4. und 6. Ordnung mit den kubischen Anisotropiekonstanten K 1kub
und K 2kub . Im einfachsten Fall können wir den Term 6. Ordnung (und den konstanten Bei-
trag) vernachlässigen und erhalten
mc ≃ K 1 (m x m y + m y m z + m z m x ) = 2 K 1 )︀1 − (m x + m y + m z )⌈︀ .
fkub kub 2 2 2 2 2 2 1 kub 4 4 4
(12.7.6)
In einfachster Näherung können wir den letzten Term vernachlässigen und erhalten eine
uniaxiale Anisotropie in Richtung der hexagonalen Achse, die wir mit den beiden hexago-
nalen Anisotropiekonstanten K 1hex und K 2hex charakterisieren können. Für K 1,2
hex
> 0 ist die
hexagonale Achse die leichte Achse.
Beispiele
In Tabelle 12.6 haben wir typische Werte für die Anisotropiekonstanten einiger magnetischer
Materialien angegeben. Eisen besitzt ein kubisch-raumzentriertes Kristallgitter. Da K 1kub > 0
ist, erfolgt die spontane Magnetisierung entlang der ∐︀100̃︀-Richtungen. Nickel besitzt ein
kubisch-flächenzentriertes Kristallgitter. Da K 1kub < 0 ist, sind hier die ∐︀111̃︀-Richtungen die
leichten Achsen. Kobalt hat ein hexagonales Kristallgitter. Die leichte Achse ist bei Raum-
temperatur die so genannte hexagonale Achse senkrecht zur hexagonalen Basisebene. Ko-
balt besitzt also in erster Näherung eine uniaxiale Anisotropie. Wir möchten noch darauf
hinweisen, dass hartmagnetische Materialien wie SmCo5 oder Nd2 Fe14 B Anisotropiekon-
stanten weit oberhalb von 2 MJ/m3 besitzen und sich deshalb sehr gut für leistungsfähige
Permanentmagnete eignen.
12.7.3 Formanisotropie
Um die mit der Form eines ferromagnetischen Festkörpers verbundene magnetische
Anisotropie abzuschätzen, müssen wir seine magnetostatische Selbstenergie betrachten.
Nach (12.1.26) ist sie für einen homogen magnetisierten Körper gegeben durch
E M = 12 µ 0 ∫ M ⋅ N ⋅ M dV = 12 µ 0 V N M 2 , (12.7.8)
V
beschrieben. Hierbei ist λ s die Sättigungsmagnetostriktion, die für Eisen λ s = −7 × 10−6 be-
trägt. Physikalische Ursache ist die durch die elastische Verformung des Festkörpers entstan-
dene Verzerrung der Ladungsverteilung. Diese führt zu einer Vorzugsrichtung des Bahndre-
himpulses und über die Spin-Bahn-Kopplung zu einer Vorzugsrichtung des Spins.65
12.7.4.2 Austauschanisotropie
Um die Grundzüge der Austauschanisotropie zu diskutieren, betrachten wir die in
Abb. 12.32a gezeigte ideale Grenzfläche zwischen einer ferromagnetischen und antifer-
romagnetischen Schicht. An der Grenzfläche sollen die Spins SFM und SAFM in der ferro-
und antiferromagnetischen Schicht die Austauschkopplung J ex besitzen und es soll ein
äußeres Magnetfeld Bext parallel zur Schichtstruktur angelegt sein. Naiv würden wir für
diese Anordnung folgenden Energiegewinn pro Flächeneinheit erwarten:
∆E nJ ex
= − 2 SFM ⋅ SAFM − MFM ⋅ Bext t FM . (12.7.11)
F 2ħ
Hierbei ist n die Flächendichte der wechselwirkenden Spins an der Grenzfläche, M FM die
Sättigungsmagnetisierung und t FM die Dicke der ferromagnetischen Schicht. Der erste Term
auf der rechten Seite bewirkt für J ex > 0 (ferromagnetische Kopplung) eine parallele Aus-
richtung der Spins an der Grenzfläche und der zweite (Zeeman-) Term eine Ausrichtung
M ∥ Bext . Wenn wir die Richtung des Magnetfeldes umpolen, erwarten wir ein Schalten der
Magnetisierung bei dem Feld B b , für das ∆E = 0 wird (wir nehmen ein verschwindend klei-
nes Koerzitivfeld des Ferromagneten an):
nJ ex S FM S AFM
Bb = . (12.7.12)
2ħ 2 M FM t FM
Wie in Abb. 12.32b gezeigt, wird die Hysteresekurve des Ferromagneten um B b verschoben,
weshalb wir von einer Austauschpolung (engl. exchange bias) sprechen. Den Beitrag der
Austauschanisotropie zur freien Energiedichte können wir mit (12.7.12) schreiben als
nJ ex S FM S AFM nJ ex S FM S AFM
ind = B b M FM =
faus = . (12.7.13)
2ħ 2 t FM 2ħ 2
(a) 𝑩𝐞𝐱𝐭
𝑻 > 𝑻𝑵 (b) 𝑩𝐞𝐱𝐭
𝑻 < 𝑻𝑵
Austausch-
kopplung
𝑴 𝑴
𝑩𝐞𝐱𝐭 𝑩𝐞𝐱𝐭
𝑩𝐛
Abb. 12.32: Zur Ursache der magnetischen Austauschanisotropie. In (a) ist T > TN , so dass die Spins
im Antiferromagneten noch ungeordnet sind und kein Nettoeffekt auf den Ferromagneten zustande
kommt. In (b) ist T < TN , so dass sich die Spins im Antiferromagneten ordnen. Durch den ferromagne-
tischen Grenzflächenaustausch (J ex > 0) resultiert an der Grenzfläche eine parallele Spin-Ausrichtung,
die zu einer Verschiebung der ferromagnetischen Hysteresekurve um das Austauschfeld B b führt.
Wir erwarten, dass für T ≪ TC in einem Ferromagneten alle magnetischen Momente par-
allel ausgerichtet sind, so dass wir bei einer Magnetisierungsmessung die Sättigungsmagne-
tisierung M s erhalten sollten. Trotzdem beobachten wir im Experiment häufig eine Magne-
tisierung M ≪ M s und das Material erscheint nach außen fast unmagnetisch zu sein. Die
Ursache dafür sind so genannte Weisssche Bezirke oder Domänen. Innerhalb dieser Domä-
nen sind die magnetischen Momente zwar ausgerichtet und die spontane Magnetisierung
entspricht der Sättigungsmagnetisierung, die Magnetisierung zeigt allerdings in verschiede-
nen Domänen in unterschiedliche Richtungen, so dass sich die Magnetisierungen der ein-
zelnen Domänen nach außen aufheben können. Magnetische Domänen treten nicht nur in
Ferromagneten auf, sondern auch in Ferri- und Antiferromagneten. Ganz allgemein wer-
den Domänen auch in zahlreichen anderen Stoffen, z. B. in Ferro- und Antiferroelektrika, in
ferroelastischen Stoffen oder in Supraleitern beobachtet. Dies zeigt, dass Domänen ein allge-
meines Phänomen sind und in vielen physikalischen Systemen eine wichtige Rolle spielen.
N N N N NN S S N S N S
Die Ursache für die Domänenbildung können wir uns anhand von Abb. 12.33 veranschauli-
chen (Bext = 0). Betrachten wir einen einkristallinen ferromagnetischen Festkörper, so kann
dieser im ferromagnetischen Zustand aus einer einzigen oder aus mehreren ferromagneti-
schen Domänen bestehen. In Abb. 12.33a liegt nur eine einzelne Domäne vor. Die Rich-
tung der Magnetisierung wird hierbei durch die in Abschnitt 12.7 diskutierte magnetische
Anisotropie festgelegt. Abb. 12.33 veranschaulicht, dass die magnetostatische Selbstenergie
E M = − 21 µ 0 ∫ HN ⋅ M dV [vergleiche (12.1.25)] bei einer eindomänigen Konfiguration be-
sonders groß ist. Sie ist immer positiv (HN ∥ −M) und führt zu einer Erhöhung der Ge-
samtenergie. Da Entmagnetisierungs- und Streufelder immer dann auftreten, wenn die Ma-
gnetisierung eine Normakomponente an der Oberfläche besitzt, können diese Felder und
damit die Selbstenergie durch Domänenbildung reduziert werden.
Für die in Abb. 12.33b und c gezeigten Konfigurationen nimmt die mit dem Streufeld ver-
bundene Energie ab, da wir durch Bildung von Domänen mit anti-paralleler Magnetisie-
rungsrichtung die Streufelder reduziert haben. Gleichzeitig müssen wir jedoch zum Aufbau
der Wände zwischen den einzelnen Domänen Energie aufwenden, da wir ja an der Domä-
nengrenze jetzt keine parallele Anordnung der Spins vorliegen haben und somit Austausch-
energie verlieren. Die Energieerhöhung EWand durch Domänenwände werden wir in Ab-
schnitt 12.8.3 diskutieren. Bezüglich der Minimierung der Streufeldenergie ist es besonders
günstig, wenn die antiparallel orientierten Domänen durch so genannte Abschlussdomänen
begrenzt sind (siehe Abb. 12.33d). Die Wand zwischen einer Abschlussdomäne und einer
in Abb. 12.33 senkrecht verlaufenden Domäne bildet mit der Magnetisierungsrichtung in
beiden Domänen einen 45○ Winkel. In diesem Fall gehen die Normalkomponenten der Ma-
gnetisierung an der Domänengrenze stetig ineinander über. Es treten deshalb keine magne-
tischen Pole auf und das magnetische Streufeld außerhalb des betrachteten Festkörpers ver-
schwindet. Allerdings müssen wir berücksichtigen, dass die Anisotropieenergie im Bereich
der Abschlussdomänen zu einer Energieerhöhung führt, da hier die Magnetisierungsrich-
tung nicht in die bevorzugte Richtung zeigt.
Um die Domänenstruktur zu bestimmen, müssen wir die totale freie Enthalpie des Systems
ermitteln, indem wir die Enthalpiedichte (12.7.2) aufintegrieren. Wir erhalten66
66
Wir weisen darauf hin, dass das Streu- bzw. Entmagnetisierungsfeld bereits über die Formani-
sotropie eingeht. Bei der Diskussion der magnetischen Anisotropie haben wir aber immer nur
eindomänige Systeme betrachtet und überlegt, in welche Richtung die Magnetisierung in solchen
Systemen durch das Wechselspiel von magnetokristalliner Anisotropie, Formanisotropie und in-
744 12 Magnetismus
12.8.3 Domänenwände
Zwischen zwei in unterschiedliche Richtungen magnetisierten Domänen in einem ferro-
magnetischen Material muss ein Bereich auftreten, in dem sich die Spin-Richtung ändert.
Wir wollen in diesem Abschnitt zeigen, dass sich beim Übergang von einer Domäne zur
benachbarten die Spin-Richtung nicht sprunghaft von einem Gitteratom zum nächsten än-
dert, sondern dass die Richtungsänderung innerhalb einer so genannten Domänenwand in
vielen kleinen Schritten über einen breiteren Bereich erfolgt. Man unterscheidet zwischen
zwei Typen von Domänenwänden, der Bloch-Wand und der Néel-Wand, je nachdem ob die
Änderung der Spin-Richtung in einer Ebene verläuft, die parallel oder senkrecht zur Domä-
nenwand ist.
12.8.3.1 Bloch-Wand
Bei einer Bloch-Wand erfolgt die Änderung der Spin-Richtung in einer Ebene, die paral-
lel zur Domänenwand ist. In Abb. 12.34a ist die Änderung der Spin-Orientierung in einer
duzierter Anisotropie zeigt. Jetzt betrachten wir mehrdomänige Systeme, bei denen jede einzelne
Domäne Entmagnetisierungsfelder erzeugt und wiederum selbst den Streufeldern der Nachbardo-
mänen unterliegt.
67
Alex Hubert, Rudolf Schäfer, Magnetic Domains: The Analysis of Magnetic Microstructures, Sprin-
ger-Verlag Berlin Heidelberg (1998).
12.8 Magnetische Domänen 745
dB dN
(a) (b)
Abb. 12.34: Schematische Darstellung der Spin-Orientierung in einer 180○ Bloch-Wand (a) und einer
180○ Néel-Wand (b) zwischen zwei in entgegengesetzte Richtung magnetisierten Domänen.
180○ Bloch-Wand schematisch dargestellt. Die Austauschkopplung zwischen zwei Spins, die
miteinander den Winkel φ einschließen, ist gegeben durch
S2
E φ = −J A cos φ . (12.8.3)
ħ2
Da cos φ ≤ 1, wird bei einer Verkippung benachbarter Spins die Austauschenergie reduziert.
Um diese Reduktion abzuschätzen, betrachten wir zwei Fälle: (i) Wir ändern die relative
Richtung der Spins nur an einer einzigen Stelle und zwar um 180○ , (ii) wir ändern die Spin-
Richtung kontinuierlich in n Schritten um kleine Winkel φ = 180○ ⇑n, so dass wir insgesamt
wieder eine Änderung um 180○ erhalten. Für die Änderung der Spin-Richtung an einer Stelle
um 180○ erhöhen wir die Energie um
S2
∆E 1 = 2J A , (12.8.4)
ħ2
2 2
da wir die Austauschkopplung von −J A ħS 2 nach +J A ħS 2 ändern. Für die Änderung in n kleinen
Winkelschritten erhalten wir nach (12.8.3)
S2 S2 φ2
E n = −nJ A cos φ = −nJ A (1 − ). (12.8.5)
ħ2 ħ2 2
Hierbei haben wir die Näherung cos φ ≃ 1 − 12 φ 2 verwendet, da φ ein kleiner Winkel sein
soll. Für die Änderung der Austauschkopplung gegenüber paralleler Ausrichtung ergibt sich
also
S 2 (nφ)
2
S 2 φ2 1 π2 S2
∆E n = nJ A 2
= ⋅ JA 2 = ⋅ JA 2 . (12.8.6)
ħ 2 n ħ 2 2n ħ
Vergleichen wir diesen Energiezuwachs ∆E n mit dem Zuwachs ∆E 1 , den wir für nur eine
einzige Winkeländerung um den gesamten Winkel 180○ = nφ erhalten haben, so ergibt sich
offensichtlich folgender Zusammenhang
1 π2 S 2 1 π2
∆E n = 2J A 2 = ∆E 1 . (12.8.7)
n 4 ħ n 4
746 12 Magnetismus
Wir sehen also, dass wir den Energiezuwachs klein halten können, indem wir die Anzahl n
der Kippschritte an einer Bloch-Wand vergrößern, das heißt, indem wir die Bloch-Wand
dicker machen.
Unsere bisherige Betrachtung würde natürlich implizieren, dass wir eine Bloch-Wand im
Prinzip unendlich breit machen sollten. Wir müssen allerdings bei unserer Analyse einen
weiteren Energieterm berücksichtigen, nämlich die Anisotropieenergie. Aufgrund der Ani-
sotropieenergie müssen wir Energie aufbringen, um einen Spin aus seiner energetisch güns-
tigsten Richtung (leichte Achse) herauszukippen. Da aber die Spin-Richtungen innerhalb
der Bloch-Wand fast alle nicht in die energetisch günstigste Richtung zeigen, ist es im Hin-
blick auf die Anisotropieenergie am besten, die Bloch-Wand möglichst dünn zu machen. Da
die Anisotropieenergie mit zunehmender Dicke der Bloch-Wand zunimmt, der Energiezu-
wachs aufgrund der Austauschkopplung dagegen abnimmt, stellt sich eine optimale Dicke
der Bloch-Wand ein, bei der die Summe der beiden Energien minimal ist.
Wir wollen die optimale Dicke einer 180○ Bloch-Wand (nφ = π) für ein kubisch primitives
Gitter mit Gitterkonstante a abschätzen. Für den Energiezuwachs pro Flächeneinheit F = a 2
aufgrund der Austauschkopplung gilt nach (12.8.6)
2
S
∆E n π 2 J A ħ 2
= . (12.8.8)
F 2na 2
Hierbei ist 1⇑a 2 die Anzahl der Spins pro Flächeneinheit. Die Anisotropieenergie pro Flä-
cheneinheit können wir näherungsweise schreiben als
∆E ani
≃ Kna , (12.8.9)
F
das heißt, als Produkt aus Isotropiekonstante K und Breite na der Bloch-Wand. Damit er-
halten wir für die Wandenergie
E Wand π 2 J A S 2
= 2 + Kna . (12.8.10)
F ħ 2na 2
Dieser Ausdruck besitzt ein Minimum für
1 ∂E Wand π2 J A S 2
= − 2 2 2 + Ka = 0 , (12.8.11)
F ∂n ħ 2n a
das heißt, für die Wanddicke
1⇑2
π2 J A S 2
d B = na = ( ) . (12.8.12)
ħ 2 2Ka
Wir sehen, dass die Breite d B der Bloch-Wand umso größer wird, je größer der Wert der
Kopplungskonstante J A und je kleiner die Anisotropiekonstante K ist. Für Eisen beträgt die
Dicke einer Bloch-Wand typischerweise 40 nm bzw. n ≃ 300.
12.8 Magnetische Domänen 747
12.8.3.2 Néel-Wand
In dünnen Filmen ist die Ausbildung einer Bloch-Wand energetisch ungünstig, da im Wand-
bereich die Magnetisierungsrichtung aus der Filmebene herausdrehen müsste, was zu einem
großen Streufeld führen würde. Es treten hier bevorzugt Néel-Wände auf (siehe Abb. 12.34b),
bei denen die Spins in einer Ebene senkrecht zur Wandfläche drehen. Die obige Ableitung
für die Dicke der Domänenwand gilt auch für Néel-Wände, wobei für die Néel-Wand noch
ein zusätzlicher Streufeldbeitrag berücksichtigt werden muss. In sehr dünnen Filmen wer-
den Oberflächenbeiträge zur magnetokristallinen Anisotropie wichtig, so dass hier wegen
der großen Oberflächenbeiträge wiederum Bloch-Wände auftreten können.
Laserstrahl
Balken
Eine hohe räumliche Auflösung im Bereich zwischen 10 und 100 nm erhält man ebenfalls
mit der Magnetischen Rasterkraftmikroskopie (MFM: Magnetic Force Microscopy, siehe
Abb. 12.35), bei der die unmagnetische Spitze eines gewöhnlichen Rasterkraftmikroskops
durch eine ferromagnetische Spitze ersetzt wird und die Kraft aufgrund der Wechselwir-
kung zwischen ferromagnetischer Spitze und dem Streufeld über einer magnetischen Pro-
be gemessen wird. Auf die ferromagnetische Spitze wirkt aufgrund des Feldgradienten eine
Kraft, die die Spitze zur Probe hin oder von der Probe weg bewegt. Die daraus resultieren-
748 12 Magnetismus
de Verbiegung des Balkens kann mit Hilfe der Ablenkung eines auf den Balken treffenden
Laserstrahls bestimmt werden.
12.8.5 Magnetisierungskurve
Mit unseren jetzigen Kenntnissen können wir diskutieren, wie sich die Magnetisierung ei-
nes ferromagnetischen Materials als Funktion eines äußeren Magnetfeldes verhält. Bringen
wir ein ferromagnetisches Material in ein äußeres Magnetfeld, so müssen wir zusätzlich zu
den oben genannten Energiebeiträgen (magnetostatische Selbstenergie, Wandenergie, Ani-
sotropieenergie) auch noch den Energiebeitrag durch das äußere Feld (Zeeman-Energie)
berücksichtigen. Letzterer versucht, die Magnetisierung parallel zum äußeren Feld zu stel-
len. Erhöhen wir das äußere Magnetfeld, so ändert sich aufgrund des zusätzlichen Energie-
beitrags die Domänenstruktur des ferromagnetischen Materials. Zuerst erfolgt bei kleinen
Feldstärken eine Wandverschiebung, die anfangs reversibel und bei höheren Feldern irrever-
sibel verläuft. Diese bewirkt ein Wachstum von Domänen mit einer relativ zum äußeren
Feld günstigen Magnetisierungsrichtung und einem Schrumpfen von solchen mit ungüns-
tiger Richtung. Anschließend folgen bei höheren Feldstärken Rotationsprozesse, bei denen
die Magnetisierungsrichtung in Feldrichtung gedreht wird (siehe hierzu Abb. 12.36, links).
(a) 𝑴
𝑴𝒔
𝑩𝐞𝐱𝐭 = 𝟎 𝑴𝒓
irreversible Drehung
Wandver- der
schiebung Magneti-
(b) sierungs-
richtung
𝑩𝐞𝐱𝐭
−𝑩𝒌 reversible 𝑩𝒌 𝑩𝐞𝐱𝐭
Wandver-
schiebung
(c)
−𝑴𝒓
𝑩𝐞𝐱𝐭
−𝑴𝒔
Abb. 12.36: Links: Schematische Darstellung der Änderung der Domänenstruktur eines einkristalli-
nen Ferromagneten unter dem Einfluss eines äußeren Magnetfeldes B ext = µ 0 H ext : (a) B ext = 0, (b) Be-
126
reich der Wandverschiebung, (c) Bereich der Drehung der Magnetisierung in Richtung des angelegten
Magnetfeldes. Rechts: Magnetisierungskurve eines Ferromagneten mit Sättigungsmagnetisierung M s ,
Remanenz M r und Koerzitivfeld B k .
Aus den eben beschriebenen Prozessen folgt die in Abb. 12.36 (rechts) gezeigte Magnetisie-
rungskurve eines Ferromagneten, die eine ausgeprägte Hysterese besitzt. Der steile Anstieg
der Kurve bei kleinen Feldstärken resultiert aus der Wandverschiebung, während der fla-
che Verlauf bei höheren Feldstärken durch Drehprozesse verursacht wird. Schalten wir das
Magnetfeld nach einer vollen Aufmagnetisierung des Ferromagneten wieder ab, so geht die
Magnetisierung nicht auf null zurück, sondern es verbleibt die mit M r gekennzeichnete Re-
12.8 Magnetische Domänen 749
manenz zurück. Um die remanente Magnetisierung zu beseitigen, müssen wir das Magnet-
feld in entgegengesetzte Richtung bis zum Koerzitivfeld B k erhöhen.
Beim Durchfahren einer kompletten Hystereseschleife wird die Energiedichte ∮ µ 0 MdH ext
dissipiert, die proportional zur Fläche der Hystereseschleife ist. Für Transformatorkerne,
bei denen die Hystereseschleife periodisch durchfahren wird, verwendet man deshalb mög-
lichst Materialien, bei denen die Hystereseschleife sehr klein ist. Dies erreicht man z. B.
durch sehr kleine Koerzitivfelder (magnetisch weiche Materialien). Die Koerzitivfeldstärke
des für Pulstransformatoren verwendeten Materials Supermalloy (79% Ni, 15% Fe, 5% Mo)
beträgt z. B. nur etwa 0.005 Gauss. Für kommerzielle Netztransformatoren wird meist Fe-
Si(4%) mit B k ≃ 0.5 Gauss verwendet. Für Permanentmagnete will man dagegen möglichst
große Koerzitivfelder (magnetisch harte Materialien) und eine hohe Remanenz haben (z. B.
Fe14 Nd2 B: B k ≥ 1 T, µ 0 M r ≥ 1.2 T). Das hohe Koerzitivfeld verhindert, dass der Haftmagnet
bereits durch kleine Magnetfelder seine Magnetisierung verliert. Die hohe Remanenz resul-
tiert in einer hohen magnetischen Haftkraft.
so muss auch die Größe dieser Teilchen verkleinert werden, um eine gleichbleibende Zahl
von Teilchen pro Bit zu gewährleisten und dadurch statistische Schwankungen im Lesesi-
gnal klein zu halten. Dies führt allerdings zum Problem des so genannten Superparama-
gnetismus. Die Anisotropieenergie der Teilchen wird bei immer kleiner werdendem Volu-
men irgendwann so klein, dass sie in den Bereich der thermischen Energie k B T kommt. Die
Teilchen können dann ihre Magnetisierungsrichtung durch thermische Aktivierung drehen.
Der gesamte magnetische Film verhält sich somit wie ein System von nicht wechselwirken-
den magnetischen Momenten, deren Ausrichtung aufgrund der großen thermischen Ener-
gie im Nullfeld beliebig ist. Das heißt, der magnetische Film verhält sich wie ein Paramagnet.
Da die magnetischen Momente aber immer noch groß gegenüber den atomaren Momenten
sind, spricht man von Superparamagnetismus.
Dem Problem des Superparamagnetismus kann im Prinzip dadurch begegnet werden, dass
Materialien mit einer größeren Anisotropieenergie verwendet werden. Durch Vergrößern
der Anisotropiekonstante K kann das Volumen V eines Bits entsprechend verkleinert wer-
den ohne die magnetische Anisotropieenergie KV zu ändern. Die Vergrößerung der ma-
gnetischen Anisotropie hat aber auch zur Folge, dass beim Schreibvorgang höhere Felder
erzeugt werden müssen, um die Magnetisierungsrichtung zu drehen. Eine Lösung stellt das
Heat-Assisted-Magnetic-Recording-(HAMR-) Verfahren dar. Dabei wird das magnetische
Medium mit einem Laser präzise lokal an der Stelle erwärmt, an der gerade Daten geschrie-
ben werden sollen. Außerdem wird seit etwa 2005 die Magnetisierungsrichtung in den ein-
zelnen Bits nicht mehr in der Ebene des ferromagnetischen Films sondern senkrecht dazu
ausgerichtet (PMR: Perpendicular Magnetic Recording). Dadurch kann einerseits der vom
Schreibkopf erzeugte magnetische Fluss effektiver eingekoppelt werden und somit auch bei
höherem Koerzitivfeld geschrieben werden. Andererseits kann durch das Senkrechtstellen
der magnetischen Bits bei gleichem Bit-Volumen eine höhere Flächendichte erreicht werden.
2000: 17 GB/in²
1990: 0.1 GB/in²
1984: 0.04 GB/in²
Abb. 12.37: Verkleinerung des Bitmusters auf einer magnetischen Festplatte zwischen 1984 und 2000.
Der Bildauschnitt beträgt jeweils 30 × 30 µm2 (Quelle: IBM Deutschland).
12.9 Magnetisierungsdynamik 751
12.9 Magnetisierungsdynamik
Wir haben in Abschnitt 12.7.2 gesehen, dass die Magnetisierung in einem Ferromagneten ei-
ne Vorzugsrichtung hat, die durch ein Minimum der freien Enthalpiedichte gegeben ist. Wir
betrachten im Folgenden die Dynamik der Magnetisierung eines homogen magnetisierten
Ferromagneten unter der Wirkung von äußeren Kräften. Dabei gehen wir zunächst davon
aus, dass die einzelnen Momente im Ferromagneten starr gekoppelt sind und sich nur als Ge-
samtheit phasensynchron drehen können. Das bedeutet, dass wir uns auf die Diskussion der
homogenen Mode mit Wellenzahl q = 0 bzw. Wellenlänge λ = ∞ beschränken. Wir werden
unsere Diskussion in Abschnitt 12.10 bei der Diskussion von Spinwellen auf q > 0 erweitern.
Mit den gemachten Annahmen können wir die Magnetisierung als klassischen Makrospin
betrachten und für seine Bewegung eine klassische Bewegungsgleichung aufstellen.
Im Gleichgewicht zeigt die Magnetisierungsrichtung m = M⇑M in Richtung eines effektives
Magnetfeldes
das sich aus einem statischen und zeitabhängigen externen Feld sowie einem Feld aufgrund
von Anisotropieeffekten und dem Austauschfeld zusammensetzt. Das Anisotropiefeld
1
Bani = − ∇m gani , (12.9.2)
M
wird durch den Gradienten der freien Enthalpiedichte gani bezüglich der Magnetisierungs-
richtung m bestimmt. Das Austauschfeld BA beschreibt die Wechselwechselwirkung zwi-
schen benachbarten Momenten in der hier gemachten Kontinuumsbeschreibung. Für kleine
Verkippungen φ benachbarter Momente ist es proportional zur Austauschkonstante J A , zur
Dichte n der Momente und zum Quadrat der Verkippung
n na 2 ∇M 2
BA = − JA φ2 = − JA ( ) . (12.9.3)
M M M
Hierbei haben wir die gegenseitige Verkippung der Momente durch φ ≃ ∇ma, d.h. durch
einen Gradienten der Magnetisierungsrichtung m und den Abstand a der Momente aus-
gedrückt. Da wir hier nur die homogene Mode mit parallel angeordneten Momenten, also
φ = 0 diskutieren wollen, ist für die folgende Betrachtung das Austauschfeld nicht relevant.
Es spielt bei den in Abschnitt 12.10.1 diskutierten Austauschmoden eine zentrale Rolle.
Lenken wir M aus seiner Gleichgewichtslage aus, so wirkt ein Drehmoment
T = V M × Beff (12.9.4)
das senkrecht auf M und Bext steht (siehe Abb. 12.38a). Das Drehmoment bewirkt also eine
Präzessionsbewegung des Magnetisierungsvektors um die Feldrichtung. Es liegt damit eine
Situation ähnlich zum Kreisel vor, der einer einwirkenden Kraft (z.B. der Schwerkraft) eben-
falls senkrecht ausweicht. Ohne Dämpfung besteht die Präzessionsbewegung für alle Zeiten
fort.
752 12 Magnetismus
𝑴
𝑴 −𝑴 × 𝑩𝐞𝐟𝐟
Abb. 12.38: Zur Ableitung der Landau-Lifshitz-Gilbert-Gleichung. Die Auslenkung der Magnetisie-
rung aus ihrer Gleichgewichtslage parallel zum effektiven Magnetfeld resultiert in einer Präzessions-
bewegung um Beff . In (a) ist der Fall ohne in (b) mit Dämpfung gezeigt.
Das gesamte magnetische Moment µ = V M der Probe ist mit dem Drehimpuls
µ V
L=− =− M (12.9.5)
γ γ
verbunden, wobei γ = g µ B ⇑ħ das gyromagnetische Verhältnis ist. Aus T = dL⇑dt folgt dann
die Bewegungsgleichung
dM
= −γ M × Beff . (12.9.6)
dt
Diese Gleichung, die sich sowohl klassisch als auch quantenmechanisch herleiten lässt, wur-
de erstmals 1935 von Landau und Lifshitz formuliert. Multiplizieren wir diese Gleichung
von links mit M, so erhalten wir
dM 1 d 2
M⋅ = M = −γ M ⋅ (M × Beff ) = 0 . (12.9.7)
dt 2 dt
Wir sehen also, dass der Betrag der Magnetisierung zeitlich konstant bleibt. Landau und
Lifshitz haben Gleichung (12.9.6) mit einem phänomenologischen Dämpfungsterm
F λ = λ M × (M × Beff ) . (12.9.8)
20 Jahre nach der Formulierung der Landau-Lifshitz-Gleichung stellte Gilbert fest, dass der
von Landau und Lifshitz eingeführte Dämpfungsterm für große λ zu einem unphysikali-
schen Verhalten führt.70 Gilbert erweiterte deshalb den Dämpfungsterm um einen Dissi-
pationsterm, der die Ankopplung an ein Wärmebad berücksichtigt. Die von ihm erhaltene
Gilbert-Gleichung lautet71 , 72
dM dM
= −γ M × Beff + α M × . (12.9.10)
dt dt
Diese Gleichung kann in die Landau-Lifshitz-Gilbert-Gleichung 73
dM γ αγ
=− M × Beff + M × (M × Beff ) (12.9.11)
dt 1 + α2 M2 1 + α2 M2
transformiert werden, welche die Korrektur des Dämpfungsterms durch Gilbert enthält,
aber ansonsten die gleiche Struktur wie die Landau-Lifshitz-Gleichung (12.9.9) besitzt. Üb-
licherweise wird der dimensionslose Parameter G = αM als Gilbert-Dämpfungskonstante
bezeichnet. Die Landau-Lifshitz-Gilbert-Gleichung liefert auch für große Dämpfungspara-
meter physikalisch sinnvolle Ergebnisse. Der von Gilbert eingeführte neue dimensionslose
Dämpfungsparameter G = αM ist wie η eine rein phänomenologische Größe, welche die
Stärke von dissipativen Prozessen beschreibt, die aber im Detail nicht bekannt sind. Wir se-
hen, dass in (12.9.11) die Gilbert-Dämpfungskonstante G sowohl im Präzessions- als auch
im Dämpfungsterm auftaucht. Für G ≪ 1 geht die Landau-Lifshitz-Gilbert-Gleichung in die
Landau-Lifshitz-Gleichung über. In diesem Fall können wir G 2 im Nenner vernachlässigen
und αγ mit λ identifizieren.
𝑩𝐞𝐟𝐟 𝑴×
𝒅𝑴
𝒅𝒕
−𝑴 × 𝑩𝐞𝐟𝐟
𝑴
−𝑴 × 𝑩𝟏
Abb. 12.39: Darstellung der unterschiedlichen Drehmo- Θ
mente bei der Ferromagnetischen Resonanz in einem
mit der Resonanzfrequenz rotierenden Bezugssystem. 𝑩𝟏
12.10 Spin-Wellen
Wir haben in Abschnitt 12.6.2.2 gesehen, dass wir die für tiefe Temperaturen beobachte-
te Temperaturabhängigkeit der Sättigungsmagnetisierung von Ferromagneten nicht mit ei-
74
A. H. Morrish, The Physical Principles of Magnetism, IEEE Press, New York (1999).
75
C. Kittel, On the Theory of Ferromagnetic Resonance Absorption, Phys. Rev. 73, 155-161 (1948).
12.10 Spin-Wellen 755
𝑬
𝑬𝐅
𝚫
Wir wollen in diesem Abschnitt eine weitere Möglichkeit für die Änderung des Gesamt-
moments diskutieren. Statt nur das Moment eines einzelnen Gitteratoms ganz umzudrehen,
können wir auch die Momente aller Gitteratome um nur einen kleinen Betrag ändern, das
heißt, wir können die Anregung auf alle Gitteratome aufteilen. Wir sprechen in diesem Fall
von kollektiven Anregungen des gesamten Systems. Diese kollektiven Anregungen bezeich-
nen wir als Spin-Wellen. Ihre mathematische Beschreibung ist weitgehend ähnlich zur Be-
schreibung von Gitterschwingungen. Spin-Wellen sind Oszillationen in der relativen Orien-
tierung von magnetischen Momenten auf einem Gitter. Gitterschwingungen sind Oszillatio-
nen der relativen Positionen von Atomen auf einem Gitter. Da der Betrag des magnetischen
Moments gleich bleibt, benötigen wir nur zwei Freiheitsgrade, um die Bewegung einer Spin-
Wellenanregung zu beschreiben. Die Dimensionalität der Anregungen ist damit kleiner als
154
bei Gitterschwingungen. Die Energie der Spin-Wellen ist quantisiert. Die Quanten der Spin-
Wellen bezeichnen wir als Magnonen. Sie lassen sich wie andere elementare Anregungen
(wie z. B. Phononen) als Quasiteilchen auffassen, die der Bose-Einstein-Statistik gehorchen.
Spin-Wellen spielen in ferro-, ferri- und antiferromagnetischen Materialien eine wichtige
Rolle. Wir werden sie anhand von ferromagnetischen Materialien einführen und später in
Abschnitt 12.10.3 auch kurz auf Spin-Wellen in Antiferromagneten eingehen.
In Abschnitt 12.9 haben wir bereits die Dynamik des Spin-Systems für den Fall verschwin-
dender Wellenzahl (q = 0) bzw. großer Wellenlänge (λ = ∞) diskutiert (homogene Mode).
Wir werden jetzt eine Verallgemeinerung für endliche Wellenzahlen q > 0 vornehmen. Für
die homogene Mode konnten wir den Beitrag des Austauschfeldes B A zum effektiven Feld
B eff [vergleiche (12.9.2)] vernachlässigen, da ja bei der uniformen Bewegung alle Spin par-
756 12 Magnetismus
allel ausgerichtet bleiben. Dies ändert sich, wenn wir zu großen q bzw. kleinen λ übergehen.
Da jetzt die gegenseitige Verkippung der Spins groß wird, ist die Austauschwechselwirkung
zwischen den magnetischen Momenten die dominierende Wechselwirkung. Entsprechend
sprechen wir von Austauschmoden. Für kleiner werdende q bzw. größer werdende λ wird
der Einfluss der Austauschwechselwirkung kleiner und es überwiegt dann irgendwann wie-
der der Beitrag der magnetischen Anisotropie. Da bei großen Wellenlängen häufig dipolare
Wechselwirkungen aufgrund von Streufeldern (Formanisotropie) dominant werden, spre-
chen wir hier auch von dipolaren Moden.
12.10.1 Austauschmoden
Wir werden im Folgenden zunächst die Austauschmoden diskutieren. Dabei nehmen wir
eine semi-klassische Beschreibung vor, bei der wir die magnetischen Momente, die wir ja
durch quantenmechanische Drehimpulsoperatoren beschreiben müssten, durch klassische
Vektoren der Länge S = ⋃︀S⋃︀ ersetzen. Im Rahmen des Heisenberg-Modells (12.5.7) erhalten
wir für die Kopplungsenergie eines Spins mit seinem linken und rechten Nachbarn in einer
Spin-Kette bei paralleler Spin-Stellung (siehe Abb. 12.41a)
JA JA JA
EA = − (S i−1 ⋅ Si + S i ⋅ S i+1 ) = − 2 S i ⋅ (S i−1 + S i+1 ) = −2 2 S 2 . (12.10.1)
ħ2 ħ ħ
Hierbei ist wichtig, dass das letzte Gleichheitszeichen nur dann gilt, wenn wir die Spins als
klassische Vektoren der Länge S auffassen. Klappen wir den Spin S i um, so erhalten wir E A =
+2J A S 2 ⇑ħ 2 . Das heißt, die Anregungsenergie beträgt 4J A S 2 ⇑ħ 2 . Es kann gezeigt werden, dass
die semi-klassische Behandlung zum gleichen Ergebnis wie eine exakte quantenmechanische
Behandlung führt.76 Um die Diskussion einfach zu halten, werden wir wie bei der Diskussi-
on der Gitterschwingungen in Kapitel 5 ein eindimensionales System, also eine Spin-Kette
aus N Spins betrachten und annehmen, dass wir nur Wechselwirkungen zwischen nächsten
(a) (b)
(c)
(d)
Abb. 12.41: (a) Klassisches Bild des Grundzustandes eines Ferromagneten: alle magnetischen Momen-
te sind parallel ausgerichtet. (b) Eine mögliche Anregung des Grundzustandes ist das Umklappen eines
einzelnen Moments. Eine weitere Anregungsmöglichkeit sind Spin-Wellen. In (c) und (d) ist eine Spin-
Welle in einer linearen Kette gezeigt [(c) perspektivische Darstellung und (d) Blick auf die Spins von
oben].
76
D. D. Stancil, A. Prabhakar, Spin Waves: Theory and Applications, Springer Verlag, Berlin (2009).
12.10 Spin-Wellen 757
JA N
EA = − ∑ S i ⋅ (S i−1 + S i+1 ) . (12.10.2)
ħ 2 i=1
also als Produkt eines magnetischen Moments µ i und eines Austauschfeldes B A,i , so erhalten
wir mit Hilfe von (12.10.2)
JA
B A,i = − (S i−1 + S i+1 ) . (12.10.5)
gs µB ħ
Schalten wir zusätzlich eine externes Magnetfeld Bext ein, so beträgt das effektive Feld
JA
Beff ,i = Bext + B A,i = Bext − (S i−1 + S i+1 ) . (12.10.6)
gs µB ħ
In einer semi-klassischen Behandlung ist die zeitliche Ableitung des Drehimpulses S i gleich
dem am Spin S i angreifenden Drehmoment. Es gilt also
dS i gs µB
= (µ i × Beff ,i ) = − (S i × Beff ,i ) = −γ(S i × Beff ,i )
dt ħ
gs µB JA
=− (S i × Bext ) + 2 (︀S i × (S i−1 + S i+1 )⌋︀ . (12.10.7)
ħ ħ
Hierbei ist γ = g s µ B ⇑ħ das gyromagnetische Verhältnis. In kartesischen Koordinaten erhal-
ten wir dann
dS i,x gs µB
=− (S i, y B ext
z − Siz B y )
ext
dt ħ
JA
+ 2 )︀S i, y (S i−1,z + S i+1,z ) − S i,z (S i−1, y + S i+1, y )⌈︀ (12.10.8)
ħ
dS
sowie durch zyklisches Vertauschen von x, y und z zwei weitere Gleichungen für d i,t y
und dSd ti,z . Diese Gleichungen sind in den Spin-Komponenten nichtlinear. Wir können
allerdings eine Linearisierung erreichen, indem wir annehmen, dass wir uns bei genügend
tiefen Temperaturen befinden, bei denen annähernd eine vollständige Magnetisierung
758 12 Magnetismus
in Richtung des angelegten Feldes vorliegt. Ist Bext ∥ ⧹︂ z, so ist ⋃︀S i,x ⋃︀, ⋃︀S i, y ⋃︀ ≪ ⋃︀S i,z ⋃︀ und wir
können Terme, die quadratisch in ⋃︀S i,x ⋃︀ und ⋃︀S i, y ⋃︀ sind, vernachlässigen. Außerdem können
wir S z ≃ −⋃︀S⋃︀ = −S setzen. Hierbei haben wir durch das negative Vorzeichen von S berück-
sichtigt, dass die Ausrichtung des magnetischen Moments µ = −g s µ B S⇑ħ und damit der
Magnetisierung M ∝ µ parallel zum äußeren Feld, also in positive z-Richtung erfolgt.
Mit B ext = B z = B und den gemachten Näherungen erhalten wir aus (12.10.8)
dS i,x gs µB B JAS
=− S i, y − 2 )︀2S i, y − S i−1, y − S i+1, y ⌈︀ (12.10.9)
dt ħ ħ
dS i, y gs µB B JAS
=+ S i,x + 2 (︀2S i,x − S i−1,x − S i+1,x ⌋︀ (12.10.10)
dt ħ ħ
dS i,z
=0 (12.10.11)
dt
Als Lösungsansatz verwenden wir ebene Wellen der Form (siehe hierzu Abb. 12.41c und d)
g s µ B B 2J A S
ω= + 2 (1 − cos qa) . (12.10.18)
ħ ħ
Für den langwelligen Grenzfall qa ≪ 1 und B = 0 erhalten wir mit 1 − cos qa ≃ 12 (qa)2 die
Näherung
J A Sa 2 2
ω≃ q = Aq 2 . (12.10.19)
ħ2
12.10 Spin-Wellen 759
2.0
1.6
(2JAS / ћ2)
1.2
0.8
0.4
0.0
Abb. 12.42: Dispersionsrelation für ferromagne-
-1.0 -0.5 0.0 0.5 1.0 tische Spin-Wellen in einer eindimensionalen
q (/a) Spinkette nach Gleichung (12.10.18) für B ext = 0.
156
S y = ıS x . (12.10.20)
Wir sehen, dass die Amplituden von S x und S y gleich groß sind, dass allerdings zwischen ih-
nen eine Phasenverschiebung von π⇑2 besteht. Wir erhalten somit eine zirkulare Präzession
der Spins um die z-Achse mit der Larmor-Frequenz ω = g s µ B B eff ⇑ħ, wobei von Gitteratom
zu Gitteratom zwischen der Präzessionsbewegung der Spins eine Phasenschiebung von qa
besteht (siehe hierzu Abb. 12.41). Für q = 0 präzedieren damit die Spins auf allen Gitterplät-
zen in Phase.
Unsere bisherige Betrachtung, die wir für eine eindimensionale Spin-Kette gemacht haben,
kann leicht auf ein dreidimensionales kubisches Gitter ausgedehnt werden. Für B = 0 erhal-
ten wir die Dispersionsrelation
JAS z
ω= ∑(1 − cos q ⋅ r i ) . (12.10.21)
ħ 2 i=0
Dabei müssen wir die Summation über sämtliche Gittervektoren r i ausführen, die das be-
trachtete Atom mit seinen nächsten Nachbarn verbinden. Bei einem kubisch primitiven Git-
ter sind dies 6, beim kubisch raumzentrierten Gitter 8 und beim kubisch flächenzentrierten
Gitter 12 Vektoren. In allen drei Fällen erhalten wir für den langwelligen Grenzfall qa ≪ 1,
wobei a jetzt die Gitterkonstante des kubischen Gitters ist, die Näherung ω ∝ q 2 .
Die experimentelle Untersuchung der Dispersion der Spin-Wellen erfolgt üblicherweise mit
Hilfe von Spin-Wellenresonanz und inelastischer Neutronenbeugung (vergleiche hierzu Ab-
schnitt 5.5.1). Im Gegensatz zu Röntgenphotonen, die nur die Ladungsverteilung innerhalb
eines Festkörpers sehen, aber nicht, ob diese eine bestimmte Spin-Richtung besitzen, sehen
Neutronen die Verteilung der Kerne und die Verteilung der magnetischen Momente. Dies
760 12 Magnetismus
liegt daran, dass das magnetische Moment der Neutronen mit den magnetischen Momen-
ten der Atome im Festkörper wechselwirkt. Mit Hilfe von elastischer Neutronenstreuung
kann deshalb die Verteilung, die Richtung und die Ordnung der magnetischen Momente
in einem Festkörper bestimmt werden. Ferner kann durch inelastische Neutronenstreuung
die Dispersion von Spin-Wellen bestimmt werden. Dabei wird ein Neutron inelastisch an
der magnetischen Struktur gestreut, wobei ein Magnon mit Energie ħω und Wellenvektor q
erzeugt oder vernichtet wird. Üblicherweise wird für den langwelligen Grenzfall die Spin-
Wellensteifigkeit A = ħω⇑q 2 = J A a 2 S⇑ħ bestimmt, aus der dann die Austauschkonstante ab-
geleitet werden kann. Für Fe, Co und Ni werden die Werte 281, 500 und 364 meVÅ2 erhalten.
In Neutronen-Streuexperimenten werden Spin-Wellen bis nahe an die Curie-Temperatur ge-
funden.
12.10.1.1 Stoner-Anregungen
𝑬 (a) 𝑬 (b)
𝑬↓
Abb. 12.43: (a) Schematische Dar-
stellung der Dispersionrelation von 𝑰
Spin-Wellen und des Anregungs- Stoner 𝑬𝐅 𝚫
Anregungen 𝑬↑
spektrums der Einelektronenanre- 𝑰
gungen mit Spin-Umkehr in einem
Ferromagneten. In (b) ist die Band- 𝚫 𝒒𝐦𝐢𝐧
struktur mit der Austauschaufspal- Spin-Wellen
tung I und der Stoner-Lücke ∆ gezeigt. 𝟎 𝒒𝐦𝐢𝐧 𝒒 𝟎 𝒌
In Abb. 12.43 ist die Dispersionsrelation von Spin-Wellen zusammen mit dem Spektrum der
Einzelelektronenanregungen gezeigt. Letztere werden Stoner-Anregungen genannt. Man er-
hält sie durch Anregung eines Elektrons von dem Majoritäts-Spinband in das Minoritäts-
Spinband. Hierzu ist für q = 0 (wir benutzen q für den Wellenvektor der Anregung und k
für den Wellenvektor der Elektronen) eine Anregungsenergie I notwendig. Hierbei ist I die 157
Austauschaufspaltung der beiden Spin-Bänder, die proportional zu zJ A ist (z ist die Zahl
der nächsten Nachbarn). Für q ≠ 0 gibt es ein ganzes Spektrum von möglichen Anregun-
gen (schraffierte Fläche in Abb. 12.43), das sich aus der Dispersion der Einelektronenzu-
stände ergibt. Die minimale Anregungsenergie ist durch die Stoner-Lücke ∆ gegeben. Die
Stoner-Lücke gibt gerade die Energie an, die benötigt wird, um ein Spin-↑-Elektron in einen
Spin-↓-Zustand beim Fermi-Niveau E F anzuregen. Im Gebiet der Einelektronenanregungen
können Spin-Wellen in Einelektronenanregungen zerfallen. Dies reduziert die Lebensdauer
von Spin-Wellen und beeinflusst ferner ihre Dispersion (siehe hierzu Abb. 12.44).
50
Abb. 12.44: Dispersionsrelation für
Spin-Wellen in Ni entlang der [111]-
40 Richtung gemessen bei Raumtem-
peratur. Die gestrichelte Linie zeigt
die ω ∝ q 2 Abhängigkeit bei kleinen
Zonengrenze
30 q-Vektoren. Es kommt zu Abweichun-
(THz)
⌋︂
1⇑2
dω 2J A Sa 2 q J A Sa 2
= = 2 ( ) ω (12.10.25)
dq ħ2 ħ2
erhalten. Setzen wir dies in (12.10.24) ein, so ergibt sich
⌋︂
3⇑2
V ħ2
D(ω) = ( ) ω. (12.10.26)
4π 2 J A Sa 2
762 12 Magnetismus
Mit dieser Zustandsdichte erhalten wir die Gesamtzahl der angeregten Magnonen zu
3⇑2 ∞ ⌋︂
V ħ ω
∑ nq = 2 ( ) ∫ dω ħω⇑k T
q 4π J A Sa 2 e B −1
0
∞ ⌋︂
V k B T 3⇑2 x
= 2( ) ∫ dx x . (12.10.27)
2
4π J A a S e −1
0
V k B T 3⇑2
∑ n q = 0.0587 ( ) (12.10.28)
q a3 JA S
erhalten.
Die Spin-Quantenzahl des gesamten Systems beträgt bei T = 0 gerade N S⇑ħ und bei endli-
cher Temperatur N S⇑ħ − ∑q n q , wobei N die Anzahl der Gitteratome des betrachteten Kris-
talls mit Volumen V ist. Damit können wir die relative Änderung der Sättigungsmagnetisie-
rung durch
∑ nq
M s (0) − M s (T) ∆M s q
= = (12.10.29)
M s (0) M s (0) N S⇑ħ
3⇑2 3⇑2
∆M s V 1 kB T 0.0587 k B T
= 0.0587 3 ( ) = ( ) . (12.10.30)
M s (0) Na S⇑ħ J A S⇑ħ QS⇑ħ J A S⇑ħ
Hierbei haben wir die Anzahl Q = Na 3 ⇑V der Atome pro Einheitszelle eingeführt, die beim
kubisch primitiven Gitter 1, beim kubisch raumzentrierten 2 und beim kubisch flächen-
zentrierten Gitter 4 beträgt. Gleichung (12.10.30) wird als Blochsches T 3⇑2 Gesetz bezeich-
net.77 Es beschreibt die experimentell gemessene Temperaturabhängigkeit der Sättigungsma-
gnetisierung von Ferromagneten bei tiefen Temperaturen in der Regel sehr gut (vergleiche
Abb. 12.45).
Wir weisen darauf hin, dass das Integral (12.10.27) in einer und zwei Dimensionen diver-
giert. Der ferromagnetische Zustand sollte deshalb für Dimensionen kleiner 3 instabil sein.
Dieser wichtige Zusammenhang ist als Mermin-Wagner-Theorem bekannt.78 , 79 Wir erwarten
also für eine eindimensionale Spin-Kette für endliche Temperaturen keinen ferromagnetisch
geordneten Zustand.
77
Felix Bloch, siehe Kasten auf Seite 318.
78
N. D. Mermin, H. Wagner, Absence of Ferromagnetism or Antiferromagnetism in One- or Two-
Dimensional Isotropic Heisenberg Models, Phys. Rev. Lett. 17, 1133–1136 (1966).
79
P. C. Hohenberg, Existence of Long-Range Order in One and Two Dimensions, Phys. Rev. 158, 383
(1967).
12.10 Spin-Wellen 763
0.000
0.002
Ms / Ms (0)
0.004
𝑻𝟑/𝟐
𝑩𝐞𝐱𝐭 , 𝑴𝒔
Abb. 12.46: Orientierung von Wellenvektor q sowie äußerem Magnetfeld Bext und Sättigungsmagneti-
sierung Ms fürDamon-Eshbach-Mode Vorwärts-Volumenmode
verschiedene dipolare Spin-Wellenmoden: Rückwärts-Volumenmode
(a) Damon-Eshbach Moden, (b) Vorwärts-
Volumenmode (dipolare
und Oberflächenmode)
(c) Rückwärts-Volumenmode.
80
Daniel D. Stancil, Anil Prabhakar, Spin Waves: Theory and Applications, Springer Verlag (2009).
163
764 12 Magnetismus
3. Rückwärts-Volumenmode:
Bei der Rückwärts-Volumenmode liegt der Wellenvektor ebenfalls parallel zur Proben-
oberfläche, im Gegensatz zu der Vorwärts-Volumenmode aber parallel zum äußeren
Feld, das dann ebenfalls parallel zur Oberfläche orientiert sein muss.
dS 2i+1, y gs µB B JAS
=+ S 2i+1,x − 2 (︀2S 2i+1,x + S 2i,x + S 2i+2,x ⌋︀ (12.10.35)
dt ħ ħ
dS 2i+1,z
=0. (12.10.36)
dt
Mit S + = S x + ıS y können wir dies für B = 0 vereinfacht schreiben als
+
dS 2i ıJ A S + + +
= + 2 (︀2S 2i + S 2i−1 + S 2i+1 ⌋︀ (12.10.37)
dt ħ
+
dS 2i+1 ıJ A S + + +
= − 2 (︀2S 2i+1 + S 2i + S 2i+2 ⌋︀ . (12.10.38)
dt ħ
Als Lösungsansatz verwenden wir
+ +
S 2i = ue ı(︀2i qa−ωt⌋︀ S 2i+1 = ve ı(︀(2i+1)qa−ωt⌋︀ . (12.10.39)
12.10 Spin-Wellen 765
Setzen wir diesen Ansatz in (12.10.37) und (12.10.38) ein, so erhalten wir mit der Abkür-
zung β = −2J A S⇑ħ 2 = 2⋃︀J A ⋃︀S⇑ħ 2 das Gleichungssystem
β − ω β cos qa
⋁︀ ⋁︀ = 0 , (12.10.42)
β cos qa β + ω
das heißt, für ω 2 = β 2 (1 − cos2 qa). Wir erhalten somit die Disperisonsrelation für antifer-
romagnetische Magnonen zu
2⋃︀J A ⋃︀S
ω= ⋃︀sin qa⋃︀ . (12.10.43)
ħ2
2.0
ferromagnetische
Magnonen
1.6
(4 IJAI S / ћ2)
Abb. 12.47 zeigt, dass sich diese Dispersionsrelation deutlich von der Disperisonsrelati-
on (12.10.18) für ferromagnetische Magnonen unterscheidet. Insbesondere verläuft die
Dispersionsrelation für ferromagnetische Magnonen im langwelligen Grenzfall (qa ≪ 1)
quadratisch, während wir aus (12.10.43) für den langwelligen Grenzfall eine lineare Disper-
sion erhalten. Wir wollen noch darauf hinweisen, dass antiferromagnetische Magnonen als
mögliche Austauschbosonen diskutiert werden, die in den Hochtemperatur-Supraleitern
die Paarwechselwirkung vermitteln.
766 12 Magnetismus
Literatur
P. W. Anderson, Antiferromagnetism: Theory of Superexchange Interaction, Phys. Rev. 79,
350–356 (1950).
B. D. Cullity, C. D. Graham, Introduction to Magnetic Materials, John Wiley (2005).
P. Debye, Einige Bemerkungen zur Magnetisierung bei tiefer Temperatur, Ann. Physik 81, 1154
(1926).
W. F. Giauque, A Thermodynamic Treatment of Certain Magnetic Effects: A Proposed Method
of Producing Temperatures Considerably Below 1 K, J. Am. Chem. Soc. 49, 1864 (1927).
P. J. Hakonen et al., Nuclear antiferromagnetism in rhodium metal at positive and negative
nanokelvin temperatures, Phys. Rev. Lett. 70, 2818 (1993).
P. C. Hohenberg, Existence of Long-Range Order in One and Two Dimensions, Phys. Rev. 158,
383 (1967).
A. Hubert, R. Schäfer, Magnetic Domains: The Analysis of Magnetic Microstructures, Springer-
Verlag Berlin Heidelberg (1998).
H. Ibach, H. Lüth, Solid State Physics, 2. Auflage, Springer Verlag, Berlin (1995)
T. Kasuya, A Theory of Metallic Ferro- and Antiferromagnetism on Zener’s Model, Prog. Theor.
Phys. 16, 45–57 (1956).
D. I. Khomskii, G. A. Sawatzky, Interplay between spin, charge and orbital degrees of freedom
in magnetic oxides , Sol. State. Comm. 102, 87 (1997).
H. A. Kramers, L’interaction Entre les Atomes Magnétogènes dans un Cristal Paramagnétique,
Physica 1, 182 (1934).
N. Kurti, F. N. H. Robinson, F. E. Simon, D. A. Spohr, Nuclear Cooling Nature 178, 450 (1956).
D. C. Mattis, The Theory of Magnetism I and II, Springer, Berlin, Heidelberg (1988).
N. D. Mermin, H. Wagner, Absence of Ferromagnetism or Antiferromagnetism in One- or Two-
Dimensional Isotropic Heisenberg Models, Phys. Rev. Lett. 17, 1133–1136 (1966).
S. Mühlbauer, B. Binz, F. Jonietz, C. Pfleiderer, A. Rosch, A. Neubauer, R. Georgii, P. Böni,
Skyrmion Lattice in a Chiral Magnet, Science 323, 915–919 (2009).
J. Nogués, I. K. Schuller, Exchange Bias, J. Magn. Magn. Mat. 192, 203-232 (1999).
W. Nolting, Quantentheorie des Magnetismus I+II, Teubner, Stuttgart (1986).
M. A. Ruderman, C. Kittel, Indirect Exchange Coupling of Nuclear Magnetic Moments by Con-
duction Electrons, Phys. Rev. 96, 99 (1954).
D. D. Stancil, A. Prabhakar, Spin Waves: Theory and Applications, Springer Verlag (2009).
E. C. Stoner, Proc. Roy. Soc. London A 165 372–414 (1938) und Proc. Roy. Soc. Lon-
don A 169, 339–371 (1939).
L. H. Thomas, The Motion of the Spinning Electron, Nature 117, 514 (1926).
Literatur 767
1
Heike Kamerlingh Onnes, siehe Kasten auf Seite 773.
2
H. Kamerlingh Onnes, The Superconductivity of Mercury, Leiden Commun. 120b, 122b, 124c
(1911).
3
Walther Meißner, siehe Kasten auf Seite 775.
4
Robert Ochsenfeld, geboren am 18. Mai 1901 in Helberhausen, gestorben 5. Dezember 1993 eben-
da.
5
W. Meißner, R. Ochsenfeld, Ein neuer Effekt bei Eintritt der Supraleitfähigkeit, Naturwissenschaf-
ten 21, 787-788 (1933).
770 13 Supraleitung
ist. Trotzdem sprechen wir heute nicht von Superdiamagnetismus, sondern aus historischen
Gründen nach wie vor von Supraleitung.
Auch mehr als 100 Jahre nach seiner Entdeckung hat das Phänomen Supraleitung nichts
von seiner Faszination verloren. Die Suche nach neuen supraleitenden Materialien und dem
Mechanismus der Supraleitung hat viele Generationen von Physikern beschäftigt. Erst 1957
gelang es John Bardeen, Leon Neil Cooper und John Robert Schrieffer, eine mikroskopische
Theorie, die nach ihnen benannte BCS-Theorie, zu entwickeln, die das Auftreten von Supra-
leitung in Metallen befriedigend beschreiben kann.6 , 7 Sie erhielten dafür im Jahr 1972 den
Nobelpreis für Physik. Die Vorhersagen der BCS-Theorie wurden durch zahlreiche Experi-
mente an Metallen und Legierungen bestätigt. Ein zentrales Experiment war dabei der Nach-
weis der Flussquantisierung durch Robert Doll und Martin Näbauer am Walther-Meißner-
Institut und fast zeitgleich durch B. S. Deaver und W. M. Fairbank an der Stanford Univer-
sity im Jahr 1961.8 , 9 Bis Mitte der 1980er Jahre glaubte man schon, das Phänomen Supralei-
tung weitgehend verstanden zu haben. Dies änderte sich allerdings schlagartig, als Johan-
nes Georg Bednorz und Karl Alexander Müller im Jahr 1986 Supraleitung in Kupferoxiden
entdeckten.10 Sie erhielten dafür bereits 1987 den Nobelpreis für Physik. Da die Sprung-
temperatur in der von Bednorz und Müller untersuchten La-Ba-Cu-O-Verbindung mit 35 K
oberhalb der maximalen Sprungtemperatur von etwa 23 K der bis damals bekannten Metalle
und Legierungen lag und diese Temperatur schnell bis auf etwa 135 K erhöht werden konn-
te, erhielten die Kuprat-Supraleiter die Bezeichnung Hochtemperatur-Supraleiter.11 Der Me-
chanismus der Supraleitung in den Kupraten ist bis heute noch nicht vollständig verstanden.
Das Gleiche gilt für die Supraleitung in Verbindungen mit schweren Fermionen, die 1979 von
Frank Steglich entdeckt wurde,12 genauso wie für die von der Arbeitsgruppe um H. Hosono
erst 2008 entdeckten Eisen-Pniktide.13
Supraleiter spielen heute eine große Rolle in zahlreichen Anwendungsgebieten. Supraleiten-
de Magnete erzeugen die großen Magnetfelder, die für die Kernspintomographie, Teilchen-
beschleuniger oder die Kernfusion benötigt werden. Supraleitende Quanteninterferenzde-
tektoren erlauben die Messung kleinster Magnetfelder, wie sie z. B. durch Gehirnströme
6
J. Bardeen, L. N. Cooper, J. R. Schrieffer, Microscopic Theory of Superconductivity, Phys. Rev. 106,
162–164 (1957).
7
J. Bardeen, L. N. Cooper, J. R. Schrieffer, Theory of Superconductivity, Phys. Rev. 108, 1175 (1957).
8
R. Doll, M. Näbauer, Experimental Proof of Magnetic Flux Quantization in a Superconducting Ring,
Phys. Rev. Lett. 7, 51 (1961).
9
B. S. Deaver Jr., W. M. Fairbank, Experimental Evidence for Quantized Flux in Superconducting Cy-
linders, Phys. Rev. Lett. 7, 43 (1961).
10
J. G. Bednorz, K. A. Müller, Possible High Tc Superconductivity in the Ba-La-Cu-O System,
Z. Phys. B 64, 189 (1986).
11
Die Bezeichnung Hochtemperatur-Supraleiter erhielten allerdings auch bereits die im Jahr 1953/54
entdeckten A 15-Verbindungen V3 Si (G. F. Hardy, J. K. Hulm, Phys. Rev. 87, 884 (1953), Phys.
Rev. 93, 1004 (1954)) und Nb3 Sn (B. T. Matthias, T. H. Geballe, S. Geller, E. Corenzwit, Phys.
Rev. 95, 1453 (1954) mit Sprungtemperaturen von 17 und 18 K.
12
F. Steglich, J. Aarts, C. D. Bredl, W. Lieke, D. Meschede, W. Franz, H. Schäfer, Superconductivity in
the Presence of Strong Pauli Paramagnetism: CeCu2 Si2 , Phys. Rev. Lett. 43, 1892–1896 (1979).
13
Y. Kamihara, T. Watanabe, M. Hirano, H. Hosono, Iron-Based Layered Superconductor
La[O1−x Fx ]FeAs (x = 0.05 − 0.12) with Tc = 26 K, J. Am. Chem. Soc. 130, 3296 (2008).
13 Supraleitung 771
erzeugt werden, und ermöglichen dadurch nicht nur neue Einsatzgebiete in der Medizin-
technik, sondern auch in der zerstörungsfreien Materialprüfung oder der Geoprospektion.
Schließlich spielen supraleitende Mikrowellendetektoren eine zentrale Rolle in der Radio-
astronomie, seit 1990 wird der Voltstandard mit supraleitenden Josephson-Kontakten rea-
lisiert und seit etwa 2000 werden supraleitende Materialien erfolgreich für die Realisierung
von Quanteninformationssystemen eingesetzt.
Bei der Supraleitung handelt es sich um ein Phänomen, bei dem Korrelationen im Elektro-
nensystem eines Festkörpers eine wichtige Rolle spielen. Solche Korrelationen haben wir
bereits bei der Diskussion der magnetischen Eigenschaften kennen gelernt. Diese Korre-
lationen führen unterhalb einer bestimmten Temperatur, bei der die thermische Energie
klein genug ist, zu einem neuartigen Ordnungszustand. Die theoretische Beschreibung von
Systemen mit elektronischen Korrelationen ist generell anspruchsvoll, da die Beschreibung
der Dynamik der Kristallelektronen nicht mehr auf ein effektives Einteilchenproblem
zurückgeführt werden kann. Aus diesem Grund gibt es bis heute für Phänomene wie die
Hochtemperatur-Supraleitung noch keine etablierte mikroskopische Theorie. Wir wollen in
diesem Kapitel zunächst einen Einblick in die Geschichte der Supraleitung geben und die
grundlegenden Eigenschaften von Supraleitern vorstellen (Abschnitt 13.1). Anschließend
werden wir dann kurz die thermodynamischen Eigenschaften von Supraleitern erörtern
(Abschnitt 13.2), phänomenologische Modelle zur Beschreibung des Phänomens Supralei-
tung (Abschnitt 13.3) vorstellen, auf die charakteristischen Eigenschaften von Typ-I und
Typ-II Supraleitern eingehen (Abschnitt 13.4) und die von Bardeen, Cooper und Schrief-
fer entwickelte mikroskopische Theorie diskutieren (Abschnitt 13.5). In Abschnitt 13.6
werden wir uns dann mit dem Josephson-Effekt beschäftigen, auf dem heute zahlreiche
Anwendungen in der Sensorik und Supraleitungselektronik beruhen. Mit dem für tech-
nische Anwendungen ebenfalls wichtigen Themengebiet der kritischen Ströme und der
Flusslinienverankerung befassen wir uns in Abschnitt 13.7 bevor wir uns zum Abschluss in
Abschnitt 13.8 mit unkonventioneller Supraleitung beschäftigen und in Abschnitt 13.9 die
zentralen Eigenschaften der Kuprat-Supraleiter diskutieren.
772 13 Supraleitung
tieferen Temperaturen unterhalb der Messauflösung lag, also unmessbar klein wurde. Das
erhaltene Ergebnis stimmte gut mit der Erwartung überein.
Bei weiteren Experimenten mit einer verbesserten Apparatur wurde aber schnell klar,
dass das beobachtete Verschwinden des elektrischen Widerstands nichts mit der erwar-
774 13 Supraleitung
0.15
Hg
0.12
0.09
R ()
0.06
0.03
teten kontinuierlichen Abnahme zu tun hatte. Es zeigte sich nämlich, dass die Wider-
standsabnahme in einem sehr schmalen Temperaturintervall von nur etwa 0.1 K er-
folgte.17 , 18 Dies ist in Abb. 13.1 gezeigt. Kamerlingh Onnes sagte zu der plötzlichen Wider-
standsabnahme bei 4.2 K: „At this point within some hundredths of a degree came a sudden
fall not foreseen by the vibration theory of resistance, that had framed, bringing the resistance
at once to less than a millionth of its original value at the melting point.“ Er fügte ferner einen
Satz hinzu, der dem Phänomen den heutigen Namen Supraleitung gab: „Mercury has passed
into a new state which, on account of its extraordinary electrical properties, may be called
the superconductive state.“ Kamerlingh Onnes hatte zusammen mit seinen Mitarbeitern
Gerrit Flim, Gilles Holst und Gerrit Dorsman bei der sorgfältigen Untersuchung des Tem-
peraturverhaltens des elektrischen Widerstands ein völlig neues Phänomen entdeckt. Wie
wir heute wissen, spielt die Reinheit der Proben für das Auftreten der Supraleitung keine
entscheidende Rolle.
Die Entdeckung von Kamerlingh Onnes wurde nur zwei Jahre später mit dem Nobelpreis für
Physik ausgezeichnet. Dies zeigt, welche Bedeutung dieser Entdeckung bereits damals beige-
messen wurde. Es sollte aber noch sehr lange dauern, bis dieses Phänomen richtig verstanden
wurde. Auf der experimentellen Seite lag dies an den sehr eingeschränkten Experimentier-
möglichkeiten. In Deutschland etablierte erst Walther Meißner, der nach seiner Promotion
bei Max Planck im Jahr 1908 an die Physikalisch-Technische Reichsanstalt in Berlin wech-
selte, das erste Tieftemperaturlabor (das dritte weltweit, nach Leiden und Toronto). Es gelang
ihm dort erstmals am 7. März 1925, Helium zu verflüssigen. Bis zur Entdeckung des perfek-
ten Diamagnetismus in Supraleitern (1933) dauerte es weitere 8 Jahre. Auf der theoretischen
Seite waren die Methoden für die Behandlung von komplexen Festkörperproblemen noch
nicht weit genug entwickelt und es dauert fast 50 Jahre bis mit der BCS-Theorie die erste
mikroskopische Theorie der Supraleitung entwickelt war.
gnetfeld bis auf eine dünne Randschicht vollständig aus ihrem Inneren verdrängen.19 Supra-
leiter verhalten sich also wie perfekte Diamagnete. Dieser perfekte Diamagnetismus wird
heute nach ihren Entdeckern als Meißner-Ochsenfeld-Effekt bezeichnet.
Bemerkenswert ist, dass der Meißner-Ochsenfeld-Effekt nicht von der Vorgeschichte des
Materials abhängt, er ist damit in der Sprache der Thermodynamik reversibel. Meißner und
Ochsenfeld wiesen so indirekt erstmals nach, dass der supraleitende Zustand ein echter
thermodynamischer Zustand ist. Supraleiter sind also mehr als nur ideale Leiter, deren
elektromagnetische Eigenschaften mit den Maxwell-Gleichungen nur durch Annahme
einer unendlich hohen elektrischen Leitfähigkeit beschrieben werden können. Sie sind
vielmehr auch perfekte Diamagnete. Da der perfekte Diamagnetismus eine unendlich hohe
Leitfähigkeit bedingt aber nicht umgekehrt, müssten wir Supraleiter eigentlich als Super-
diamagnete bezeichnen. Da historisch die Entdeckung der idealen Leitfähigkeit aber viel
früher erfolgte, entstand die aus heutiger Sicht nicht ganz ideale Namensgebung.
Um uns den Unterschied zwischen einem idealen Leiter und einem Supraleiter zu veran-
schaulichen, betrachten wir Abb. 13.2. Wir führen ein Gedankenexperiment durch, bei dem
wir einen Normalleiter (NL) zuerst in ein Magnetfeld bringen und dann abkühlen, oder
zuerst abkühlen und dann in ein Magnetfeld bringen. Wie Abb. 13.2a zeigt, erhalten wir
für einen perfekten Leiter eine vollständige Verdrängung der magnetischen Flussdichte nur
dann, wenn wir zuerst Abkühlen und dann das Magnetfeld anschalten. Dies kann einfach
mit dem Induktionsgesetz
∂B
− =∇×E (13.1.1)
∂t
19
W. Meißner, R. Ochsenfeld, Ein neuer Effekt bei Eintritt der Supraleitfähigkeit, Naturwissenschaf-
ten 21, 787 (1933).
Meißner und Ochsenfeld untersuchten die Kraft zwischen zwei Zinn-Drähten, durch die sie einen
Strom unterhalb und oberhalb der Sprungtemperatur schickten. Aufgrund der Feldverdrängung
in einem perfekten Leiter ist die Kraft in beiden Fällen unterschiedlich. Interessanterweise fanden
sie aber den gleichen Effekt, wenn sie die Drähte bei angeschaltetem Strom unter die Sprungtem-
peratur abkühlten.
13.1 Geschichte und grundlegende Eigenschaften 777
normalen Metall verhalten, besitzen die letzteren keine Entropie und können deshalb keinen
Wärmestrom tragen. Ferner können sie einen elektrischen Strom ohne Widerstand transpor-
tieren. Damit wird das beobachtete Verschwinden des elektrischen Widerstands unterhalb
von Tc und die starke Abnahme der thermischen Leitfähigkeit für T → 0 richtig beschrie-
ben. Obwohl dieses Modell sehr einfach war, hat das Zweiflüssigkeitsbild und das Konzept
einer Supraflüssigkeit in späteren Theorien überlebt.
Im Jahr 1935 schlugen die Brüder Fritz und Heinz London ein phänomenologisches Mo-
dell vor, das die beiden grundlegenden elektrodynamischen Eigenschaften von Supraleitern,
die unendlich hohe Leitfähigkeit und den perfekten Diamagnetismus, beschreiben konnte.21
Sie gingen davon aus, dass in Supraleitern eine endliche Dichte n s von „supraleitenden Elek-
tronen“ existiert, die sich ohne Reibung im Festkörper bewegen können. Sie nahmen ferner
an, dass ihre Dichte von null bei der kritischen Temperatur zu tieferen Temperaturen hin
kontinuierlich anwächst. Mit diesen Annahmen konnten sie die beiden Londonschen Glei-
chungen ableiten, die zusammen mit den Maxwell-Gleichungen die Elektrodynamik von
Supraleitern beschreiben. Eine weitergehende Motivation der London-Gleichungen auf der
Basis der Quantenmechanik wurde später von Fritz London selbst gegeben.22 Alfred Brian
Pippard23 schlug eine nichtlokale Verallgemeinerung der London-Gleichungen vor, indem
er eine Kohärenzlänge einführte.24 Diese Verallgemeinerung ist analog zur nichtlokalen Ver-
allgemeinerung des Ohmschen Gesetzes.
Vitaly Lasarevich Ginzburg25 und Lev Davidovich Landau26 führten 1950 eine komple-
xe makroskopische Wellenfunktion Ψ als Ordnungsparameter im Rahmen der allgemei-
nen Landauschen Theorie der Phasenübergänge ein.27 Diese Wellenfunktion beschreibt die
supraleitenden Elektronen, deren lokale Dichte durch n s (r) = ⋃︀Ψ(r)⋃︀2 gegeben ist. Mit der
Ginzburg-Landau (GL) Theorie konnten insbesondere Phänomene beschrieben werden, bei
denen räumliche Variationen der Dichte der supraleitenden Elektronen wichtig sind. Auf
der Basis der GL-Theorie zeigte im Jahr 1957 Alexei Alexeyevich Abrikosov,28 dass wir zwi-
schen Typ-I und Typ-II Supraleitern unterscheiden müssen. Ferner beschrieb er das Flussli-
21
F. London, H. London, The Electromagnetic Equations of the Supraconductor, Proc. Roy. Soc.
Lond. A 149, 71 (1935).
22
F. London, Superfluids, Wiley, New York (1950).
23
Sir Alfred Brian Pippard, geboren am 7. September 1920 in Earl’s Court, London, gestorben am
21. September 2008 in Cambridge.
24
A. B. Pippard, Proc. Roy. Soc. London A 216, 547 (1953).
25
Vitaly Lasarevich Ginzburg, geboren am 4. Oktober 1916 in Moskau, gestorben am 8. Novem-
ber 2009 in Moskau. Er erhielt zusammen mit Alexei Alexeyevich Abrikosov und Anthony James
Leggett den Nobelpreis für Physik 2003 „für seine bahnbrechende Arbeiten zur Theorie der Supra-
leitung und Supraflüssigkeiten“.
26
Lev Davidovich Landau, siehe Kasten auf Seite 466.
27
V. L. Ginzburg, L. D. Landau, Toward the superconductivity theory, Zh. Eksperim. Teor. Fiz. 20, 1064
(1950).
28
Alexei Alexeyevich Abrikosov, geboren am 25. Juni 1928 in Moskau. Er erhielt zusammen mit
Vitaly Lasarevich Ginzburg und Anthony James Leggett den Nobelpreis für Physik 2003 „für seine
bahnbrechende Arbeiten zur Theorie der Supraleitung und Supraflüssigkeiten“.
13.1 Geschichte und grundlegende Eigenschaften 779
29
A. A. Abrikosov, On the Magnetic Properties of Superconductors of the Second Group, Zh. Eksperim.
Teor. Fiz. 32, 1142-1152 (1957).
30
Lev Petrovich Gor’kov, geboren am 14. Juni 1928 in Moskau.
31
L. P. Gor’kov, Microscopic Derivation of the Ginzburg-Landau Equations in the Theory of Supercon-
ductivity, Zh. Eksperim. Teor. Fiz. 36, 1918-1923 (1959).
32
A. A. Abrikosov, L. P. Gor’kov, I. E. Dzyaloshinskii in Quantum Field Theoretical Models in Statisti-
cal Physics, Pergamon Press, London (1965).
33
J. Bardeen, L. N. Cooper, J. R. Schrieffer, Microscopic Theory of Superconductivity, Phys. Rev. 106,
162–164 (1957).
34
J. Bardeen, L. N. Cooper, J. R. Schrieffer, Theory of Superconductivity, Phys. Rev. 108, 1175 (1957).
35
W. S. Corak, B. B. Goodman, C. B. Sattersthwaite, A. Wexler, Exponential Temperature Dependence
of the Electronic Specific Heat of Superconducting Vanadium, Phys. Rev. 96, 1442 (1954); Phys.
Rev. 102, 656 (1956).
36
R. E. Glover, M. Tinkham, Conductivity of Superconducting Films for Photon Energies between 0.3
and 40 k B Tc , Phys. Rev. 104, 844 (1956); Phys. Rev. 108, 243 (1956).
37
R. Doll, M. Näbauer, Experimental Proof of Magnetic Flux Quantization in a Superconducting Ring,
Phys. Rev. Lett. 7, 51 (1961).
38
B. S. Deaver Jr., W. M. Fairbank, Experimental Evidence for Quantized Flux in Superconducting Cy-
linders, Phys. Rev. Lett. 7, 43 (1961).
780 13 Supraleitung
de kommt. Es wird aber vermutet, dass magnetische Anregungen eine entscheidende Rolle
spielen.
Unabhängig von den Details der Wechselwirkung, die zu Cooper-Paaren führt, spielt die
Ausbildung eines kohärenten Vielteilchenzustandes durch die Gesamtheit der Cooper-Paare
eine entscheidende Rolle. Nach den Gesetzen der Quantenmechanik können wir diesen ko-
härenten Zustand mit einer Materiewelle mit wohldefinierter Phase beschreiben. Da wir mit
dieser Wellenfunktion ein makroskopisches System beschreiben, sprechen wir von einer ma-
kroskopischen Wellenfunktion. Supraleitung ist also ein inhärentes Quantenphänomen, das
sich auf einer makroskopischen Längenskala manifestiert. Kohärente Materiewellen spie-
len auch in anderen Bereichen der Physik eine wichtige Rolle. So können wir die Supra-
fluidität39 , 40 , 41 in flüssigem Helium oder den Grundzustand von Bose-Einstein-Kondensa-
ten42 , 43 mit einer makroskopischen Materiewelle beschreiben. Auch das von einem Laser
erzeugte Licht können wir als kohärenten Zustand eines Photonengases auffassen.
Supraleitende Elemente: Das in Abb. 13.3 gezeigte Periodensystem der Elemente zeigt,
dass die Supraleitung keine seltene Eigenschaft ist, sondern dass viele Metalle bereits bei
Normaldruck und eine weitere große Gruppe bei hohen Drücken supraleitend werden. Ihre
strukturelle Ordnung spielt dabei eine untergeordnete Rolle. Bei Atmosphärendruck liegt die
Übergangstemperatur der Elementsupraleiter zwischen 0.32 mK (Rh) und 9.2 K (Nb). Vor
kurzem wurde entdeckt, dass Lithium unter hohem Druck von fast 0.5 Mbar eine Sprung-
temperatur von fast 20 K erreicht. Ähnliche Beobachtungen wurden für Schwefel gemacht.
Ferner tritt Supraleitung in einigen metallischen Hochdruckphasen von Nichtmetallen wie
Si, Ge, P oder As auf. Die Frage, ob alle Metalle bei genügend tiefen Temperaturen supralei-
tend werden, lässt sich bis heute nicht beantworten, da Supraleiter mit sehr kleinen Über-
gangstemperaturen sehr empfindlich auf paramagnetische Verunreinigungen und magne-
tische Restfelder reagieren. Magnetisch ordnende Metalle wie Fe, Co und Ni müssen hier
ausgenommen werden, da sie im ferromagnetischen Zustand mit großer Wahrscheinlich-
keit nicht supraleitend werden können. Allerdings wurde vor kurzem in einer unmagneti-
39
D. M. Lee, The extraordinary phases of liquid 3 He, Rev. Mod. Phys. 69, 645 (1997).
40
D. D. Osheroff, Superfluidity in 3 He: Discovery and understanding, Rev. Mod. Phys. 69, 667 (1997).
41
R. C. Richardson, The Pomeranchuk effect, Rev. Mod. Phys. 69, 683 (1997).
42
E. A. Cornell, C. E. Wieman, Nobel Lecture: Bose-Einstein condensation in a dilute gas, the first 70
years and some recent experiments, Rev. Mod. Phys. 74, 875 (2002).
43
W. Ketterle, Nobel lecture: When atoms behave as waves: Bose-Einstein condensation and the atom
laser, Rev. Mod. Phys. 74, 1131 (2002).
13.1 Geschichte und grundlegende Eigenschaften 781
1H 2He
supraleitend bei p = 1 bar
20 0.03 11 0.6
nichtsupraleitend
11Na 12Mg 13Al 14Si 15P 16S 17Cl 18Ar
magnetisch ordnend 1.19 8.5 18 17
19K 20Ca 21Sc 22Ti 23V 24Cr 25Mn 26Fe 27Co 28Ni 29Cu 30Zn31Ga 32Ge 33As 34Se 35Br 36Kr
15 0.35 0.4 5.3 2.0 0.9 1.09 5.4 2.7 5.6 1.4
45Rh
37Rb 38Sr 39Y 40Zr 41Nb 42Mo 43Tc 44Ru 46Pd 47Ag 48Cd 49In 50Sn 51Sb 52Te 53I 54Xe
320
4.0 2.7 0.55 9.2 0.923 7.8 0.5 0.55 3.4 3.7 5.6 7.4 1.1
µK
55Cs 56Ba 57La72Hf 73Ta 74W 75Re 76Os 77Ir 78Pt 79Au 80Hg 81Tl 82Pb 83Bi 84Po 85At 86Pn
5.1 5.9 0.16 4.4 0.01 1.7 0.65 0.14 4.15 2.4 7.2 8.7
87Fr 88Ra 89Ac 58Ce 59Pr 60Nd 61Pm 62Sm 63Eu 64Gd 65Tb 66Dy 67Ho 68Er 69Tm 70Yb 71Lu
1.7 0.1
90Th 91Pa 92U 93Np 94Pu 95Am 96Cm 97Bk 98Cf 99Es 100Fm 101Md 102No 103Lw
Abb. 13.3: Verteilung der supraleitenden Elemente im Periodensystem der Elemente. Die blau hinter-
legten Elemente werden bereits bei Atmosphärendruck, die grün hinterlegten nur bei höheren Drücken
supraleitend (die in K angegebene Sprungtemperatur ist die maximal unter Druck erreichte kritische
Temperatur). Die orange hinterlegten Elemente ordnen magnetisch. Nur für einige wenige Elemente
wurde bis heute weder eine magnetische geordnete Tieftemperaturphase noch Supraleitung gefun-
den (nach N. W. Ashcroft, Nature 419, 569–572 (2002) sowie C. Buzea, K. Robble, Supercond. Sci.
Techn. 18, R1 (2005)).
Supraleitende Legierungen und Verbindungen: Sehr bald nach der Entdeckung der Su-
praleitung wurden nicht nur Elemente, sondern auch Legierungen und Verbindungen hin-
sichtlich ihrer supraleitenden Eigenschaften untersucht. Bis heute wurden mehr als 1000 su-
praleitende Legierungen und Verbindungen gefunden. Interessant ist, dass es Verbindungen
wie z. B. CuS mit einer Sprungtemperatur von 1.6 K gibt, deren Komponenten selbst kei-
ne Supraleitung zeigen. Technisch interessant sind die 1954 entdeckten Verbindungen mit
der so genannten A 15-Struktur (β-Wolframstruktur).45 , 46 Zu ihnen gehören mit Nb3 Ge
(Tc = 23.2 K), Nb3 Sn (Tc = 18.0 K) und V3 Si (Tc = 17 K) Verbindungen, die hohe Sprung-
temperaturen und hohe kritische Felder besitzen. Nb3 Sn wird deshalb heute zum Bau großer
44
K. Shimizu et al., Superconductivity in the non-magnetic state of iron under pressure, Nature 412,
316 (2002).
45
G. F. Hardy, J. K. Hulm, Superconducting Silicides and Germanides, The Superconductivity of Some
Transition Metal Compounds, Phys. Rev. 87, 884 (1953); Phys. Rev. 93, 1004 (1954).
46
B. T. Matthias, T. H. Geballe, S. Geller, E. Corenzwit, Superconductivity of Nb3 Sn, Phys. Rev. 95,
1435 (1954).
782 13 Supraleitung
Schwere-Fermionen-Supraleiter: Ende der 1970er Jahre wurde von Steglich und Mitar-
beitern unterhalb von etwa 0.5 K Supraleitung in der Verbindung CeCu2 Si2 gefunden.50 Da
die Elektronen in dieser und ähnlichen Verbindungen effektive Massen haben, die einige 100
bis 1000-mal größer sind als die Masse freier Elektronen, werden diese metallischen Syste-
me als Schwere-Fermionen-Supraleiter bezeichnet. Der Mechanismus der Supraleitung in
diesen Systemen ist bis heute noch nicht verstanden.
Organische Supraleiter: Bereits 1964 postulierte W. H. Little, dass es möglich sein sollte,
mit organischen Substanzen hohe Sprungtemperaturen zu erreichen. Erst 1980 wurde von
Jérome und Mitarbeitern Supraleitung in der organischen Substanz Tetramethyl-tetraselen-
afulvalen (TMTSF) unterhalb von 0.9 K bei einem angelegten Druck von 12 kbar entdeckt.51
In der Folgezeit wurden viele weitere organische Supraleiter mit Sprungtemperaturen bis zu
etwa 12 K entdeckt. Die Hypothese von Little konnte aber noch nicht bestätigt werden.
47
R. Flukiger, R. Baillif, in Superconductivity in Ternary Compounds I, Hrsg. Ø. Fischer, M. B. Maple,
Springer, New York (1982), S. 113–140.
48
R. J. Cava et al., Superconductivity at 23 K in yttrium palladium boride carbide, Nature 367, 146
(1994).
49
J. Nagamatsu, N. Nakagawa, T. Muranaka, Y. Zenitani, J. Akimitsu, Superconductivity at 39 K in
MgB2 , Nature 410, 63 (2001).
50
F. Steglich et al., Superconductivity in the Presence of Strong Pauli Paramagnetism: CeCu2 Si2 , Phys.
Rev. Lett. 43, 1892–1896 (1979).
51
D. Jérome et al., Acad. Sci. Ser. B 290, 27 (1980).
13.1 Geschichte und grundlegende Eigenschaften 783
Fulleride: Im Jahr 1985 entdeckten R. F. Curk, R. E. Smalley und H. W. Kroto das ball-
förmige Kohlenstoffmolekül C60 . Die C60 -Moleküle lassen sich dotieren und in Molekül-
kristallen regelmäßig anordnen. Dadurch erhält man Fulleride, die bei erstaunlich hohen
Temperaturen von bis zu 40 K supraleitend werden.52 Es deutet vieles darauf hin, dass die
Supraleitung in den Fulleriden wie in metallischen Supraleitern und MgB2 durch Elektron-
Phonon-Wechselwirkung zustande kommt.
Supraleitende Oxide: Viele Oxide sind Isolatoren, weshalb vermutet wurde, dass mit Oxi-
den keine Supraleiter mit hoher Sprungtemperatur erhalten werden können. Umso erstaun-
licher war dann die Entdeckung von Georg Bednorz und Alex Müller, die 1986 in dem
oxidischen System La-Ba-Cu-O Supraleitung bei etwa 25 K fanden.53 Als kurze Zeit später
von Paul Chu und Mitarbeitern in YBa2 Cu3 O7 (Tc = 93 K) erstmals Supraleitung bei einer
Temperatur oberhalb der Siedetemperatur von flüssigem Stickstoff (77 K) gefunden wur-
de,54 begann eine intensive Forschungsaktivität mit dem Ziel, Supraleiter mit noch höhe-
ren Sprungtemperaturen nahe oder oberhalb von Raumtemperatur zu finden. Mittlerweile
kennen wir viele supraleitende Oxide (neben den Kupraten vor allem Wismutoxide und Ru-
thenoxide), ihre Sprungtemperaturen liegen aber unter etwa 135 K bei Atmosphärendruck
und etwa 165 K bei hohem Druck. Die anfängliche Euphorie ist heute verflogen, da sich die
keramischen Materialien auch nur mit großem Aufwand in technische Anwendungen um-
setzen lassen. Wissenschaftlich bleibt aber die Klärung des Mechanismus der Supraleitung
eine der großen Herausforderungen der heutigen Festkörperphysik.
13.1.3 Sprungtemperaturen
Supraleitung ist ein ausgeprägtes Tieftemperaturphänomen. Dies erschwert den Einsatz der
Supraleitung in vielen Anwendungsgebieten. Physiker und Materialwissenschaftler haben
deshalb immer versucht, die Sprungtemperaturen zu erhöhen. Das langfristige Ziel ist da-
bei, Sprungtemperaturen oberhalb von Raumtemperatur zu erzielen. Wie Abb. 13.4 zeigt,
52
C. H. Pennington, V. A. Stenger, Nuclear magnetic resonance of C60 and fulleride superconductors,
Rev. Mod. Phys. 68, 855 (1996).
53
J. G. Bednorz, K. A. Müller, Possible High Tc Superconductivity in the Ba-La-Cu-O System,
Z. Phys. B 64, 189 (1986).
54
M. K. Wu, C. W. Chu et al., Superconductivity at 93 K in a New Mixed-Phase Y-Ba-Cu-O Compound
System at Ambient Pressure, Phys. Rev. Lett. 58, 908–910 (1987).
55
Y. Kamihara, T. Watanabe, M. Hirano, H. Hosono, Iron-Based Layered Superconductor
La[O1−x Fx ]FeAs (x = 0.05 − 0.12) with Tc = 26 K, J. Am. Chem. Soc. 130, 3296 (2008).
784 13 Supraleitung
50 Cs3C60
SmFeAsO
Tc (K)
wurden auf diesem Weg zwar enorme Fortschritte erreicht, das Ziel Raumtemperatur-Su-
praleitung ist aber immer noch nicht in Sicht. Im Jahr 2015 wurde in H2 S bei einem Druck
von 155 GPa die bisher höchste Sprungtemperatur von 203 K beobachtet.56
definiert, wobei R n der Normalwiderstand oberhalb von Tc ist. Für homogene Proben findet
man sehr kleine Übergangsbreiten von weniger als 10 mK. Es sei hier darauf hingewiesen,
dass auch verunreinigte Proben und Legierungen Supraleitung mit einem scharfen Über-
gang in den supraleitenden Zustand zeigen können. Ein Beispiel ist PbIn, das bei einem In-
Anteil von 10% eine gegenüber reinem Blei nur um etwa 0.1 K reduzierte Sprungtemperatur
56
A. P. Drozdov et al., Conventional superconductivity at 203 kelvin at high pressures in the sulfur
hydride system, Nature 525, 73-76 (2015).
13.1 Geschichte und grundlegende Eigenschaften 785
besitzt. In manchen Fällen zeigen sogar extrem ungeordnete, amorphe Legierungen höhere
Sprungtemperaturen als entsprechende kristalline Systeme gleicher Zusammensetzung.
Beim Übergang in den supraleitenden Zustand spricht man immer lax von einem Ver-
schwinden des elektrischen Widerstands. Prinzipiell ist es aber nicht möglich, einen
64
wobei ⧹︂
n der auf der Fläche A senkrecht stehende Einheitsvektor ist. Das heißt, der den
Ring durchdringende magnetische Fluss Φ = ∫ A B ⋅ ⧹︂
n dS muss wegen E = 0 konstant bleiben.
Schalten wir das Magnetfeld im supraleitenden Zustand ab, wird in dem supraleitenden Ring
ein Dauerstrom angeworfen. Dieser Dauerstrom kann z. B. durch Messung des damit ver-
bundenen magnetischen Moments µ = I ⋅ A gemessen werden. Hätte der Supraleiter einen
endlichen Widerstand ∆R, so würde der Ringstrom gemäß
∆R
I(t) = I 0 exp (− t) (13.1.7)
L
zeitlich abklingen. Dieses Abklingverhalten kann über einen sehr langen Zeitraum von z. B.
einem Jahr beobachtet werden. Würde man über diesen Zeitraum ein Abklingen des Supra-
stroms um weniger als 10% beobachten, so wäre für L = 1 nH die obere Schranke für den
Widerstand nur etwa 10−17 Ω. Dies wird in der Tat beobachtet. Genaueste Messungen lie-
fern eine unter Schranke der Abklingzeit von mehr als 105 Jahren, was die Annahme R = 0
für den supraleitenden Zustand rechtfertigt. Ein endliches Abklingen des Ringstromes wird
übrigens immer durch die unvermeidbare Wechselwirkung mit dem Messsystem erhalten.
786 13 Supraleitung
Wir sehen, dass die vollständige Feldverdrängung gleichbedeutend damit ist, dass der Supra-
leiter die magnetische Suszeptibilität χ = −1 besitzt, er ist also ein perfekter Diamagnet. Es
sei hier angemerkt, dass die magnetische Suszeptibilität im Allgemeinen ein Tensor 2. Stufe
ist, der durch χ i j = ∂M i ⇑∂H ext,j gegeben ist. Wir werden aber isotrope Systeme betrachten,
für die wir χ als skalare Größe verwenden können.
𝜇0 𝐻ext
normalleitend
𝐵cth
𝑩𝐜𝐭𝐡 𝑻
B
SL NL
4
2 supraleitend 3
SL 1 A NL
𝑇𝑐 𝑇
Abb. 13.6 zeigt nochmals die in Abb. 13.2 bereits diskutierten unterschiedlichen Wege 74von
einem Zustand A im normalleitenden Bereich zu einem Endzustand B im supraleitenden
Bereich. Entlang des Weges 1–2 kühlen wir zunächst unter Tc ab und schalten dann im su-
praleitenden Zustand das Magnetfeld an. Hier könnten wir die Feldverdrängung auch ohne
perfekten Diamagnetismus alleine mit der perfekten Leitfähigkeit und der Lenzschen Regel
erklären. Entlang des Weges 3–4 schalten wir aber zuerst das Magnetfeld oberhalb Tc an und
kühlen dann bei konstantem Magnetfeld ab. Hier würden wir nach unserer obigen Diskussi-
on für einen perfekten Leiter keine Feldverdrängung erhalten. Das Experiment von Meißner
und Ochsenfeld zeigte aber, dass auch entlang dieses Weges eine perfekte Feldverdrängung
erhalten wird. Das heißt, es gilt stets B i = 0 unabhängig von der Vorgeschichte. Damit kann
der supraleitende Zustand als Gleichgewichtszustand im Sinne der Thermodynamik aufge-
fasst werden. Es stellt sich natürlich sofort die Frage, wodurch wenn nicht durch das Fa-
radaysche Induktionsgesetz im Supraleiter Abschirmströme angeworfen werden, wenn wir
bei konstantem Magnetfeld unter die Sprungtemperatur abkühlen. Wir werden später sehen,
57
Wir wollen hier Entmagnetisierungseffekte zunächst vernachlässigen. Auf diese werden wir später
in Abschnitt 13.4.3 noch eingehen.
13.1 Geschichte und grundlegende Eigenschaften 787
dass die Ursache dafür die Existenz einer einheitlichen Phase einer makroskopischen Wel-
lenfunktion ist, mit der wir die Gesamtheit der supraleitenden Elektronen beschreiben. Der
Abschirmstrom ist proportional zum eichinvarianten Gradienten dieser Phase, der durch
das Vektorpotenzial modifiziert wird.
Es sei darauf hingewiesen, dass B i = 0 nur bis auf eine dünne Oberflächenschicht gilt, in wel-
cher der zur Abschirmung notwendige supraleitende Dauerstrom fließt. Wir werden weiter
unten sehen, dass die Dicke dieser Oberflächenschicht typischerweise nur im Bereich von
100 nm liegt und deshalb für massive Proben vernachlässigt werden kann.
B 2cth (T)
= gn (T) − gs (T) , (13.1.9)
2µ 0
𝑩𝒊
−𝝁𝟎 𝑴
(a) (b)
Abb. 13.7: Schematische Darstellung (a) der magnetischen Flussdichte im Inneren eines Supraleiters
und (b) der Magnetisierung als Funktion des von außen angelegten Magnetfelds.
58
Die Paulische Spin-Suszeptibilität χ Pauli eines normalleitenden Metalls beträgt nur etwa
75 10−5 , so
dass B i = µ 0 Hext eine sehr gute Näherung ist.
788 13 Supraleitung
80
60
Pb
Bcth (mT)
40
Hg
20
Abb. 13.8: Temperaturabhängigkeit
des thermodynamisch kritischen Al Sn
Feldes von Typ-I Supraleitern. Die Cd
Linien geben die nach (13.1.9) erwar- 0
0 2 4 6 8
teten Temperaturabhängigkeit wieder. T (K)
da der Supraleiter ja nicht mehr Energie für die Feldverdrängung aufwenden kann, als
er durch den Übergang in den supraleitenden Zustand gewonnen hat. Die Enthalpiedif-
ferenz ∆g(T) = gn (T) − gs (T) nennen wir auch Kondensationsenergie, da sie aus der
Kondensation der Leitungselektronen in den supraleitenden Zustand resultiert (eine genaue
Diskussion der thermodynamischen Eigenschaften von Supraleitern folgt in Abschnitt 13.2
und Anhang G). Die Temperaturabhängigkeit von B cth hängt von den Details der mikro-
skopischen Theorie ab, die wir erst später diskutieren werden. Empirisch lässt sich die
experimentell gefundene Abhängigkeit sehr gut durch (siehe hierzu Abb. 13.8)
T 2
B cth (T) = B cth (0) ⌊︀1 − ( ) }︀ (13.1.10)
Tc
beschreiben. Typische Werte für B cth (0) betragen für elementare Supraleiter einige 10 mT.
13.1.4.4 Shubnikov-Phase
Die Feldverdrängungsenergie im Meißner-Zustand steigt quadratisch mit dem Feld an und
beim kritischen Feld führt das komplette Eindringen des Magnetfeldes zum Zusammen-
bruch der Supraleitung. Lev Wassiljevitsch Shubnikov zeigte allerdings bereits 1936, dass
eine Verunreinigung von Pb mit Tl zu einer neuen Phase führt, die wir heute Shubnikov-
Phase oder Mischzustand nennen.59 , 60 In dieser Phase wird der Supraleiter bereits für Felder
unterhalb des thermodynamisch kritischen Feldes B cth von magnetischem Fluss durchsetzt
und der supraleitende Zustand verschwindet erst bei Feldern oberhalb von B cth . Die Ma-
gnetfelder B c1 und B c2 , die das untere und obere Ende der Shubnikov-Phase markieren,
bezeichnen wir als unteres und oberes kritisches Magnetfeld. Wir werden später sehen, dass
der magnetische Fluss in der Shubnikov-Phase in Form eines mehr oder weniger regelmä-
59
L. W. Shubnikov et al., Magnetische Eigenschaften supraleitender Metalle und Legierungen, Phys. Z.
Sowjet., Sondernummer zu Arbeiten auf dem Gebiete tiefer Temperaturen, 39-66 (1936).
60
L. W. Shubnikov et al., Magnetische Eigenschaften supraleitender Metalle und Legierungen, Phys. Z.
Sowjet. 10, 165-192 (1936).
13.1 Geschichte und grundlegende Eigenschaften 789
ßigen Gitters einzelner Flusslinien angeordnet ist, deren Flussinhalt gerade ein Flussquant
beträgt.
Heute wissen wir, dass die Shubnikov-Phase keine seltene Erscheinung ist, sondern in allen
Nichtelement-Supraleitern auftritt. Wir können das Auftreten der Shubnikov-Phase dazu
benutzen, Supraleiter in Typ-I und Typ-II Supraleiter einzuteilen. Typ-I Supraleiter zeigen
bis zum thermodynamisch kritischen Feld B cth einen perfekten Meißner-Effekt und gehen
dann direkt in den Normalzustand über. Typ-II Supraleiter zeigen dagegen nur bis zum un-
teren kritischen Magnetfeld B c1 < B cth einen perfekten Meißner-Zustand und gehen dann
im Feldintervall zwischen B c1 und B c2 in die Shubnikov-Phase über. Die Supraleitung ver-
schwindet erst bei Feldern oberhalb des oberen kritischen Magnetfeldes B c2 > B cth . Eine ge-
naue Diskussion der Eigenschaften von Typ-I und Typ-II Supraleitern folgt in Abschnitt 13.4.
Wir werden in Abschnitt 13.7 auch sehen, dass Typ-II Supraleiter eine enorme Bedeutung
für Anwendungen haben, bei denen hohe kritische Ströme und hohe Magnetfelder von In-
teresse sind.
13.1.4.5 Flussquantisierung
Im Jahr 1961 beobachteten etwa zeitgleich zwei experimentelle Gruppen, Robert Doll und
Martin Näbauer am Walther-Meißner-Institut in München, und Bascom S. Deaver und
William M. Fairbank an der Stanford University, dass der in einem supraleitenden Hohl-
zylinder eingefangene magnetische Fluss in Einheiten des Flussquants
h
Φ0 ≡ = 2.067 833 831(13) × 10−15 Vs (13.1.11)
2e
quantisiert ist.61 , 62 , 63 Diese Experimente belegten nicht nur die Quantisierung das magneti-
schen Flusses in mehrfach zusammenhängenden Supraleitern, sondern bewiesen auch zum
ersten Mal die Existenz von Cooper-Paaren mit Ladung q s = −2e und damit eine Kernaus-
sage der wenige Jahre zuvor von John Bardeen, Leon Cooper und Robert Schrieffer (BCS)
entwickelten mikroskopischen Theorie.
In beiden Experimenten wurden supraleitende Hohlzylinder verwendet, die in einem ange-
legten Magnetfeld B kühl unter die Sprungtemperatur abgekühlt wurden. Anschließend wur-
de das Magnetfeld abgeschaltet, so dass ein bestimmter magnetischer Fluss in dem Zylinder
eingefangen wurde (vergleiche hierzu Abb. 13.5). Der Wert des eingefangenen Flusses wur-
de dann als Funktion des Abkühlfeldes mit einer Genauigkeit gemessen, die besser als ein
Flussquant sein musste. Um eine große relative Änderung des eingefangenen Flusses von
Messung zu Messung zu erhalten, wurden kleine Abkühlfelder B kühl verwendet, die in ei-
ner kleinen Zahl von eingefangenen magnetischen Flussquanten resultierten. Da Φ = B ⋅ F,
musste sowohl B kühl als auch die Querschnittsfläche F bzw. der Innendurchmesser d des
Hohlzylinders klein gehalten werden. Man beachte, dass für F = 1 mm2 nur eine winzige
61
R. Doll, M. Näbauer, Experimental Proof of Magnetic Flux Quantization in a Superconducting Ring,
Phys. Rev. Lett. 7, 51 (1961).
62
B. S. Deaver Jr., W. M. Fairbank, Experimental Evidence for Quantized Flux in Superconducting Cy-
linders, Phys. Rev. Lett. 7, 43 (1961).
63
D. Einzel, R. Gross, Paarweise in Fluss, Physik Journal 10, No. 6, 45–48 (2011).
790 13 Supraleitung
Quarz-
faden
Spiegel
𝑩𝒑
Pb
Abb. 13.9: Schematische Darstellung des
Versuchsaufbaus, der von Doll und Näbau- Quarz-
er im Jahr 1961 zur Messung der Flussquan- zylinder
tisierung in einem supraleitenden Hohl-
zylinder verwendet wurde (nach R. Doll,
M. Näbauer, Phys. Rev. Lett. 7, 51 (1961)). 𝐷 ≈ 10 μm
Flussdichte B ≃ 10−9 T benötigt wird, um ein Flussquant in dem Zylinder zu erzeugen. Diese
Flussdichte ist wesentlich kleiner als die durch das Erdmagnetfeld in Mitteleuropa erzeug-
te horizontale Flussdichte B Erde ≃ 2 × 10−5 T. Von beiden experimentellen Gruppen wurden
Hohlzylinder mit einem Außendurchmesser von etwa 10 µm verwendet. Für diesen Durch-
messer wird eine Flussdichte B ≃ 2 × 10−5 T benötigt, um ein Flussquant zu erzeugen. Da
diese Flussdichte immer noch im Bereich der Flussdichte des Erdfeldes liegt, musste das
Erdmagnetfeld in diesen Experimenten sorgfältig abgeschirmt werden.
Im Experiment von Doll und Näbauer wurde ein Hohlzylinder aus Blei verwendet (siehe
Abb. 13.9). Der Zylinder wurde durch Aufdampfen eines Bleifilmes auf einen Quarzzylinder
realisiert. Beim Abkühlen des Zylinders unter die Sprungtemperatur von Blei (7.2 K) wurde
ein kleines Magnetfeld längs der Zylinderachse angelegt und dadurch ein bestimmter Ma-
gnetfluss im Zylinder eingefroren. Die Größe des eingefangenen magnetischen Flusses wur-
de durch die Messung des Drehmoments D = µ × B p bestimmt, das durch ein Messfeld B p
erzeugt wurde, das senkrecht zur Zylinderachse angelegt wurde. Dabei ist µ das magnetische
Moment des eingefangenen Flusses. Da das Drehmoment sehr klein und deshalb schwierig
zu messen ist, wurde eine Resonanzmethode verwendet. Der Zylinder wurde dazu an einem
dünnen Quarzfaden aufgehängt und über ein Wechselfeld B p zu einer Resonanzschwingung
angeregt. Im Fall der Resonanz ist die Schwingungsamplitude resonant überhöht und kann
deshalb leichter gemessen werden. Die Drehung des Zylinders wurde ausgelesen, indem ein
Lichtstrahl auf einen am Quarzfaden befestigten Spiegel geschickt wurde. Die gemessene
Resonanzamplitude ist proportional zum Drehmoment und damit proportional zum ma-
gnetischen Fluss, der im Zylinder eingefroren ist.
Deaver und Fairbank verwendeten in ihrem Experiment einen winzigen Sn Zylinder mit
einer Länge von etwa 0.9 mm, einem Innendurchmesser von 13 µm und einer Wandstär-
ke von 1.5 µm. Der Zylinder wurde mit einer Frequenz von etwa 100 Hz in axialer Richtung
hin- und herbewegt und das resultierende Wechselfeld mit Pickup-Spulen gemessen. Die ex-
perimentellen Daten beider Experimente sind in Abb. 13.10 gezeigt. Die Ergebnisse beider
Experimente waren gleich und zeigen eindeutig die Flussquantisierung. Obwohl die Zylin-
der in einem quasi kontinuierlich eingestellten Magnetfeld abgekühlt wurden, wurden nur
quantisierte Werte für den eingefangenen Fluss gemessen. Wir werden später sehen, dass die
Flussquantisierung als Bohr-Sommerfeld-Quantisierung in einem makroskopischen Quan-
13.1 Geschichte und grundlegende Eigenschaften 791
4
Resonanzamplitude (mm/Gauss) (a) (b)
3
1
1
0 0
-0.1 0.0 0.1 0.2 0.3 0.4 0.0 0.1 0.2 0.3 0.4
Bkühl (Gauss) Bkühl (Gauss)
Abb. 13.10: Der in einem supraleitenden Hohlzylinder eingefangene magnetische Fluss als Funktion
des während des Abkühlens unter die Sprungtemperatur von außen angelegten Magnetfeldes B kühl .
(a) Experiment von Doll und Näbauer (nach R. Doll, M. Näbauer, Phys. Rev. Lett. 7, 51 (1961) und
Zeitschrift für Physik 169, 526 (1962)). (b) Experiment von Deaver und Fairbank (nach B. S. Deaver,
W. M. Fairbank, Phys. Rev. Lett. 7, 43 (1961)).
tensystem aufgefasst werden kann. Der Nachweis der Flussquantisierung zeigte damit erst-
mals klar, dass das Phänomen Supraleitung nicht klassisch beschrieben werden kann. Ferner
lieferte er den Beweis für die Existenz von Cooper-Paaren mit Ladung q s = −2e.
13.1.4.6 Josephson-Effekt
Im Jahr 1962 wurden von Brian D. Josephson interessante Phänomene vorhergesagt,64 die
für schwach gekoppelte Supraleiter auftreten. Für diese Vorhersagen, die wenig später von
J. M. Rowell und P. W. Anderson65 experimentell bestätigt wurden, erhielt Josephson im Jahr
1973 den Nobelpreis für Physik.66 Die von Josephson vorhergesagten Phänomene sind eine
weitere Manifestation der Tatsache, dass es sich beim supraleitenden Zustand um einen ko-
härenten Vielteilchenzustand handelt, den wir mit einer makroskopischen Wellenfunktion
beschreiben können. Koppeln wir zwei Supraleiter schwach, so kommt es zu einem end-
lichen Überlapp dieser Wellenfunktionen. Dieser Überlapp führt zu einer molekülartigen
Bindung der beiden Supraleiter, die mit der Josephson-Kopplungsenergie beschrieben wird,
und interessanten Interferenzeffekten, die wir im Detail in Abschnitt 13.6 diskutieren wer-
den. Der Josephson-Effekt wurde zwar erstmals im Zusammenhang mit gekoppelten Supra-
leitern diskutiert, der Begriff Josephson-Effekt wird heute aber sehr breit verwendet. Wir
sprechen allgemein immer dann von einem Josephson-Effekt, wenn zwei makroskopische
Wellenfunktionen (z.B. diejenigen von Bose-Einstein-Kondensaten) schwach miteinander
gekoppelt sind.
64
B. D. Josephson, Possible New Effects in Superconductive Tunnelling, Phys. Lett. 1, 251–253 (1962).
65
P. W. Anderson, J. M. Rowell, Probable Observation of the Josephson Superconducting Tunneling Ef-
fect, Phys. Rev. Lett. 10, 230–232 (1963).
66
siehe hierzu Kasten auf Seite 884.
792 13 Supraleitung
𝖌𝒏 𝑩𝐞𝐱𝐭
0.0
gs / (Bcth /2µ0), gn / (Bcth /2µ0)
-0.2
2
𝑩𝟐𝐜𝐭𝐡 /𝟐𝝁𝟎
-0.4
67
W. H. Keesom, IV. Congr. Phys. Solvay (1924), Rapp et Disc, Seite 288.
68
Eine genaue Diskussion des Unterschieds zwischen Typ-I und Typ-II Supraleitern werden wir erst
in Abschnitt 13.4 machen. Ferner vernachlässigen wir hier Entmagnetisierungseffekte, auf die wir
erst in Abschnitt 13.4.3 eingehen werden.
13.2 Thermodynamische Eigenschaften von Supraleitern 793
Integrieren wir diese Gleichung auf, so erhalten wir für die Enthalpiedichte gs (B ext ) =
𝒢s (B ext )⇑V
B ext
1 ′ ′ B 2ext
gs (B ext , T) − gs (0, T) = ∫ B dB = . (13.2.2)
µ0 2µ 0
0
Der Verlauf der Enthalpiedichte ist in Abb. 13.11 gezeigt. Wir sehen, dass mit ansteigendem
äußeren Feld die freie Enthalpie des Supraleiters aufgrund der notwendig werdenden grö-
ßeren Feldverdrängungsarbeit quadratisch mit dem Feld zunimmt (Meißner-Parabel). Wir
weisen darauf hin, dass für normalleitende Metalle der Anstieg in der freien Enthalpie ver-
schwindend klein ist, da hier die Paulische Spin-Suszeptibilität im Bereich von 10−5 liegt und
deshalb ⋃︀M⋃︀ ≈ 10−5 B ext ⇑µ 0 sehr klein ist. Wir können also in sehr guter Näherung gn (B) =
gn (0) = const annehmen. Abb. 13.11 zeigt, dass mit zunehmendem Feld die freie Enthal-
piedichte des Supraleiters schließlich den Wert gn des Normalleiters erreicht. Die Konden-
sationsenergie, die durch den Übergang in den supraleitenden Zustand gewonnen wurde,
ist dann vollkommen für die Feldverdrängungsarbeit aufgebraucht. Die supraleitende Phase
wird instabil und wir erhalten einen Phasenübergang in den normalleitenden Zustand. Für
die freie Enthalpiedichte gs am Phasenübergang gilt gs (B cth , T) = gn (B cth , T) = gn (0, T).
Damit erhalten wir für die Differenz der Enthalpiedichten im supraleitenden und normal-
leitenden Zustand
B 2cth
∆g(T) = gn (0, T) − gs (0, T) = . (13.2.3)
2µ 0
Die beim Übergang in den supraleitenden Zustand gewonnene Kondensationsenergie
entspricht also gerade der Feldverdrängungsarbeit, die zur Verdrängung des thermody-
namisch kritischen Feldes B cth aufgebracht werden muss. Die Temperaturabhängigkeit
von B cth wird gut durch den empirischen Ausdruck (13.1.10) beschrieben. Im normal-
leitenden Zustand wird die Entropie bei tiefen Temperaturen überwiegend durch die
Leitungselektronen bestimmt, da die Beiträge der Phononen vernachlässigbar klein werden.
Da c p = T(∂s n ⇑∂T) p,H ext und die spezifische Wärmekapazität des freien Elektronenga-
ses proportional zu T verläuft, ergibt sich auch für die Entropiedichte s n ein linearer und
gn = − ∫0 s n dT ein quadratischer Temperaturverlauf. Der Temperaturverlauf von gs (B = 0)
T
und gn (B = 0) ist in Abb. 13.12a dargestellt. Wir wollen auch noch darauf hinweisen, dass
die Kondensationsenergiedichte gn (0, T) − gs (0, T) relativ klein ist. Für typische kritische
Felder von einigen 10 bis 100 mT beträgt sie nur etwa 103 − 104 J/m3 , was nur etwa 0.1 bis
1 µeV pro Atom entspricht.
Aus der Differenz ∆g(T) der freien Enthalpiedichten können wir mit Hilfe von s =
−(∂g⇑∂T) p,H ext [vergleiche (G.4.7)] eine Aussage über den unterschiedlichen Tempera-
turverlauf der Entropiedichten s s = S s ⇑V und s n = S n ⇑V im normal- und supraleitenden
Zustand machen. Wir erhalten
∂∆g B cth ∂B cth
∆s(T) = s n (T) − s s (T) = − ( ) =− . (13.2.4)
∂T p,B ext µ 0 ∂T
Der Temperaturverlauf der Entropiedichten für die normalleitende und supraleitende Phase
ist in Abb. 13.12b gezeigt.
794 13 Supraleitung
(a) (b)
𝑩𝟐𝐜𝐭𝐡 /𝟐𝝁𝟎
Entropiedichte, Q/V
freie Enthalpiedichte 𝒔𝒏 (𝑻)
𝖌𝒏 𝟎, 𝑻
𝖌𝒔 𝟎, 𝑻 𝚫𝐐 𝐓
𝐕
𝒔𝒔 𝑻
0.0 0.2 0.4 0.6 0.8 1.0 0.0 0.2 0.4 0.6 0.8 1.0
T / Tc T / Tc
Abb. 13.12: Schematische Darstellung des Temperaturverlaufs (a) der Dichten der freien Enthalpie
und (b) der Entropie eines Supraleiters und eines Normalleiters. Die farbig hinterlegten Flächen ge-
102
ben jeweils den Unterschied der Größen im normalleitenden und supraleitenden Zustand wieder. Die
gestrichelte Linie in (b) zeigt den Verlauf der Umwandlungswärme pro Volumeneinheit ∆Q⇑V = T∆s.
Wir können aus Gleichung (13.2.4) einige interessante Schlüsse ziehen. Für T → Tc geht B cth
gegen null, so dass s n − s s ebenfalls gegen null geht. Das heißt, die Entropiedichten der su-
praleitenden und normalleitenden Phase sind genauso wie die Dichten der freien Enthalpie
bei T = Tc (B = 0) identisch. Folglich ist auch die latente Wärme ∆Q⇑V = Tc (s n − s s ) = 0. Es
tritt also keine Umwandlungswärme auf, weshalb wir es mit einem Phasenübergang 2. Ord-
nung zu tun haben. Für T → 0 verschwindet ∂B cth ⇑∂T und somit auch ∆s in Einklang mit
dem 3. Hauptsatz der Thermodynamik.
Im gesamten Temperaturbereich 0 < T < Tc ist ∂B cth ⇑∂T < 0 und damit ∆s > 0. Das heißt,
die Entropiedichte der normalleitenden Phase ist größer als diejenige der supraleitenden
Phase. Daraus können wir ableiten, dass es sich beim supraleitenden Zustand offensicht-
lich um einen Zustand mit höherem Ordnungsgrad handelt. Die Ursache für den höhe-
ren Ordnungsgrad liegt in der Korrelation der Leitungselektronen zu Cooper-Paaren, de-
ren mikroskopische Ursache wir später in Abschnitt 13.5 diskutieren werden. Da ∆s → 0
für T → Tc und T → 0, muss ∆s irgendwo im Temperaturintervall 0 < T < Tc ein Maximum
besitzen. Diese Tatsache ist für die weiter unten diskutierte Wärmekapazität von Bedeu-
tung. Wegen ∆s > 0 erhalten wir auch eine endliche Umwandlungswärme pro Volumenein-
heit ∆Q⇑V = T(s n − s s ) > 0. Wir haben es also im Feld für 0 < T < Tc mit einem Phasen-
übergang 1. Ordnung zu tun. Kühlen wir einen Supraleiter im Nullfeld ab, so überschreiten
wir die Phasengrenze bei Tc (B = 0). Hier ist ∆Q⇑V = 0 und es liegt ein Phasenübergang
2. Ordnung vor. Kühlen wir allerdings in endlichem Feld ab, so überschreiten wir die Pha-
sengrenze bei T = Tc (B) < Tc (B = 0). Die Umwandlungswärme ist hier endlich und wir ha-
ben es mit einem Phasenübergang 1. Ordnung zu tun. Der Temperaturverlauf der Umwand-
lungswärme ist in Abb. 13.12b eingezeichnet.
Spezifische Wärme: Mit der Definition c p = T(∂s n ⇑∂T)B ext , p für die spezifische Wärme-
kapazität [vergleiche (G.6.3)] erhalten wir für den Unterschied der Wärmekapazität im nor-
13.2 Thermodynamische Eigenschaften von Supraleitern 795
T ∂ 2 B cth ∂B cth 2
∆c = c n − c s = − ⌊︀B cth + ( ) }︀ . (13.2.5)
µ0 ∂T 2 ∂T
Dieser wichtige Zusammenhang wird in der Literatur häufig als Rutgers-Formel bezeich-
net.69 Wir sehen, dass sich die Wärmekapazitäten im normalleitenden und supraleitenden
Zustand bei T = Tc unterscheiden, da hier B cth = 0, aber ∂B cth ⇑∂T ≠ 0. Damit wird ∆c < 0,
die Wärmekapazität des supraleitenden Zustands ist also größer als diejenige des normal-
leitenden Zustands. Da sich die Ableitung ∂B cth ⇑∂T bei T = Tc sprunghaft ändert, erhalten
wir hier einen Sprung in der Wärmekapazität. Es gilt
Tc ∂B cth 2
∆c T=Tc = (c n − c s )T=Tc = − ( ) , (13.2.6)
µ 0 ∂T T=Tc
was für viele Supraleiter sehr gut erfüllt wird. Experimentell bestimmt man z. B. für Sn (Tc =
mol
3.72 K) den Sprung ∆c T=T c
der molaren Wärmekapazität zu 10.6 mJ⇑mol⋅K. Für den aus
dem gemessenen thermodynamischen kritischen Feld berechneten Wert erhält man eben-
falls 10.6 mJ⇑mol⋅K. Für In (Tc = 3.40 K) sind die entsprechenden Werte 9.75 mJ/mol⋅K und
9.62 mJ⇑mol⋅K. Die quantitative Vorhersage des Sprunges in der spezifischen Wärme bei
T = Tc war auch eines der Schlüsselergebnisse der mikroskopischen Theorie (siehe hierzu
Abschnitt 13.5.5).
In Abb. 13.13 ist beispielhaft die spezifische Wärme von Al im normalleitenden und supra-
leitenden Zustand gezeigt. Da ∂ 2 B cth ⇑∂T 2 < 0 und ∂B cth ⇑∂T mit abnehmender Temperatur
immer kleiner wird, erhalten wir eine Temperatur, bei der c s = c n . Der Schnittpunkt liegt bei
der Temperatur, bei der s n − s s maximal wird.
molare Wärmekapazität (mJ/ mol K)
Al
3
𝒄𝒔 𝚫𝒄
Abb. 13.13: Temperaturverlauf der molaren
2 spezifischen Wärme von supraleitendem
und normalleitendem Al. Um die spezifi-
sche Wärme im normalleitenden Zustand
1
zu messen, wurde die Supraleitung mit ei-
𝒄𝒏 nem äußeren Magnetfeld von 50 mT unter-
𝑻𝒄 drückt (runde Symbole). Der Gitterbeitrag
zur spezifischen Wärme ist in dem gezeig-
0 ten Temperaturbereich vernachlässigbar
0.0 0.4 0.8 1.2 1.6 2.0
klein (nach N. E. Phillips, Phys. Rev. 114,
T (K) 676 (1959)).
103
69
A. J. Rutgers, Bemerkung zur Anwendung der Thermodynamik auf die Supraleitung, Physica 3, 999
(1936).
796 13 Supraleitung
Wir können also durch die Messung von B cth und Tc den Sommerfeld-Koeffizienten γ =
π2 2
k N(E F ) bestimmen [vergleiche (7.2.8)] und damit eine Aussage über die Zustandsdichte
3 B
am Fermi-Niveau N(E F ) = D(E F )⇑V machen. Ein wichtiger Aspekt von Gleichung (13.2.8)
ist, dass sie einen Zusammenhang zwischen normalleitenden [γ bzw. D(E F )] und supra-
leitenden Materialeigenschaften (B cth , Tc ) liefert. Einen ähnlichen Zusammenhang werden
wir später aus der mikroskopischen Theorie ableiten. Selbst wenn dieser Zusammenhang
nur von qualitativer Natur ist, so erlaubt er doch, experimentelle Ergebnisse hinsichtlich
Plausibilität und Konsistenz zu überprüfen.
Volumenänderung bei Tc : Nach (G.4.7) gilt (∂𝒢⇑∂p)T,B = V . Mit Hilfe von (13.2.2) erhal-
ten wir daraus für die relative Änderung des Volumens beim Phasenübergang vom normal-
in den supraleitenden Zustand
Wir erkennen, dass für T → Tc die Volumenänderung gegen null geht, da hier B cth (T) → 0.
Für T < Tc ist üblicherweise Vs > Vn , da ∂B cth (T)⇑∂p < 0. Das heißt, der Supraleiter bläht
sich beim Übergang in den supraleitenden Zustand auf. Für Sn (Tc = 3.7 K) beträgt die
bei 2 K gemessene relative Längenänderung etwa 8 × 10−8 .70 Solche kleinen Längenände-
rungen können mit empfindlichen Dilatometern gemessen werden. In vielen Fällen ist es
allerdings einfacher, die Druckabhängigkeit des kritischen Feldes B cth (p) bei konstanter
Temperatur mit Hilfe einer Hochdruckapparatur zu messen.71 Aus dieser Abhängigkeit kann
dann die Volumenänderung mit (13.2.9) berechnet werden. Wir wollen noch darauf hinwei-
sen, dass eine nochmalige Differenziation von (13.2.9) nach p bzw. T die Differenz κ n − κ s
der Kompressibilitäten bzw. die Differenz α n − α s der thermischen Ausdehnungskoeffizien-
ten liefert.
70
J. L. Olsen, H. Rohrer, The Volume Change at the Superconducting Transition, Helv. Phys. Acta 30,
49 (1957).
71
N. E. Alekseevskii, Yu. P. Gaidukov, The Effect of Pressure on the Superconductivity of Cadmium ,
Sov. Phys. JETP 2, 762 (1956).
13.2 Thermodynamische Eigenschaften von Supraleitern 797
nen wir den supraleitenden Volumenanteil in guter Näherung zu Vs = 1 − B ext ⇑B c2 und den
normalleitenden Anteil zu Vn = B ext ⇑B c2 angeben. Für tiefe Temperaturen T ≪ Tc können
wir den Beitrag des supraleitenden Volumenanteils in erster Näherung vernachlässigen und
𝖌𝒏 𝑩𝐞𝐱𝐭
0.0
gs / (Bcth /2µ0), gn / (Bcth /2µ0)
-0.4
weicht gs (B ext ) von der gestrichelt
gezeichneten Meißner-Parabel ab,
-0.6
da das äußere Feld jetzt teilweise
eindringt. Beim oberen kritischen
-0.8 Feld B c2 wird gs (B ext ) = gn (B ext ),
2
72
Eine genaue Diskussion des Unterschieds zwischen Typ-I und Typ-II Supraleitern folgt in Ab-
schnitt 13.4.
798 13 Supraleitung
13.3.1 London-Gleichungen
Im Jahr 1935 gelang es den Brüdern Fritz und Heinz London, die grundlegenden Eigen-
schaften von Supraleitern, ideale Leitfähigkeit und perfekten Diamagnetismus, im Rahmen
der klassischen Elektrodynamik zu beschreiben.73 Um die London-Gleichungen abzuleiten,
gehen wir von der einfachen Bewegungsgleichung74
d 1
m( + ) v = qE (13.3.1)
dt τ
für Ladungsträger mit Masse m, Ladung q und mittlerer Stoßzeit τ aus. Wir nehmen nun an,
dass wir die gesamte Ladungsträgerdichte n als Summe aus einer Dichte n n von „normallei-
tenden“ und n s von „supraleitenden“ Elektronen schreiben können. Diese Annahme werden
wir später noch rechtfertigen.75 Hierbei gilt im normalleitenden Bereich n n = n und n s = 0
und im supraleitenden Bereich n n = 0 und n s = n für T → 0. Wir beschreiben den supralei-
tenden Zustand also mit einem Zweiflüssigkeiten-Modell.
Um den widerstandslosen Stromfluss für T < Tc zu beschreiben, können wir einfach eine un-
endlich große Streuzeit, τ → ∞, benutzen, wodurch wir σ = n s q 2s τ⇑m s → ∞ erhalten. Hier-
bei sind q s und m s die Ladung und Masse der supraleitenden Elektronen. Verwenden wir
den allgemeinen Ausdruck für die supraleitende Stromdichte Js = n s q s vs , so erhalten wir die
1. London-Gleichung:
∂(ΛJs )
=E. (13.3.2)
∂t
73
F. London, H. London, The Electromagnetic Equations of the Supraconductor, Proc. Roy. Soc.
Lond. A 149, 71 (1935).
74
Um besser zwischen der Flussdichte auf einer mikroskopischen Skala und makroskopischen Mit-
telwerten zu unterscheiden, werden wir im Folgenden für die lokale Flussdichte b und für den
makroskopischen Mittelwert B verwenden.
75
In der ursprünglichen London-Theorie blieb der Wert von n s völlig offen. Nur die obere Gren-
ze n s = n war evident.
13.3 Phänomenologische Modelle 799
Hierbei ist Λ = nms qs 2 der London-Koeffizient. Die 1. London-Gleichung besagt, dass nicht
s
die Stromdichte, wie beim Ohmschen Gesetz, sondern ihre Zeitableitung proportional zum
elektrischen Feld ist. Sie beschreibt den verlustfreien Stromtransport. Fritz und Heinz Lon-
don nahmen an, dass die Masse m s , Ladung q s und Dichte n s der supraleitenden Elektronen
den entsprechenden Werten im Normalzustand entspricht. Nach der Entwicklung der BCS-
Theorie wissen wir heute, dass m s = 2m, q s = −2e und n s = n⇑2. Interessanterweise kürzt
sich der Faktor 2 in dem Ausdruck für den London-Koeffizienten gerade heraus.
Wir können nun Gleichung (13.3.2) in das Faradaysche Induktionsgesetz ∇ × E = −∂b⇑∂t
einsetzen und erhalten
∂
(︀∇ × (ΛJs ) + b⌋︀ = 0 . (13.3.3)
∂t
Diese Gleichung gilt allgemein für alle idealen Leiter. Sie besagt, dass der magnetische Fluss
durch eine beliebige Fläche innerhalb der Probe zeitlich unverändert bleibt. Der Meißner-
Ochsenfeld-Effekt besagt aber nun gerade, dass im Supraleiter nicht nur die zeitlich Än-
derung der Flussdichte, sondern diese selbst verschwinden muss. Deshalb muss der Klam-
merausdruck selbst und nicht nur seine Zeitableitung verschwinden. Wir erhalten somit die
2. London-Gleichung:
∇ × (ΛJs ) + b = 0 . (13.3.4)
Sie verknüpft den Stromfluss mit der magnetischen Flussdichte im Supraleiter. Mit der Max-
well-Gleichung ∇ × b = −µ 0 Js (wir vernachlässigen hier den Verschiebungsstrom ∂D⇑∂t)
folgt b = −(Λ⇑µ 0 ) ∇ × ∇ × b und weiter wegen ∇ × ∇ × b = ∇(∇ ⋅ b) − ∇2 b und ∇ ⋅ b = 0
erhalten wir
µ0 1
∇2 b − b = ∇2 b − 2 b = 0 . (13.3.5)
Λ λL
Hierbei ist
}︂ }︂
Λ ms
λL = = (13.3.6)
µ0 µ 0 n s q 2s
die Londonsche Eindringtiefe. Der Ausdruck (13.3.5) besitzt die Form einer Abschirmglei-
chung. Die Bedeutung der charakteristischen Längenskala λ L wird sofort deutlich, wenn
wir (13.3.5) für einen einfachen Spezialfall lösen. Hierzu betrachten wir den in Abb. 13.15
gezeigten Fall, dass das Magnetfeld in z-Richtung zeigt und der Supraleiter den Halbraum
mit x ≥ 0 einnimmt. Damit vereinfacht sich (13.3.5) zu d 2 b z ⇑dx 2 = b z ⇑λ 2L mit der Lösung
x
b z (x) = B ext,z exp (− ). (13.3.7)
λL
Mit Hilfe der 2. London-Gleichung erhalten wir für die Stromdichte des Abschirmstromes
x H ext,z
J s, y (x) = J s,0 exp (− ) mit J s,0 = . (13.3.8)
λL λL
Sowohl das Magnetfeld als auch der Abschirmstrom fallen also im Inneren des Supraleiters
exponentiell mit der charakteristischen Abklinglänge λ L ab (siehe Abb. 13.15). Wir sehen,
800 13 Supraleitung
dass ein angelegtes Magnetfeld vom Supraleiter durch an der Oberfläche in einer Schicht 120
der Dicke λ L fließende Abschirmströme vollkommen verdrängt wird. Dies beschreibt gerade
den perfekten Diamagnetismus von Superleitern.
Um die Größenordnung von λ L abzuschätzen, nehmen wir an, dass n s ≃ n⇑2. Wir erhal-
ten dann für typische Metalle wie Pb, Al, In oder Sn Werte im Bereich zwischen etwa 10
und einigen 100 nm. Da die Dichte der supraleitenden Elektronen von n s = n⇑2 für T → 0
auf n s = 0 bei Tc abnimmt, steigt λ L mit der Temperatur an und divergiert für T → Tc . Die
experimentell gefundene Abhängigkeit kann gut mit der empirischen Formel
λ L (0)
λ L (T) = ⌈︂ (13.3.9)
1 − (T⇑Tc )4
Dieser Flussdichteverlauf ist in Abb. 13.16 gezeigt. Für d = 3λ L nimmt die Flussdichte in
der Mitte des supraleitenden Films auf etwa 10% ab. Die mittlere Flussdichte B = b z (x) be-
trägt B = (2λ L B ext,z ⇑d) tanh(d⇑2λ L ).
Die beiden Londonschen Gleichungen beschreiben zusammen mit den Maxwell-Gleichun-
gen die Elektrodynamik von Supraleitern. Es sei hier darauf hingewiesen, dass wir bisher
die normalleitende Komponente völlig vernachlässigt haben. Dies ist für zeitlich langsam
variierende Ströme eine gute Näherung, da hier die im Supraleiter auftretenden elektrischen
76
C. J. Gorter, H. B. G. Casimir, On Superconductivity I, Physica 1, 306 (1934).
77
C. J. Gorter, H. B. G. Casimir, Z. Physik 35, 963 (1934).
78
C. J. Gorter, H. B. G. Casimir, Z. Techn. Physik 15, 539 (1934).
13.3 Phänomenologische Modelle 801
𝒛
𝒚
𝑩𝐞𝐱𝐭
𝑩𝐞𝐱𝐭,𝒛
Abb. 13.16: Schematische Darstellung des Verlaufs der
magnetischen Flussdichte in einer dünnen supraleitenden
Schicht mit Dicke d in der Größenordnung der London-
𝝀𝐋 𝒙 schen Eindringtiefe λ L . Die Schicht liegt in der yz-Ebene,
das äußere Magnetfeld ist parallel zur z-Achse angelegt.
Die Flussdichte nimmt im Zentrum der Schicht nicht auf
𝒅 null ab.
Felder klein sind. Bei zeitlich schnell variierenden Strömen werden auch die normalleiten-
den Elektronen durch die jetzt beträchtlichen elektrischen Felder hin- und herbeschleunigt
und führen durch Stoßprozesse zu Verlusten. Ein Supraleiter
122
kann aus diesem Grund nur
Gleichströme, nicht aber Wechselströme vollkommen verlustfrei transportieren.
Wir wollen auch noch auf die Problematik der oben gemachten sehr (zu) einfachen Ablei-
tung der Londonschen Gleichungen hinweisen. Wir haben dabei immer eine lokale Bezie-
hung zwischen Js , E und b angenommen, d. h. Js ist an jedem Ort r eindeutig durch die
lokalen Felder bestimmt. Diese Annahme ist für ein Elektronengas nicht ganz richtig. Die
Stromdichte an einem bestimmten Ort ist hier durch den Mittelwert der Felder in einem
Bereich mit Radius ℓ um diesen Ort gegeben. Dies ist unproblematisch, solange die mitt-
lere freie Weglänge ℓ klein ist. In unserem Fall geht aber wegen τ → ∞ auch ℓ → ∞. Um
dieses Problem zu beseitigen, wurde von A. B. Pippard die Kohärenzlänge eingeführt. Da-
durch konnte er eine nichtlokale Verallgemeinerung der London-Gleichungen erhalten, die
wir hier aber nicht diskutieren wollen.79
79
A. B. Pippard, An Experimental and Theoretical Study of the Relation between Magnetic Field and
Current in a Superconductor, Proc. Roy. Soc. London A 216, 547 (1953).
80
F. London, Superfluids, vol. I, Wiley, New York (1950).
802 13 Supraleitung
sich bei der Supraleitung um ein inhärent quantenmechanisches Phänomen handelt, das sich
auf einer makroskopischen Längenskala manifestiert. Das heißt, bei der Supraleitung han-
delt es sich um ein makroskopisches Quantenphänomen, das es uns erlaubt, ungewöhnliche
Quantenphänomene auf einer makroskopischen Skala zu beobachten.
Das makroskopische Quantenmodell der Supraleitung basiert auf der Hypothese, dass es
eine makroskopische Wellenfunktion
mit Amplitude ψ 0 (r, t) und Phase θ(r, t) gibt, welche die Gesamtheit aller supraleitenden
Elektronen eines paarkorrelierten Fermi-Systems, die wir auch als Paar-Kondensat bezeich-
nen, beschreibt. Wir werden später sehen, dass sich diese Hypothese im Rahmen der BCS-
Theorie exakt begründen lässt. Die Darstellung der quantenmechanischen Wellenfunktion
als Amplitude ψ 0 (r, t) und Phase θ(r, t) geht auf Erwin Madelung zurück.81 , 82 Er interpre-
tierte die Schrödinger-Gleichung der linear unabhängigen Funktionen ψ und ψ ∗ als zwei hy-
drodynamische Gleichungen, die eine „Wahrscheinlichkeitsflüssigkeit“, die so genannte Ma-
delung-Flüssigkeit beschreiben. Das Einsetzen der Wellenfunktion ψ = ψ 0 e ı θ in die Schrö-
dinger-Gleichung wird deshalb als Madelung-Transformation bezeichnet. Wendet man die
Idee von Madelung auf das Konzept der makroskopischen Wellenfunktion an, kann man
quantenhydrodynamische Gleichungen für Supraflüssigkeiten ableiten. Wir weisen an die-
ser Stelle auch darauf hin, dass sich das makroskopische Quantenmodell sowohl für die Be-
schreibung von geladenen als auch von ungeladenen Paar-Kondensaten (z. B. suprafluides
3
He) verwenden lässt.83 , 84 Ferner eignet es sich zur Beschreibung von Bose-Einstein-Kon-
densaten (z. B. suprafluides 4 He).
Wir wollen nun die Konsequenzen diskutieren, die sich aus dem Postulieren einer makrosko-
pischen Wellenfunktion ergeben. Wir betrachten zuerst die Bedeutung von ⋃︀ψ⋃︀2 . Für ein ein-
zelnes Teilchen gibt das Absolutquadrat ⋃︀Ψ(r, t)⋃︀2 seiner Wellenfunktion Ψ(r, t) die Wahr-
scheinlichkeit dafür an, das Teilchen zur Zeit t am Ort r anzutreffen. Da das Teilchen sich
zu jeder Zeit irgendwo im Raum befinden muss, ergibt sich daraus sofort die Normierungs-
bedingung ∫ Ψ∗ ΨdV = 1. Mit den gleichen Argumenten können wir für die Wellenfunk-
tion ψ, die das ganze Ensemble von supraleitenden Elektronen repräsentiert, folgende Nor-
mierungsbedingung fordern:
∗
∫ ψ (r, t)ψ(r, t)dV = N s (13.3.12)
Hierbei ist n s (r, t) die lokale Dichte und N s die Gesamtzahl der supraleitenden Elektronen.
Die Bedingung (13.3.12) sagt nichts anderes, als dass wir alle supraleitenden Elektronen auf-
81
E. Madelung, Eine anschauliche Deutung der Gleichung von Schrödinger, Naturwiss. 14, 1004 (1926).
82
E. Madelung, Quantentheorie in hydrodynamischer Form, Z. Phys. 40, 322 (1926).
83
D. Einzel, Supraleitung und Suprafluidität, in Lexikon der Physik, Spektrum Akademischer Verlag,
Heidelberg, Berlin (2000).
84
D. Einzel, Superfluids, Encyclopedia of Mathematical Physics (2005).
13.3 Phänomenologische Modelle 803
finden müssen, wenn wir den ganzen Raum absuchen. Im Gegensatz zur üblichen Interpre-
tation von ⋃︀ψ(r, t)⋃︀2 als Aufenthaltswahrscheinlichkeit assoziieren wir ⋃︀ψ(r, t)⋃︀2 jetzt mit der
Teilchenzahldichte am Ort r zur Zeit t. Ansonsten können wir alle aus der Quantenmechanik
bekannten Aussagen übernehmen. Die einzelnen Ladungsträger verlieren bei diesem Ansatz
ihre Individualität und gehorchen im Kollektiv den Gesetzen der Quantenmechanik.
Für die weitere Diskussion benötigen wir noch einige grundlegende Beziehungen aus der
Elektrodynamik und der Quantenmechanik. Wir werden das elektrostatische skalare Poten-
zial ϕ(r, t) und das magnetische Vektorpotenzial A(r, t) benutzen, um die elektrischen und
magnetischen Felder zu beschreiben. Es gilt
∂A
E=− − ∇ϕ (13.3.14)
∂t
b=∇×A. (13.3.15)
Wir weisen darauf hin, dass die Potenziale nicht eindeutig sind, alle im Folgenden abgelei-
teten Gleichungen aber eichinvariant sind. Wir rufen ferner in Erinnerung, dass elektrische
Ströme in Metallen durch Gradienten des elektrochemischen Potenzials ϕ(r, t) + µ(r, t)⇑q
und nicht durch Gradienten von ϕ alleine getrieben werden. Wir müssen also das chemische
Potenzial in unsere Betrachtung einschließen, indem wir ϕ(r, t) durch ϕ(r, t) + µ(r, t)⇑q er-
setzen:85
Die treibende Kraft für die Ladungsträger mit Ladung q ist deshalb das effektive elektrische
Feld
∂A µ
E=− − ∇ (ϕ + ) . (13.3.17)
∂t q
Für die quantenmechanische Beschreibung der Bewegung von geladenen Teilchen in einem
Magnetfeld müssen wir den kanonischen Impuls p = mv + qA (siehe hierzu Anhang D) ver-
wenden. Die Schrödinger-Gleichung für ein geladenes Teilchen mit Ladung q und Masse m,
in die nur der kinematische Impuls mv = ħı ∇ − qA eingeht, lautet dann
2
1 ħ ∂Ψ(r, t)
( ∇ − qA(r, t)) Ψ(r, t) + (︀qϕ(r, t) + µ(r, t)⌋︀Ψ(r, t) = ıħ .
2m ı ∂t
(13.3.18)
Wir ersetzen nun die Wellenfunktion Ψ(r, t) des geladenen Teilchens durch die makrosko-
pische Wellenfunktion ψ(r, t) = ψ 0 (r, t)e ı θ(r,t) des Supraleiters sowie q und m durch die
Ladung q s und Masse m s der „supraleitenden“ Elektronen. Wir setzen dann ψ(r, t) in die
85
Das chemische Potenzial ist, wenn auch nur schwach, temperaturabhängig. Dies wird wichtig,
wenn wir Situationen mit Temperaturgradienten betrachten wollen.
804 13 Supraleitung
∂ψ 02 (r, t) ψ2
= −∇ ⋅ ( 0 (ħ∇θ(r, t) − q s A(r, t))) . (13.3.19)
∂t ms
)︁⌊︂⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ]︂⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ )︂ )︁⌊︂⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂]︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ )︂
=∂n s ⇑∂t =n s v s =J ρ
Da ⋃︀ψ 02 ⋃︀ = n s , erkennen wir sofort, dass (13.3.19) die Form einer Kontinuitätsgleichung
∂n s ⇑∂t + ∇ ⋅ J ρ = 0 für die Teilchenstromdichte J ρ hat. Multiplizieren wir J ρ mit der Ladung
q s der „supraleitenden“ Elektronen, so erhalten wir die supraleitende Stromdichte
ħ qs
Js (r, t) = q s n s (r, t) { ∇θ(r, t) − A(r, t) . (13.3.20)
ms ms
Da wir die Suprastromdichte immer als Js = q s n s vs schreiben können, entspricht der Aus-
druck in der geschweiften Klammer der Geschwindigkeit der supraleitenden Elektronen:
ħ qs
vs (r, t) ≡ ∇θ(r, t) − A(r, t) . (13.3.21)
ms ms
Wenn wir Terme der Ordnung ∇2 vernachlässigen, was immer dann zulässig ist, wenn die
betrachteten elektromagnetischen Potenziale langsam variieren, erhalten wir
∂θ(r, t) 1
ħ = −( ΛJ2 (r, t) + q s ϕ(r, t) + µ(r, t)) . (13.3.23)
∂t 2n s s
Der Ausdruck (13.3.23) stellt eine Energie-Phasen-Beziehung dar, da der 1. Term auf der
rechten Seite die kinetische Energie ( 12 m s v s2 ) und die Summe aus 2. und 3. Term die poten-
zielle Energie ist. Da ħθ einer Wirkung S entspricht, ist (13.3.23) äquivalent zur Hamilton-
Jacobi-Gleichung ∂S⇑∂t = −H der klassischen Physik. Wir werden sehen, dass die beiden
Gleichungen (13.3.20) und (13.3.23) die wesentliche Physik einer geladenen Supraflüssig-
keit beinhalten.
Wir wollen diesen Abschnitt mit zwei Anmerkungen abschließen. Würden wir in (13.3.20)
den 1. Term in der Klammer weglassen, so ergäbe sich ΛJs + A = 0. Den gleichen Ausdruck
erhalten wir sofort aus der oben abgeleiteten 2. London-Gleichung, wenn wir dort b = ∇ × A
verwenden. Diese Gleichung ist allerdings im Gegensatz zu (13.3.20), wie wir weiter unten
zeigen werden, nicht eichinvariant. Sie gilt nur in der so genannten London-Eichung ∇ ⋅ A =
0. Diese garantiert, dass bei Abwesenheit von freien Ladungen div Js = 0 erfüllt ist.
Wir wollen ferner darauf hinweisen, dass sich das makroskopische Quantenmodell sowohl
für die Beschreibung von geladenen als auch von ungeladenen Quantenflüssigkeiten verwen-
13.3 Phänomenologische Modelle 805
den lässt, die mit einer makroskopischen Wellenfunktion beschrieben werden können.86 , 87
Benutzen wir
q s = k ⋅ q, m s = k ⋅ m, n s = n⇑k (13.3.24)
in den obigen Ausdrücken, so entspricht der Fall (q = −e, k = 2) einem Supraleiter mit
Cooper-Paaren der Ladung q s = −2e und der Dichte n s = n⇑2. Die Fälle (q = 0, k = 1)
und (q = 0, k = 2) repräsentieren eine neutrale Bose-Supraflüssigkeit, wie z. B. suprafluides
4
He, und eine neutrale Fermi-Supraflüssigkeit, wie z. B. suprafluides 3 He-A oder -B. Die
einzelnen oder zusammengesetzten Teilchen bilden in jedem Fall eine Supraflüssigkeit, die
wir bei Supraleitern auch als Kondensat bezeichnen.
ħ
ΛJs (r, t) = − {A(r, t) − ∇θ(r, t)(︀ . (13.3.25)
qs
Bilden wir auf beiden Seiten die Rotation, so erhalten wir die 2. London-Gleichung:
Um die 1. London-Gleichung zu erhalten, müssen wir die partielle Zeitableitung von (13.3.20)
bilden. Wir erhalten
∂ ∂A(r, t) ħ ∂θ(r, t)
(ΛJs ) = − { − ∇( )(︀ . (13.3.27)
∂t ∂t qs ∂t
Substituieren wir (13.3.23) in (13.3.27) und benutzen E = −∂A⇑∂t − ∇(ϕ + µ⇑q s ), erhalten
wir die 1. London-Gleichung:
∂ 1 1
(ΛJs ) = E − ∇ ( ΛJ2s ) . (13.3.28)
∂t ns qs 2
Hierbei kann der 2. Term auf der rechten Seite meist vernachlässigt werden (linearisierte
1. London-Gleichung), worauf wir aber hier nicht eingehen wollen. Die 1. London-Glei-
chung lautet dann ∂t∂ (ΛJs ) = E.
86
D. Einzel, Supraleitung und Suprafluidität, in Lexikon der Physik, Spektrum Akademischer Verlag,
Heidelberg, Berlin (2000).
87
D. Einzel, Superfluids, Encyclopedia of Mathematical Physics (2005).
806 13 Supraleitung
∎ Die London-Gleichungen können direkt aus dem allgemeinen Ausdruck für die Supra-
stromdichte Js abgeleitet werden, der wiederum direkt aus der Tatsache folgt, dass der
supraleitende Zustand durch eine makroskopische Wellenfunktion beschrieben wer-
den kann.
∎ Die London-Gleichungen beschreiben zusammen mit den Maxwell-Gleichungen das
Verhalten von Supraleitern in elektrischen und magnetischen Feldern.
Dauerströme: Die Tatsache, dass ein Suprastrom in einem Supraleiter zeitlich nicht ab-
klingt, ist äußerst interessant und auf den ersten Blick nicht einsichtig. Wir wollen deshalb
Prozesse diskutieren, die zu einem Abklingen des Suprastroms führen könnten. Dazu be-
trachten wir den in Abb. 13.17 gezeigten Fermi-Kreis in der k x k y -Ebene. Die Betrachtung
kann leicht auf dreidimensionale Systeme erweitert werden. Die erlaubten k-Zustände sind
durch Punkte charakterisiert. Bei T = 0 sind alle Zustände innerhalb des Kreises besetzt. Oh-
ne jeglichen Strom liegt das Zentrum des Fermi-Kreises im Ursprung. Erzeugen wir dagegen
einen endlichen Strom in x-Richtung, indem wir die Ladungsträger in diese Richtung be-
schleunigen, so wird der Fermi-Kreis um δk x in k x -Richtung verschoben. Im normalleiten-
den Zustand können nun die Ladungsträger in Zustände mit niedrigerer Energie relaxieren,
wobei wir natürlich das Pauli-Prinzip berücksichtigen müssen (siehe Abb. 13.17a). Da es
eine große Anzahl möglicher Streuprozesse gibt, wird das System sehr schnell in den Aus-
gangszustand mit einem um den Ursprung zentrierten Fermi-Kreis relaxieren. Das heißt,
der aufgeprägte Strom wird schnell relaxieren. Im Gegensatz dazu müssen im supraleiten-
den Zustand alle Cooper-Paare den gleichen Schwerpunktimpuls haben. Deshalb können sie
nur, wie in Abb. 13.17b gezeigt ist, um den Fermi-Kreis herumgestreut werden. Diese Streu-
prozesse führen aber nicht zu einer Verschiebung des Schwerpunktes des Fermi-Kreises und
damit auch nicht zu einem Abklingen des Stroms. Wir haben also einen nichtabklingenden
Suprastrom. Prozesse, die zu einer Impulsrelaxation führen, sind nur dann möglich, wenn
𝒌𝒚 𝒌𝒚 𝒌𝒚
Abb. 13.17: Intuitives Bild des Zerfalls eines Stroms in einem normalleitenden Metall (a) und einem
Supraleiter (b) bei T = 0. In (b) sind die Elektronen zu Cooper-Paaren korreliert, die alle den gleichen
Schwerpunktsimpuls besitzen. (c) Für T > 0 liegt im thermischen Mittel eine endliche Dichte von Ein-
teilchenanregungen durch thermisches Aufbrechen von Cooper-Paaren vor. Diese relaxiert von rechts
nach links, da dort die Energie der Einteilchenanregungen niedriger ist.
124
13.3 Phänomenologische Modelle 807
wir die Cooper-Paare zerstören. Dazu müssen wir aber, wie wir später noch sehen werden,
ihre endliche Bindungsenergie aufbringen.
In Abb. 13.17c ist die Situation für T > 0 gezeigt, bei der Cooper-Paare ständig thermisch
aufgebrochen werden und wieder rekombinieren, wobei im Mittel eine endliche Dichte von
Einteilchenanregungen übrig bleibt. Die Verschiebung der Fermi-Kugel um δk x und der dar-
aus resultierende Suprastrom in x-Richtung bleiben davon unberührt. Allerdings relaxieren
die Einteilchenanregungen durch Streuung an Verunreinigungen und Phononen von rechts
nach links, da dort ihre Energie niedriger ist. Dies führt zu einem effektiven Zurückfließen
der Einteilchenanregungen, wodurch der nach rechts fließende Suprastrom zwar reduziert
wird, aber nicht abklingt.
qs ns ħ ħ
Js (r, t) = γ(r, t) = γ(r, t) . (13.3.39)
ms qs Λ
13.3 Phänomenologische Modelle 809
Wir sehen also, dass der Suprastrom proportional zu einem eichinvarianten Phasengradi-
enten ist.88 Falls wir die Transformationen (13.3.30), (13.3.32), und (13.3.35) gleichzeitig
durchführen, ist die Transformation nur ein rein formaler Vorgang, der überhaupt keine
Auswirkung auf die beobachtbaren Größen hat.
13.3.2.3 Flussquantisierung
Wir wollen in diesem Abschnitt zeigen, dass eine direkte Konsequenz des makroskopischen
Quantenmodells der Supraleitung die Quantisierung des magnetischen Flusses in mehrfach
zusammenhängenden Supraleitern ist (siehe Abb. 13.18).
Wir wollen unsere Diskussion mit einem einfachen Gedankenexperiment beginnen. Wir
nehmen einen supraleitenden Hohlzylinder und erzeugen über magnetische Induktion
einen supraleitenden Ringstrom. Da dieser Suprastrom zeitlich nicht abklingt, muss es
sich um einen stationären Zustand handeln. Selbstverständlich können wir aber den Wert
des stationären Suprastroms ändern, indem wir den Induktionsprozess, mit dem wir den
Strom erzeugen, ändern. Klassisch würden wir deshalb erwarten, dass wir jeden beliebigen
Suprastrom in dem Ring erzeugen können. Nachdem wir aber gelernt haben, dass wir
den Supraleiter als makroskopisches Quantensystem betrachten können, müssen wir un-
sere Überlegung verfeinern. Von der quantenmechanischen Behandlung mikroskopischer
Systeme wissen wir, dass stationäre Zustände an bestimmte Quantisierungsbedingungen
geknüpft sind, die wir mit Quantenzahlen charakterisieren. Innerhalb des Bohrschen Atom-
modells sind zum Beispiel die stationären Elektronenzustände durch die Quantisierung
des Drehimpulses festgelegt. Wie in Abb. 13.18a gezeigt ist, ist diese Bedingung dazu äqui-
valent, dass die Elektronenwellenfunktionen nicht destruktiv interferieren. Analog dazu
erwarten wir für den supraleitenden Ringstrom nur dann einen stationären Zustand, falls
die makroskopische Wellenfunktion, die die Gesamtheit der supraleitenden Elektronen be-
schreibt, längs des Umfangs des Zylinders konstruktiv interferiert (siehe Abb. 13.18b). Wir
(a) 90 (b)
120 60
30
150 30
20
10
r / aB
0 180 0 𝒏 ⋅ 𝚽𝟎
10
20
210 330
30
240 300
270
Abb. 13.18: Stationäre Quantenzustände: (a) Stehende Elektronenwellen um den Kern eines Atoms am
Ort r = 0 sind gleichbedeutend mit der Bohr-Sommerfeld Quantisierung des Drehimpulses. (b) Die
stehende Welle der makroskopischen Wellenfunktion eines Supraleiters ist gleichbedeutend mit der
Flussquantisierung in einem supraleitenden Hohlzylinder.
132
88 qs
Man beachte, dass ∇θ − A nicht als ∇γ geschrieben werden kann, das heißt, nicht als Gradient
ħ
einer eichinvarianten Phase. In diesem Fall wäre A ∝ ∇θ − ∇γ und damit ∇ × A = b = 0.
810 13 Supraleitung
erwarten deshalb eine Quantisierungsbedingung. Dies wurde erstmals von Fritz London
vorgeschlagen.89 Er kam zu der Schlussfolgerung, dass der magnetische Fluss, der in einem
supraleitenden Hohlzylinder eingefangen ist, nur diskrete Werte haben kann, die durch ein
Vielfaches des Flussquants ΦLondon
0 gegeben sind. London schlug den Wert
h
ΦLondon
0 = ≃ 4 × 10−15 Vs (13.3.40)
e
vor, da er annahm, dass einzelne Elektronen den Suprastrom tragen. Die Tatsache, dass
Cooper-Paare den Suprastrom tragen, wurde erst später mit der Entwicklung der BCS-
Theorie klar.90
Wir wollen im Folgenden die Flussquantisierung ableiten, wobei wir aus Gründen der
Einfachheit von einem homogenen Supraleiter ausgehen wollen. Wir benutzen den Aus-
druck (13.3.25) für die Suprastromdichte
ħ
ΛJs (r, t) = − {A(r, t) − ∇θ(r, t)(︀ (13.3.41)
qs
und integrieren diesen Ausdruck entlang eines geschlossenen Weges C. Wir benutzen dabei
den Stokesschen Satz
∮ A ⋅ dℓ = ∫ (∇ × A) ⋅ ⧹︂
n dF = ∫ b ⋅ ⧹︂
n dF , (13.3.42)
C F F
wobei F die Fläche, die vom Weg C umschlossen wird (siehe Abb. 13.19), ⧹︂
n der Einheitsvek-
tor senkrecht auf F und b die magnetische Flussdichte ist, die mit dem Vektorpotenzial A
verbunden ist. Mit dem Stokesschen Satz können wir (13.3.41) in
ħ
∮ (ΛJs ) ⋅ dℓ + ∫ b ⋅ ⧹︂
n dF = ∮ ∇θ ⋅ dℓ (13.3.43)
qs
C F C
umschreiben.
Wir werten zuerst das Integral auf der rechten Seite von (13.3.43) aus. Das Integral des Gra-
dienten einer skalaren Funktion zwischen zwei Punkten r1 and r2 ist gegeben durch
r2
89
F. London, Superfluids, Wiley, New York (1950).
90
J. Bardeen, L. N. Cooper, J. R. Schrieffer, Theory of Superconductivity, Phys. Rev. 108, 1175 (1957).
13.3 Phänomenologische Modelle 811
Wir sehen, dass für r1 → r2 , also im Grenzfall eines geschlossenen Pfades, das Integral gegen
null geht. Im Allgemeinen ist das aber nicht ganz richtig, da ja die Phase der Wellenfunkti-
on ψ nicht genau festgelegt ist. Es gibt vielmehr unendlich viele Werte θ n = θ 0 + 2πn für die
Phase (n ist eine ganze Zahl), die alle denselben Wert der Wellenfunktion ergeben:
⌋︂
ψ(r, t) = n s e ı(θ 0 +2πn) . (13.3.45)
Die Wellenfunktion ψ(r, t) muss in jedem Punkt (r, t) eindeutig sein. Dies ist für n ∈ Z
erfüllt, wenn
Damit erhalten wir für das Integral des Phasengradienten entlang des geschlossenen
Weges C
∮ ∇θ ⋅ dℓ = rlim
2 →r 1
(︀θ(r2 , t) − θ(r1 , t)⌋︀ = n ⋅ 2π . (13.3.47)
C
h
∮ (ΛJs ) ⋅ dℓ + ∫ b ⋅ ⧹︂
n dF = n = nΦ 0 (13.3.48)
qs
C F
)︁⌊︂⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ]︂⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ )︂
Fluxoid
mit dem Flussquant Φ 0 ≡ 2eh = 2.067 833 831(13) × 10−15 Vs, wobei wir ⋃︀q s ⋃︀ = 2e verwendet
haben. Das Flussquant Φ 0 ist der kleinstmögliche magnetische Fluss, der in einer von einem
zusammenhängenden supraleitenden Bereich umschlossenen Fläche enthalten sein kann.
Wir wollen im Folgenden einige Konsequenzen von (13.3.48) anhand von Abb. 13.19 disku-
tieren:
1. Wir betrachten zuerst den Fall (a), bei dem die Fläche F, die durch den geschlossenen
Pfad C definiert wird, ein einfach zusammenhängendes supraleitendes Gebiet ist (siehe
Abb. 13.19a). Wir müssen uns in Erinnerung rufen, dass wir eine Integration entlang
eines geschlossenen Weges ausführen, welche wir uns als Linienintegral zwischen zwei
Punkten r1 und r2 für den Grenzfall r2 → r1 vorstellen können. Da (13.3.48) für alle ge-
schlossenen Wege gilt, müssen wir auch den Fall einschließen, bei dem F = 0. In diesem
Fall verschwinden beide Integrale in (13.3.48) und wir erhalten deshalb für einen ein-
fach zusammenhängenden Supraleiter n = 0.91 Dieses Ergebnis haben wir erwartet, da
die Bedingung n = 0 gerade die integrale Form der 2. London-Gleichung darstellt.
2. Wir betrachten als Nächstes den Fall eines mehrfach zusammenhängenden Supraleiters,
der in Abb. 13.19b gezeigt ist. Wichtig ist hierbei, dass der geschlossene Weg C jetzt so-
wohl einen supraleitenden als auch einen nicht-supraleitenden Bereich einschließt. In
unserem Fall ist der nicht-supraleitende Bereich einfach ein Loch. Wenn wir jetzt einen
91
Dies gilt natürlich nur dann, wenn die Suprastromdichte Js oder die magnetische Flussdichte B
keine Singularitäten besitzt.
812 13 Supraleitung
geschlossenen Pfad bilden, indem wir den Grenzfall r2 → r1 betrachten, bauen wir ein
„Gedächtnis“ in unseren Pfad ein. Wir wissen nämlich, dass wir einen nicht-supralei-
tenden Bereich umschlossen haben. Die Phasen in den Punkten r2 und r1 sind deshalb
unterschiedlich. Obwohl der Hauptwert θ 0 der beiden Phasen der gleiche ist, beträgt ihre
Differenz jetzt n ⋅ 2π.
Fluss- und Fluxoid-Quantisierung: Die linke Seite der Gleichung (13.3.48) wird als Flux-
oid bezeichnet. Deshalb beschreibt diese Gleichung allgemein die Fluxoid-Quantisierung.
Wichtig dabei ist, dass nur das Fluxoid, aber nicht notwendigerweise auch der durch das
äußere Magnetfeld erzeugte magnetische Fluss quantisiert ist, da in das Fluxoid sowohl der
durch das angelegte Magnetfeld erzeugte Fluss Φ′ = ∫ b ⋅ ⧹︂
n dF als auch der von dem supra-
leitenden Ringstrom erzeugte Fluss Φ′′ = ∮ (ΛJs ) ⋅ dℓ eingehen.
Wir betrachten nun den in Abb. 13.20 gezeigten supraleitenden Hohlzylinder. Wir nehmen
an, dass die Wandstärke des Zylinders wesentlich größer als die Londonsche Eindringtie-
fe λ L ist. Wenn wir jetzt ein kleines Magnetfeld (wesentlich kleiner als das kritische Feld
des Supraleiters) anlegen, nachdem wir den Supraleiter unter seine Sprungtemperatur ab-
gekühlt haben, wird kein Fluss in den Hohlzylinder eindringen. Es fließt ein supraleitender
Abschirmstrom auf der äußeren Oberfläche des Hohlzylinders, der das angelegte Feld ab-
schirmt. Den interessanteren Fall erhalten wir, wenn wir erst das Feld anlegen und dann den
supraleitenden Hohlzylinder unter seine Sprungtemperatur abkühlen. In diesem Fall fließen
gegensinnige Abschirmströme (Ringströme) sowohl auf der inneren als auch der äußeren
Oberfläche des Hohlzylinders, die verhindern, dass Feld in die supraleitende Zylinderwand
eindringt.
Wir benutzen nun (13.3.48), um den im Zylinder eingeschlossenen magnetischen Fluss
zu bestimmen. Im klassischen Fall wären die fließenden Abschirmströme nur durch das
Ampèresche Gesetz bestimmt und wir könnten jeden beliebigen Flusswert im Zylinder
einfangen, indem wir das Abkühlfeld variieren. In einer exakten quantenmechanischen
Betrachtung müssen wir zusätzlich die Bedingung (13.3.48) für die Fluxoid-Quantisierung
erfüllen. Da die Dicke des supraleitenden Materials groß gegen λ L ist, können wir aber
einen geschlossenen Pfad wählen, der tief im Inneren des supraleitenden Materials liegt, wo
∫ b ⋅ ⧹︂
n dF = nΦ 0 . (13.3.49)
F
Wir sehen also, dass der im Hohlzylinder eingefangene magnetische Fluss in diesem Fall
exakt dem ganzzahligen Vielfachen eines Flussquants Φ 0 entspricht. Wir können in die-
sem Fall von Flussquantisierung sprechen. Die experimentelle Beobachtung der Flussquan-
tisierung durch Doll und Näbauer sowie Deaver und Fairbanks im Jahr 1961 (siehe Ab-
schnitt 13.3.2.3) belegte damit eindrucksvoll die Existenz einer makroskopischen Wellen-
funktion, mit der die Gesamtheit aller phasenstarr gekoppelten Cooper-Paare beschrieben
werden kann.
Einfangen von magnetischem Fluss: Wir diskutieren abschließend noch kurz die Frage,
wieso der supraleitende Hohlzylinder den magnetischen Fluss nach Abschalten des Magnet-
feldes in seinem Inneren gefangen hält und ihn nicht einfach ausstößt. Die Antwort darauf
gibt die 1. London-Gleichung, die besagt, dass das elektrische Feld im Inneren eines Supra-
leiters null sein muss, da dort ∂Js ⇑∂t = 0. Dies gilt auch für Situationen, in denen sich der
zirkulierende Suprastrom zeitlich ändert, da dieser nur in einer dünnen Oberflächenschicht
der Dicke λ L fließt (siehe Abb. 13.20). Mit E = −∂A⇑∂t − ∇ϕ und ∇ϕ = 0 erhalten wir
∂ ∂ ∂Φ
∮ E ⋅ dℓ = − ∮ A ⋅ dℓ = − ∫ b ⋅ ⧹︂
n dF = − , (13.3.50)
∂t ∂t ∂t
C C F
wobei Φ der Fluss durch die Fläche ist, die vom geschlossenen Integrationsweg C umschlos-
sen wird. Wählen wir den Integrationsweg weit im Inneren des Supraleiters, so gilt dort E = 0
und damit ∂Φ
∂t
= 0. Das heißt, dass der in dem Hohlzylinder eingefangene Fluss konstant sein
muss. Die supraleitenden Abschirmströme, die auf der Zylinderoberfläche fließen, passen
sich gerade so an, dass sich der im Zylinder eingeschlossene Fluss nicht ändert. Der einmal
beim Abkühlen unter die Sprungtemperatur eingefangene Fluss bleibt dort gefangen.92
In der London-Theorie sind wir aber immer von einem System ausgegangen, in dem die
Dichte der supraleitenden Elektronen räumlich konstant ist. Deshalb können Situationen, in
denen ganz offensichtlich eine solche Variation vorliegen muss, wie zum Beispiel an Ober-
flächen oder Grenzflächen zwischen Supraleitern und Normalleitern, nicht beschrieben
werden. Da mit dem räumlichen Gradienten einer Wellenfunktion immer eine kinetische
Energie verknüpft ist, wäre eine sprunghafte Änderung der Wellenfunktion an Grenz- und
Oberflächen mit einer sehr hohen Energie verbunden. Wir erwarten deshalb, dass sich die
Wellenfunktion in solchen Situationen kontinuierlich ändert und innerhalb einer charakte-
ristischen Längenskala von null auf den Gleichgewichtswert ansteigt. Im Jahr 1950 wurde
von Vitaly Lasarevich Ginzburg und Lev Davidovich Landau eine Theorie93 vorgeschla-
gen, mit der Situationen mit räumlich variierender Dichte der supraleitenden Elektronen
richtig beschrieben werden können. Anfangs erschien die Ginzburg-Landau (GL) Theorie
sehr phänomenologisch und ihre allgemeine Gültigkeit wurde kontrovers diskutiert. Dies
änderte sich, nachdem Lev Petrovich Gor’kov 1959 zeigte, dass die GL-Theorie für Tem-
peraturen nahe Tc einen rigoros ableitbaren Grenzfall der mikroskopischen BCS-Theorie
darstellt.94 , 95 Mit der GL-Theorie gelang es im Jahr 1957 Alexei Alexeyevich Abrikosov,
das Flussliniengitter in Typ-II Supraleitern vorherzusagen, was einen großen Erfolg der
GL-Theorie bedeutete.96 Da die vier russischen Wissenschaftler Ginzburg, Landau, Gor’kov
und Abrikosov die wesentlichen Beiträge zur Entwicklung dieser Theorie leisteten, be-
zeichnen wir sie heute meist als GLAG-Theorie.97 Die Vorhersagen der GLAG-Theorie
entsprechen für eine räumlich konstante Dichte der supraleitenden Elektronen denjenigen
des makroskopischen Quantenmodells der Supraleitung. Die GLAG-Theorie beinhaltet
aber kein skalares Potenzial und keinerlei Zeitabhängigkeiten. Sie kann deshalb z. B. nicht
zur Beschreibung des Josephson-Effekts herangezogen werden.
Die GLAG-Theorie stellt eine Weiterentwicklung der Landau-Theorie der Phasenübergänge
2. Ordnung dar,98 , 99 die wir bereits für die Beschreibung von Ferroelektrika und Ferroma-
gnetika verwendet haben (vergleiche hierzu Abschnitt 11.8.1). In der Landau-Theorie der
Phasenübergänge wird die räumlich homogene, geordnete Phase, die hier der supraleitenden
Phase entspricht, mit einem reellen Ordnungsparameter beschrieben, der im normalleiten-
den Bereich verschwindet und unterhalb Tc kontinuierlich auf einen Sättigungswert ansteigt.
Um auch Situationen behandeln zu können, in denen n s räumlich variiert, haben Ginzburg
und Landau einen komplexen, räumlich variierenden Ordnungsparameter eingeführt, der
93
V. L. Ginzburg, L. D. Landau, Toward the superconductivity theory, Zh. Eksperim. Teor. Fiz. 20, 1064
(1950).
94
L. P. Gor’kov, Microscopic Derivation of the Ginzburg-Landau Equations in Superconductivity, Zh.
Eksperim. Teor. Fiz. 36, 1918 (1959) [Sov. Phys. JETP 9, 1364 (1959)].
95
A. A. Abrikosov, L. P. Gor’kov, I. E. Dzyaloshinskii, in Quantum Field Theoretical Models in Statis-
tical Physics, Pergamon Press, London (1965).
96
A. A. Abrikosov, On the Magnetic Properties of Superconductors of the Second Group , Zh. Eksperim.
Teor. Fiz. 32, 1442-1452 (1957) [Sov. Phys. JETP 5, 1174-1182 (1957)].
97
Vitaly Lasarevich Ginzburg und Alexei Alexeyevich Abrikosov erhielten zusammen mit Anthony
James Leggett den Nobelpreis für Physik 2003 „für ihre bahnbrechenden Arbeiten zur Theorie der
Supraleitung und Supraflüssigkeiten“.
98
L. D. Landau, Phys. Z. Sowjet. 11, 545 (1937).
99
L. D. Landau, E. M. Lifshitz, Lehrbuch der theoretischen Physik, Band V, Akademieverlag, Berlin
(1987).
13.3 Phänomenologische Modelle 815
dagegen α negativ sein, da hier gs < gn sein muss (siehe Abb. 13.21). Wir setzen deshalb an:
T
α(T) = α ( − 1) ; α >0; β(T) = const . (13.3.52)
Tc
Aus der Gleichgewichtsbedingung ∂gs ⇑∂⋃︀Ψ⋃︀ = 0 erhalten wir β = −α⇑⋃︀Ψ0 ⋃︀2 und somit
α(T) α T
n s (T) = ⋃︀Ψ0 (T)⋃︀2 = − = (1 − ) . (13.3.53)
β β Tc
Hierbei ist Ψ0 (T) der Ordnungsparameter, der den räumlich homogenen Gleichgewichts-
zustand bei der Temperatur T beschreibt. Wir können nun noch den abstrakten Entwick-
lungskoeffizienten eine physikalische Bedeutung zuordnen, indem wir das thermodynami-
sche kritische Feld B cth über die Beziehung
1 B2
gs − gn = α⋃︀Ψ0 ⋃︀2 + β⋃︀Ψ0 ⋃︀4 = − cth (13.3.54)
2 2µ 0
α 2 (T) α2 T 2 T 2
B 2cth (T) = µ 0 = µ 0 (1 − ) = B 2c,GL (0) (1 − ) (13.3.55)
β β Tc Tc
bzw.
B 2cth (T) α2 T 2
gs − g n = − = − (1 − ) . (13.3.56)
2µ 0 2β Tc
die allerdings nur nahe bei Tc gelten. Wir haben bereits in Abschnitt 13.1.4.2 darauf
hingewiesen, dass die experimentell gemessene Temperaturabhängigkeit des thermody-
namisch kritischen Feldes gut durch B cth (T) = B cth (0) )︀1 − (T⇑Tc )2 ⌈︀ beschrieben wird
[vergleiche hierzu (13.1.10)]. Schreiben wir 1 − (T⇑Tc )2 als (︀1 − (T⇑Tc )⌋︀ ⋅ (︀1 + (T⇑Tc )⌋︀ ≃
2(︀1 − (T⇑Tc )⌋︀ für T ≃ Tc , so erhalten wir aber eine gute Übereinstimmung mit der obigen
Vorhersage der GLAG-Theorie, die ja nur nahe bei Tc gültig ist. Für B c,GL (0) müssen wir
dann aber B c,GL (0) = 2B cth (0) benutzen.
Ginzburg-Landau Theorie
13.3 Phänomenologische Modelle 817
4 4
(a) 𝜶>𝟎 (b) 𝜶<𝟎
gs - gn (bel. Einheiten)
gs - gn (bel. Einheiten)
3 3
𝑻 > 𝑻𝒄 𝑻 < 𝑻𝒄
2 2
1 1
𝑩𝟐𝐜𝐭𝐡 /𝟐𝝁𝟎
𝚿𝟎
0 0
-1 -1
-0.8 -0.4 0.0 0.4 0.8 -0.8 -0.4 0.0 0.4 0.8
|| (bel. Einheiten) || (bel. Einheiten)
Abb. 13.21: Differenz gs − gn der Dichten der freien Enthalpie eines räumlich homogenen Supraleiters
im supraleitenden und normalleitenden Zustand als Funktion der Amplitude des Ordnungsparame-
ters ⋃︀Ψ⋃︀ für (a) α > 0 und (b) α < 0. Für α > 0 ist im Gleichgewichtszustand ⋃︀Ψ⋃︀ = 0, für α < 0 liegt ein
Gleichgewichtszustand mit ⋃︀Ψ⋃︀ = ⋃︀Ψ0 ⋃︀ vor, bei dem gs − gn = −B 2cth ⇑2µ 0 . 136
Aus Gleichung (13.3.57) erkennen wir sofort die physikalische Bedeutung von α. Falls wir
⋃︀α⋃︀⇑β = ⋃︀Ψ0 ⋃︀2 mit der Dichte n s der supraleitenden Elektronen assoziieren, so ist α = (gs −
gn )⇑(n s ⇑2). Da gs − gn die Kondensationsenergiedichte ist, die der Supraleiter beim Über-
gang in den supraleitenden Zustand gewinnt, ist α⇑2 gerade etwa die pro Cooper-Paar ge-
wonnene Kondensationsenergie.
In Abb. 13.21 ist der Verlauf der freien Enthalpiedichte als Funktion des Ordnungsparame-
ters für α > 0 und α < 0 gezeigt. Es ist evident, dass die Bedingung α < 0 wesentlich ist, um
ein Minimum der freien Enthalpiedichte bei einem endlichen Wert des Ordnungsparame-
ters zu erhalten. Wir weisen ferner darauf hin, dass in Abb. 13.21 das Minimum der freien
Enthalpiedichte nur die Amplitude des Ordnungsparameters festlegt, die Phase aber nach
wie vor frei gewählt werden kann. Würden wir gs − gn über die komplexe Ebene auftragen,
würden wir ein rotationssymmetrisches Gebilde in Form eines mexikanischen Huts erhal-
ten.
(µ 0 M)2
(︁⌊︂⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ [︂⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ (︂
1 1
gs = gn + α⋃︀Ψ⋃︀2 + β⋃︀Ψ⋃︀4 + (Bext − b)
2
2 2µ 0
2
1 ħ
+ ⋀︀( ∇ − q s A) Ψ⋀︀ + . . . . (13.3.59)
2m s ı
Hierbei sind m s und q s die Masse und Ladung der supraleitenden Elektronen, d. h. m s = 2m
und q s = −2e für Cooper-Paare. Der erste Zusatzterm 2µ1 0 ⋃︀Bext − b⋃︀2 berücksichtigt die vom
Supraleiter zu leistende Feldverdrängungsarbeit, die proportional zur Differenz zwischen
818 13 Supraleitung
der vom äußerem Feld erzeugten Flussdichte Bext = µ 0 Hext und der inneren Flussdichte b =
µ 0 (Hext + M) ist.102 Bei perfekter Feldverdrängung ist b = 0 und die Enthalpiedichte gs des
Supraleiters erhöht sich um die Feldverdrängungsarbeit B2ext ⇑2µ 0 . Für eine räumlich inho-
mogene Situation bei der das Feld teilweise eindringt, kann dieser Beitrag von Ort zu Ort
verschieden sein und muss, um den Beitrag zur gesamten freien Enthalpie 𝒢s = ∫ gs dV des
betrachteten Supraleiters zu erhalten, über das Volumen integriert werden.
Der zweite Zusatzterm 2m1 s ⋃︀( ħı ∇ − q s A)Ψ⋃︀2 ist der Term niedrigster Ordnung in ∇Ψ, der
sowohl reell und eichinvariant ist. Er trägt möglichen räumlichen Variationen im Supraleiter
Rechnung. Diese können sowohl mit einem Gradienten der Amplitude als auch der Phase
des Ordnungsparameters verbunden sein. Benutzen wir Ψ = ⋃︀Ψ⋃︀e ı θ , so können wir den Term
in die anschaulichere Form
1
[︀ħ 2 (∇⋃︀Ψ⋃︀) + (ħ∇θ − q s A) ⋃︀Ψ⋃︀2 ⌉︀
2 2
(13.3.60)
2m s
umschreiben. Die beiden Terme ergeben Zusatzenergien, die mit einem Gradienten der Am-
plitude des Ordnungsparameters und mit dem eichinvarianten Phasengradienten verbun-
den sind. Der Ausdruck in den runden Klammern des zweiten Terms entspricht gerade m s vs ,
so dass dieser Term 12 m s v s2 ⋅ n s , also der kinetischen Energiedichte des aus einem eichinva-
rianten Phasengradienten resultierenden Suprastroms entspricht. Insgesamt verhindert der
Zusatzterm 2m1 s ⋃︀( ħı ∇ − q s A)Ψ⋃︀2 , dass starke räumliche Variationen des Ordnungsparame-
ters auf beliebig kleinen Längenskalen erfolgen können, da diese zu viel Energie kosten wür-
den. Der Term führt also zu einer gewissen Steifigkeit des Ordnungsparameters Ψ.
Um den Ordnungsparameter Ψ0 (r) im Gleichgewichtszustand zu erhalten, müssen wir die
freie Enthalpiedichte über das gesamte Volumen des Supraleiters aufintegrieren und durch
Variation von Ψ und A minimieren. Hierzu betrachten wir zuerst das Integral über den letz-
ten Term in (13.3.59):
2
1 ∗ ħ ıħ ∗ ħ
∫ Ψ ( ∇ − q s A) ΨdV + ∫ ]︀Ψ ( ∇ − q s A) Ψ{︀ ⋅ dS . (13.3.61)
2m s ı 2m s ı
V S
Hierbei ist das zweite Integral das Oberflächenintegral, das einen eventuellen Energiefluss
durch die Oberfläche berücksichtigt. Beim Durchführen der Variationsrechnung müssen
geeignete Randbedingungen angenommen werden. Diese müssen zum Beispiel beinhalten,
dass kein Strom aus dem Supraleiter heraus oder in ihn hineinfließen darf, d. h. dass die
Stromdichte senkrecht zur Probenoberfläche verschwinden muss. Dies wird z. B. durch die
Randbedingung
ħ
( ∇ − q s A) Ψ⨄︀ = 0 (13.3.62)
ı n
gewährleistet. Mit dieser Randbedingung verschwindet auch der Energiefluss durch die
Oberfläche, so dass das Oberflächenintegral in (13.3.61) null wird. Die Randbedingung
besagt auch, dass mit der Oberfläche des Supraleiters keine Energie verbunden ist. Dies hat
102
Wir verwenden hier wiederum b für die Flussdichte auf mikroskopischer Skala und B für ihren
makroskopischen Mittelwert.
13.3 Phänomenologische Modelle 819
z. B. zur Folge, dass ohne Magnetfeld die Dichte n s (r) ihren vollen Wert bis zur Oberfläche
des Supraleiters behält. Deshalb sollte ein sehr dünner Film die gleiche Sprungtemperatur
haben wie Massivmaterial, was sehr gut mit den experimentellen Befunden übereinstimmt.
Bei Supraleiter/Normalleiter-Grenzflächen muss diese Randbedingung modifiziert werden,
indem die rechte Seite durch ıbħ Ψ ersetzt wird, da jetzt ja Strom über die Grenzfläche fließen
kann. Die charakteristische Längenskala b wird als Extrapolationslänge bezeichnet.103
Wir können nun formal
∂𝒢s ∂𝒢s
δ𝒢s = ( ) δΨ + ( ∗ ) δΨ∗ (13.3.63)
∂Ψ Ψ∗ ∂Ψ Ψ
schreiben, wobei wir Ψ und Ψ∗ so behandeln, als ob sie unabhängige Variablen sind. Be-
schränken wir uns nun auf den interessierenden Fall, dass Ψ∗ und δΨ∗ die komplex konju-
gierten Größen von Ψ und δΨ sind, so finden wir, dass auch (∂𝒢s ⇑∂Ψ)Ψ∗ und (∂𝒢s ⇑∂Ψ∗ )Ψ
ein komplex konjugiertes Paar sind, da ja δ𝒢s reell sein muss. Minimieren wir nun 𝒢s in
Bezug auf Variationen δΨ, δΨ∗ beliebiger Phase, so erhalten wir, dass der Real- und Ima-
ginärteil von ∂𝒢s ⇑∂Ψ∗ (oder von ∂𝒢s ⇑∂Ψ) verschwinden müssen. Mit dieser Bedingung
und (13.3.61) erhalten wir unter Benutzung der Randbedingung (13.3.62) die Beziehung
2
1 ħ
δ𝒢s = ∫ dV {⌊︀(αΨ + βΨ∗ Ψ 2 + ( ∇ − q s A) ) Ψ}︀ δΨ∗ + c.c.(︀ = 0 .
2m s ı
V
(13.3.64)
Da dies für alle δΨ∗ , δΨ erfüllt sein muss, muss der Ausdruck in rechteckigen Klammern
verschwinden. Aus dieser Forderung ergibt sich die 1. Ginzburg-Landau Gleichung:
2
1 ħ
0= ( ∇ − q s A) Ψ + αΨ + β⋃︀Ψ⋃︀2 Ψ . (13.3.65)
2m s ı
Wir müssen die freie Enthalpie 𝒢s auch in Bezug auf Änderungen des Vektorpotenzials mi-
nimieren. Hierzu betrachten wir
δgs = gs (r, t, A + δA) − gs (r, t, A)
1
= ((︀∇ × (A + δA)⌋︀2 − (︀∇ × A⌋︀2 )
2µ 0
1 ħ ħ
+ (]︀ ∇ − q s (A + δA){︀ Ψ) (]︀− ∇ − q s (A + δA){︀ Ψ∗ )
2m s ı ı
1 ħ ħ
− (]︀ ∇ − q s A{︀ Ψ) (]︀− ∇ − q s A{︀ Ψ∗ )
2m s ı ı
qs ħ ∗ ħ
=− ( Ψ ∇Ψ − Ψ∇Ψ∗ + 2q s ⋃︀Ψ⋃︀2 A) δA
ms ı ı
1
+ (∇ × δA)(∇ × A) . (13.3.66)
µ0
103
P. G. de Gennes, Superconductivity of Metals and Alloys, Benjamin, New York (1966).
820 13 Supraleitung
Wir müssen nun δgs über das Volumen des Supraleiters integrieren. Das Integral des letzten
Terms in (13.3.66) ergibt hierbei
1 1
∫ dV (∇ × δA)(∇ × A) = ∫ dV ∇ A ⋅ δA .
2
(13.3.67)
µ0 µ0
V V
Da dies für alle δA erfüllt sein muss, muss der Ausdruck in den geschweiften Klammern
verschwinden. Mit Hilfe der London-Eichung ∇ ⋅ A = 0 erhalten wir aus der Maxwell-Glei-
chung ∇ × b = µ 0 Js folgenden Ausdruck für die Suprastromdichte:
1 1 1 1
Js = ∇×b= ∇×∇×A= )︀∇(∇ ⋅ A) − ∇2 A⌈︀ = − ∇2 A . (13.3.69)
µ0 µ0 µ0 µ0
1
Mit diesen Ausdruck können wir µ0
∇2 A in (13.3.68) durch Js ersetzen und erhalten so die
2. Ginzburg-Landau Gleichung:
qs ħ qs 2 2
Js = (Ψ∗ ∇Ψ − Ψ∇Ψ∗ ) − ⋃︀Ψ⋃︀ A . (13.3.70)
2m s ı ms
Es lässt sich leicht zeigen, dass die GL-Gleichungen invariant unter der Eichtransformation
(vergleiche hierzu Abschnitt 13.3.2.2)
∂χ qs
A′ → A + ∇χ , ϕ′ → ϕ − , θ′ → θ + χ (13.3.71)
∂t ħ
sind. Offensichtlich liegt eine kontinuierliche Eichsymmetrie ψ ′ (r, t) → ψ(r, t)e ı(q s ⇑ħ) χ vor,
die durch eine spezielle Wahl der beliebigen Phase spontan gebrochen wird. Eine konti-
nuierliche Eichsymmetrie impliziert üblicherweise das Vorliegen einer Goldstone-Mode,
deren Frequenz für große Wellenlängen gegen null geht. In dem hier betrachteten Fall ist
dies sofort einsichtig, da ja für große Wellenlängen Phasengradienten verschwindend klein
werden. Dadurch gehen die Rückstellkräfte für Oszillationen der suprafluiden Dichte und
somit deren Frequenz gegen null. Für eine geladene Supraflüssigkeit müssen wir allerdings
berücksichtigen, dass Fluktuationen der Ladungsdichte der langreichweitigen Coulomb-
Wechselwirkung unterliegen. Deshalb wird die Goldstone-Mode zur Plasma-Frequenz des
Elektronengases, also zu sehr hohen Frequenzen verschoben.
zeigen, dass diese Tatsache auch in den GL-Gleichungen enthalten ist. Wir werden ferner se-
hen, dass mit den GL-Gleichungen eine weitere charakteristische Längenskala verknüpft ist,
die Ginzburg-Landau Kohärenzlänge ξ GL . Diese gibt an, auf welcher Längenskala räumliche
Variationen von Ψ erfolgen können.
Wir diskutieren zunächst die 2. GL-Gleichung (13.3.70). Diese entspricht offensichtlich dem
Ausdruck (13.3.20), den wir bereits oben mit dem makroskopischen Quantenmodell der Su-
praleitung für die Suprastromdichte abgeleitet haben. Machen wir für den GL-Ordnungpa-
rameter denselben Ansatz Ψ(r) = Ψ0 (r) exp(︀ıθ(r)⌋︀, so erhalten wir in vollkommener Ana-
logie zu (13.3.20) für ⋃︀Ψ0 (r)⋃︀2 = const für die Suprastromdichte den Ausdruck
α ħ qs
Js = q s { ∇θ(r) − A(r) , (13.3.72)
β ms ms
aus dem wir wiederum, wie wir in Abschnitt 13.3.2 gezeigt haben, die 1. und 2. Londonsche
Gleichung ableiten können. Das heißt, für eine räumlich konstante Dichte der supraleiten-
den Elektronen können wir aus der GLAG-Theorie die Londonsche Theorie ableiten. Die
charakteristische Längenskala für Änderungen der magnetischen Flussdichte ist die Ginz-
burg-Landau-Eindringtiefe λ GL
⟨
λ GL (0) ⧸︂ m s β
λ GL (T) = ⌉︂ λ GL (0) = ⧸︂
⟩ . (13.3.73)
1 − TTc µ 0 αq 2s
Der Ausdruck für λ GL (0) entspricht dem aus der London-Theorie abgeleiteten Ergebnis
(13.3.6), wenn wir formal ⋃︀Ψ0 (0)⋃︀2 = β⇑α = n s (0) setzen würden. Allerdings erhalten wir
dann Übereinstimmung für T = 0, was nicht sinnvoll ist, da die GLAG-Theorie ja nur nahe
bei Tc gültig ist. Für Temperaturen weit weg von Tc müssten wir Terme höherer Ordnung
in der Reihenentwicklung (13.3.59) berücksichtigen, da der Ordnungsparameter dann nicht
mehr als klein angenommen werden kann. Die experimentell gemessene Temperaturabhän-
gigkeit der Londonschen Eindringtiefe kann gut mit der empirischen Abhängigkeit (Gorter-
Casimir-Modell104 ).
λ L (0)
λ L (T) = {︂ (13.3.74)
4
1 − ( TTc )
beschrieben werden. Schreiben wir 1 − (T⇑Tc )4 als (︀1 − (T⇑Tc )2 ⌋︀ ⋅ (︀1 + (T⇑Tc )2 ⌋︀ ≃ 2(︀1 −
(T⇑Tc )2 ⌋︀ für T ≃ Tc und wenden diese Näherung nochmals für (︀1 − (T⇑Tc )2 ⌋︀ an, so erhal-
ten wir in der Nähe von Tc die von der GLAG-Theorie vorhergesagte Temperaturabhängig-
keit, müssen dann aber λ GL (0) = λ L (0)⇑2 verwenden.
Wir betrachten jetzt die 1. GL-Gleichung und normieren diese zunächst auf Ψ0 . Mit ψ =
Ψ⇑⋃︀Ψ0 ⋃︀ und ⋃︀Ψ0 ⋃︀2 = −α⇑β erhalten wir
2
1 ħ
( ∇ − q s A) ψ + αψ − α⋃︀ψ⋃︀2 ψ = 0 . (13.3.75)
2m s ı
104
C. J. Gorter, H. B. G. Casimir, On Superconductivity I, Physica 1, 306 (1934); Physik. Z. 35, 963
(1934); Z. Physik 15, 539 (1934).
822 13 Supraleitung
ħ2 1 qs 2
( ∇ − A) ψ + ψ − ⋃︀ψ⋃︀2 ψ = 0 . (13.3.76)
2m s α ı ħ
Die Größe
}︂
ξ GL (0) ħ2
ξ GL (T) = ⌉︂ ξ GL (0) = . (13.3.77)
1 − TTc 2m s α
2
hat dabei die Dimension einer Länge, da 2mħ s α ∇2 ψ dimensionslos sein muss, und stellt offen-
sichtlich die zweite charakteristische Längenskala in der GLAG-Theorie dar. Wir bezeichnen
sie als Ginzburg-Landau Kohärenzlänge ξ GL . Die 1. GL-Gleichung lässt sich mit dieser Län-
genskala wie folgt ausdrücken:
∇ qs 2
−ξ GL
2
( − A) ψ + ψ − ⋃︀ψ⋃︀2 ψ = 0 (13.3.78)
ı ħ
Die Bedeutung von ξ GL wird sofort deutlich, wenn wir eine feldfreie Situation betrachten,
bei der ψ klein ist (z. B. nahe bei Tc ), so dass wir den ⋃︀ψ⋃︀2 ψ Term vernachlässigen können.
Gleichung (13.3.78) vereinfacht sich dann zu ∇2 ψ = ψ⇑ξ GL 2
. Diese Differentialgleichung be-
sagt, dass jede lokal induzierte Störung von ψ exponentiell mit der charakteristischen Län-
genskala ξ GL abklingt, wenn wir uns vom Ort der Störung wegbewegen. Wir können auch
kleine Abweichungen δψ von einem ortsunabhängigen Gleichgewichtswert ψ 0 betrachten.
Wir sehen dann, dass diese Abweichungen exponentiell auf der Längenskala ξ GL abklingen.
Mit der Temperaturabhängigkeit (13.3.57) von α erhalten wir folgende Ausdrücke für die
Temperaturabhängigkeiten der beiden charakteristischen Längenskalen der GLAG-Theorie:
λ GL (0)
λ GL (T) = ⌉︂ (13.3.79)
1 − TTc
ξ GL (0)
ξ GL (T) = ⌉︂ . (13.3.80)
1 − TTc
Beide Längenskalen divergieren für T → Tc . Die Werte für einige Supraleiter bei T = 0 sind
in Tabelle 13.1 aufgelistet.
Das Verhältnis der beiden charakteristischen Längenskalen λ L (T) und ξ GL bezeichnet man
als Ginzburg-Landau Parameter κ. Mit (13.3.74) und (13.3.77) erhalten wir
⟨ ⟨
λ GL ⧸︂ ⧸︂ β 1
= ⧸︂ ⧸︂
2β
κ≡ ⟩ 2m s
= ⟩ . (13.3.81)
ξ GL µ 0 ħ 2 q 2s 2µ 0 µ B
Hierbei ist µ B = eħ⇑2m das Bohrsche Magneton. Der GL-Parameter ist nahe bei Tc in erster
Näherung unabhängig von der Temperatur, da β üblicherweise nur eine geringe Tempe-
raturabhängigkeit aufweist. Wir können in (13.3.81) β mit Hilfe von (13.3.56) durch B cth
ausdrücken. Einsetzen und Auflösen nach B cth ergibt
Φ0
B cth (T) = ⌋︂ , (13.3.82)
2π 2ξ GL (T)λ L (T)
Wir wollen zum Abschluss noch diskutieren, welcher Zusammenhang zwischen der GL-
Kohärenzlänge ξ GL und der später in Abschnitt 13.5 diskutierten BCS-Kohärenzlänge ξ 0 be-
steht. Wir werden sehen, dass wir durch die BCS-Paarwechselwirkung eine mittlere Energie-
absenkung pro Elektronenpaar von 14 D(E F )∆2 (0)⇑(N⇑2) = 3∆2 (0)⇑4E F erhalten [verglei-
che hierzu (13.5.83)]. Hierbei haben wir das freie Elektronengasergebnis E F = 3N⇑2D(E F )
105
P. G. de Gennes, Superconductivity in Metals and Alloys, Benjamin, New York (1966).
106
B. Mühlschlegel, Die thermodynamischen Funktionen des Supraleiters, Z. Phys. 155, 313 (1959).
824 13 Supraleitung
verwendet. Das heißt, wir erhalten eine mittlere Kondensationsenergie pro Elektronenpaar
von 3∆2 (0)⇑4E F . Falls wir α⇑β = ⋃︀Ψ0 ⋃︀2 mit der Paardichte n s ⇑2 assoziieren, entspricht in der
GLAG-Theorie gerade der Parameter −α der mittleren Kondensationsenergie pro Elektro-
nenpaar. Entsprechend (13.3.77) erhalten wir dann
⟨ ⟨
⧸︂ 4ħ 2 E F ⧸︂ ħ 2 v 2
⧸︂
⟩ = ⧸︂
⟩ ħv F
ξ0 = F
= ⌋︂ . (13.3.85)
6m s ∆ (0)
2 3∆2 (0) 3∆(0)
Diese einfache Abschätzung stimmt mit dem exakten BCS-Ergebnis ξ 0 = ħv F ⇑π∆(0) bis auf
einen Faktor der Größenordnung eins überein.
13.3.3.4 Supraleiter-Normalleiter-Grenzfläche
Um die Bedeutung der GL-Kohärenzlänge zu diskutieren, betrachten wir einen Supraleiter,
der sich im gesamten Halbraum x > 0 erstreckt. Wir nehmen ferner an, dass ψ(x = 0) = 0
und kein Magnetfeld angelegt ist, d. h. A = 0. Gleichung (13.3.78) vereinfacht sich dann zu
d 2ψ
2
ξ GL + ψ − ψ3 = 0 . (13.3.86)
dx 2
Mit den Randbedingungen ψ(x = 0) = 0, ψ(x → ∞) = 1 und limx→∞ dψ⇑dx = 0 erhalten
wir die Lösung
x
ψ(x) = tanh ( ⌋︂ )
2ξ GL
(13.3.87)
n s (x) x
∝ ⋃︀ψ(x)⋃︀2 = tanh2 ( ⌋︂ ),
n s (∞) 2ξ GL
die in Abb. 13.22 grafisch dargestellt ist. Wir sehen, dass ⋃︀ψ(x)⋃︀2 zunächst kontinuierlich an-
steigt und dann gegen den Sättigungswert ⋃︀ψ⋃︀2 = 1 läuft. Die Breite der Anstiegszone wird
1.0
𝟐
𝝍 𝒙
0.8 𝝃𝐆𝐋
|, Bz(x)/Bext
0.6
Abb. 13.22: Verlauf des Absolut-
quadrats des normierten Ordnungs- 0.4
N 𝝀𝐋
S
parameters ψ(x) = Ψ(x)⇑Ψ0 an einer
Normalleiter-Supraleiter-Grenzfläche. 0.2
Der Supraleiter erstreckt sich im Halb- 𝑩𝒛 𝒙
raum x ≥ 0. Es wurde ξ GL = 2λ L ange-
nommen. Zum Vergleich ist das Ab- 0.0
klingen eines in z-Richtung angelegten 0 2 4 6
äußeren Magnetfeldes B ext gezeigt. x / L
142
13.4 Typ-I und Typ-II Supraleiter 825
durch die GL-Kohärenzlänge ξ GL bestimmt. Zum Vergleich ist das Abklingen eines in z-
Richtung angelegten äußeren Magnetfeldes B ext im Inneren des Supraleiters gezeigt. Insge-
samt ist das Verhalten des Supraleiters durch die beiden charakteristischen Längenskalen ξ GL
und λ L gegeben.
Wir weisen darauf hin, dass die oben gemachte Annahme ψ(x = 0) = 0 nur eine grobe Ver-
einfachung ist. Wie wir im Zusammenhang mit (13.3.62) diskutiert haben, verschwindet der
Ordnungsparameter des Supraleiters an einer Normallleiter/Supraleiter-Grenzfläche nicht,
sondern extrapoliert im Normalleiter linear auf der charakteristischen Längenskala b ge-
gen null. Der Ordnungsparameter an der Grenzfläche ist also endlich. Ursache dafür ist der
so genannte Proximity-Effekt,107 auf den wir hier nicht eingehen werden. Die physikalische
Ursache für den Proximity-Effekt ist, dass durch den Kontakt mit dem Supraleiter im Nor-
malleiter ein endlicher Ordnungsparameter induziert wird, da die supraleitenden Elektro-
nen in den Normalleiter diffundieren können. Unsere Annahme ψ(x = 0) = 0 bzw. b = 0 ist
gleichbedeutend damit, dass wir den Proximity-Effekt vernachlässigen.108
107
P. G. de Gennes, Superconductivity of Metals and Alloys, Benjamin, New York (1966).
108
Eine genaue Diskussion erfordert ferner, dass wir bei der Berechnung von ψ(x) die räumliche Va-
riation der Flussdichte B z (x), und umgekehrt bei der Berechnung von B z (x) die räumliche Varia-
tion des Ordnungsparameters ψ(x) berücksichtigen. Die Diskussion wird dann etwas schwieriger,
das Verhalten von B z (x) und ψ(x) bleibt aber qualitativ gleich.
826 13 Supraleitung
B 2cth (T)
= gn (T) − gs (T) . (13.4.1)
2µ 0
Für Typ-I Supraleiter ist das obere kritische Feld B c2 , bei dem die Supraleitung zusammen-
bricht gerade B cth . Da andererseits die beim Übergang in den supraleitenden Zustand ge-
wonnene Kondensationsenergie gn − gs gleich der maximalen Magnetfeldverdrängungsar-
B
beit ∫0 c2 MdB ext ist, erhalten wir
B cth B c2
B 2cth (T)
= gn (T) − gs (T) = ∫ M ⋅ dBext = ∫ M ⋅ dBext . (13.4.2)
2µ 0
0 0
)︁⌊︂⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ]︂⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂)︂ )︁⌊︂⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ]︂⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂)︂
Typ-I Typ-II
Wir sehen also, dass das thermodynamische kritische Feld sowohl für Typ-I als auch Typ-II
Supraleiter durch die Fläche unter der in Abb. 13.23b gezeigten Magnetisierungskurve
Typ-I
bestimmt wird, und Typ-II
deren Größe Supraleiter
wiederum durch die Kondensationsenergie bestimmt ist.
Aus (13.4.2) folgt dann sofort, dass für Typ-I und Typ-II Supraleiter mit der gleichen Kon-
densationsenergie die Fläche unter der Magnetisierungskurve gleich sein muss, das heißt,
dass die in Abb. 13.23b grau hinterlegten Flächen gleich sein müssen.
(a) (b)
−𝝁𝟎 𝑴
𝑩𝒊
Typ II Supraleiter
Typ II Supraleiter
Abb. 13.23: Schematische Darstellung (a) der magnetischen Flussdichte im Inneren eines Typ-II Su-
praleiters und (b) der Magnetisierung als Funktion des von außen angelegten Magnetfeldes. Zum Ver-
gleich ist das Verhalten eines Typ-I Supraleiters gezeigt. Die Meißner-Phase tritt nur für µ 0 H ext < B c1
auf, für B c1 ≤ µ 0 H ext ≤ B c2 liegt der Mischzustand vor. Die beiden grau hinterlegten Flächen sind gleich
groß.
13.4 Typ-I und Typ-II Supraleiter 827
B 2 (T)
2
B 2ext V B2 B ext
∆E B ≃ − = − ext λ L = − cth ( ) λL (13.4.3)
2µ 0 F 2µ 0 2µ 0 B cth (T)
reduziert, was zu einer Absenkung der Gesamtenergie führt. Hierbei haben wir V ≈ F ⋅ λ L
verwendet. Andererseits zeigt Abb. 13.22, dass die Dichte der supraleitenden Elektronen in
einer Grenzflächenschicht der Dicke ξ GL reduziert ist. Der damit verbundene Verlust an
Kondensationsenergie pro Flächeneinheit, der zu einer Erhöhung der Gesamtenergie führt,
ist gegeben durch
V B 2cth (T)
∆E C ≃ (︀gn (T) − gs (T)⌋︀ = ξ GL , (13.4.4)
F 2µ 0
wobei wir V ≈ F ⋅ ξ GL verwendet haben. Bei dieser einfachen Abschätzung haben wir der
Einfachheit halber angenommen, dass B ext bis zu λ L voll eindringt und dann sprungartig
auf null abnimmt. Gleichfalls haben wir angenommen, dass n s bis zur Tiefe ξ GL null ist und
dann sprungartig auf den Gleichgewichtswert ansteigt. Wir können damit die Grenzflächen-
energie zu
)︀ [︀
B 2cth (T) ⌉︀ ⌉︀
2
⌉︀ B ext ⌉︀
∆E grenz = ∆E C + ∆E B ≃ ⌋︀ ξ GL − ( ) λ L ⌈︀ (13.4.5)
2µ 0 ⌉︀⌉︀ B cth (T) ⌉︀
⌉︀
]︀ ⌊︀
abschätzen. Der genaue Verlauf der Grenzflächenenergiebeiträge pro Längeneinheit, was
Energiedichten entspricht, ist gegeben durch
−x⇑λ L 2
b 2 (x)⇑2µ 0 )︀B ext (0)e ⌈︀
є B (x) = − 2 =− (13.4.6)
B cth ⇑2µ 0 B 2cth
Hierbei haben wir die durch (13.3.7) und (13.3.87) gegebenen Verläufe von B ext (x)
und n s (x) benutzt und jeweils auf B 2cth ⇑2µ 0 normiert. In Abb. 13.24 sind є B (x) und є C (x)
für B ext = B cth zusammen mit der resultierenden Grenzflächenenergiedichte є grenz = є B + є C
gezeigt.
828 13 Supraleitung
1.0
𝝐𝐂
N S
0.5 𝝐𝐠𝐫𝐞𝐧𝐳 𝝃𝐆𝐋
-0.5
𝝐𝐁
-1.0
-1 0 1 2 3 4 5
x / L
146
Aus (13.4.5) folgt, dass für ξ GL > λ L die Grenzflächenenergie immer positiv ist und deshalb
die Ausbildung einer Grenzfläche die Gesamtenergie erhöhen würde. Dies ist bei Typ-I Su-
praleitern der Fall. Ist dagegen ξ GL < λ L , so wird die Grenzflächenenergie bereits für B ext <
B cth negativ und es ist energetisch günstiger, NS-Grenzflächen auszubilden. Genau dies pas-
siert im Mischzustand von Typ-II Supraleitern. Hier dringt das Magnetfeld teilweise in den
Supraleiter ein, wodurch normalleitende und supraleitende Bereiche entstehen. Die damit
verbundenen Grenzflächen führen zu einer Energieabsenkung. Wir sehen, dass ein Kriteri-
um für die Unterscheidung von Typ-I und Typ-II Supraleitern das Verhältnis λ L ⇑ξ GL , also
der Ginzburg-Landau-Parameter κ ist.
Die exakte Berechnung der Grenzflächenenergie erfordert eine numerische Lösung der GL-
Gleichungen. Die genaue Grenze zwischen Typ-I und Typ-II Supraleiter liegt bei (vergleiche
Abschnitt 13.4.4)
1
κ ≤ ⌋︂ Typ-I Supraleiter
2
(13.4.8)
1
κ ≥ ⌋︂ Typ-II Supraleiter
2
⌋︂
Die Vorhersage des Übergangs von positiver zu negativer Grenzflächenenergie bei κ = 1⇑ 2
wurde bereits in der ursprünglichen Arbeit von Ginzburg und ⌋︂ Landau gemacht. Sie wiesen
darauf hin, dass der Mischzustand von Supraleitern bei κ = 1⇑ 2 wohl seine Struktur ändern
würde. Allerdings erkannte erst Abrikosov109 in seiner bahnbrechenden Arbeit das radikal
109
A. A. Abrikosov, Zh. Eksperim. Teor. Fiz. 32, 1442 (1957) [Sov. Phys. JETP 5, 1174 (1957)].
13.4 Typ-I und Typ-II Supraleiter 829
⌋︂
andere Verhalten von Supraleitern mit κ > 1⇑ 2, denen er den Namen Typ-II Supraleiter
gab. Aufgrund der negativen Grenzflächenenergie kann der Typ-II Supraleiter seine Energie
absenken, indem er viele kleine, flussdurchsetzte „normalleitende“ Bereiche bildet. Je fei-
ner die Aufteilung, desto größer die Grenzfläche und der damit verbundene Energiegewinn.
Eine untere Grenze wird nur durch die Flussquantisierung gesetzt. Wir bezeichnen die li-
nienhaften, flussdurchsetzten Bereiche parallel zum angelegten Magnetfeld als Flusslinien
oder Flusswirbel. Sie stellen Knotenlinien des Ordnungsparameters Ψ dar, die von supra-
leitenden Abschirmströmen umflossen werden. Die räumliche Anordnung der Flusslinien
sowie den radialen Verlauf des Ordnungsparameters und der Flussdichte in diesen Gebilden
werden wir erst später in Abschnitt 13.4.6 und 13.4.7 diskutieren.
Hext
Hlok = . (13.4.10)
1−N
Wir sehen also, dass bei einem nicht verschwindenden Entmagnetisierungsfaktor das lokale
Feld wesentlich größer als das äußere Feld werden kann.
𝚽 durch Äquatorialebene
110
Bei der Diskussion des Diamagnetismus in Kapitel 12 haben wir Entmagnetisierungseffekte immer
vernachlässigt. Dies war gerechtfertigt, da ⋃︀χ⋃︀ ≪ 1 und damit die Korrektur χHext zum externen
Feld vernachlässigt werden konnte. Bei Supraleitern können wir dies wegen χ = −1 nicht mehr
tun.
148
830 13 Supraleitung
Diese Gleichung ist identisch mit der Schrödinger-Gleichung eines freien geladenen Teil-
chens im Magnetfeld (vergleiche hierzu (9.10.3) in Abschnitt 9.10). Die Lösung des Problems
ist deshalb formal identisch mit der Bestimmung der quantisierten Niveaus eines geladenen
Teilchens in einem Magnetfeld, die auf die Landau-Niveaus führt. Da das effektive Potenzial
nur von x abhängt, besitzt (13.4.12) Lösungen der Form
ħ2 ∂2 u 1 ̃
− + m s ω 2c (x − x 0 ) u(x) = Eu(x)
2
(13.4.14)
2m s ∂x 2 2
ħ2 2 ħ2
Ẽ = −α −
1
kz = ( 2 − k z2 ) . (13.4.15)
2m s 2m s ξ GL
Die Lösung von (13.4.14) können wir sofort angeben, da es sich bei dieser Gleichung um
nichts anderes als die Schrödinger-Gleichung eines Teilchens der Masse m s handelt, das in
einem harmonischen Potenzial mit der Federkonstante
m s q 2s B 2z 1 2πħB z 2
K = m s ω 2c = = ( ) (13.4.16)
m 2s ms Φ0
1 ħq s B z 1
є n = ħω c (n + ) = (n + ) . (13.4.17)
2 ms 2
̃ Gleichsetzen und Auflösen
Nach (13.4.14) entsprechen diese Energieeigenwerte gerade E.
nach B z liefert
ħ 1 1 −1
Bz = ( 2 − k z2 ) (n + ) . (13.4.18)
2q s ξ GL 2
Den höchstmöglichen Wert erhalten wir für k z = 0 und n = 0. Er entspricht dem oberen
kritischen Feld B c2 und ist gegeben durch
ħ Φ0
B c2 = 2
= 2
. (13.4.19)
q s ξ GL 2πξ GL
Mit Hilfe von (13.3.81) und (13.3.82) können wir B c2 als Funktion des GL-Parameters κ und
des thermodynamischen kritischen Feldes B cth ausdrücken und erhalten
⌋︂
B c2 = 2 κB cth . (13.4.20)
832 13 Supraleitung
Wir können ferner durch Einsetzen leicht zeigen, dass die zugehörige Eigenfunktion u(x)
gegeben ist durch
(x − x 0 )2
u(x) = exp ⌊︀− 2
}︀ . (13.4.21)
2ξ GL
⌋︂ ⌋︂
Wir sehen, dass B c2 > B cth für κ > 1⇑ 2. Für κ < 1⇑ 2 ist dagegen B c2 < B cth , das heißt, hier
ist das größtmögliche Feld bereits durch B cth gegeben, wie wir es von Typ-I Supraleitern
kennen. Wir können deshalb Typ-I (κ ≤ ⌋︂12 ) und Typ-II Supraleiter (κ ≥ ⌋︂12 ) hinsichtlich
der Größe des GL-Parameter κ unterscheiden [vergleiche (13.4.8)].
gelten.114 Führen wir die Integration durch und lösen nach B c1 auf, so erhalten wir
Φ0
B c1 = . (13.4.23)
2πλ 2L
Da in dieser Abschätzung ⋃︀ψ(r)⋃︀2 = n s (r) = const angenommen wurde, wird das erhaltene
Ergebnis auch London-Näherung genannt. Wir sehen, dass das untere kritische Feld dadurch
festgelegt wird, dass der Flussinhalt eines flussdurchsetzten Bereichs nicht beliebig klein sein
darf, sondern mindestens ein Flussquant betragen muss.
Bei einer genauen Berechnung von B c1 in Rahmen der GL-Theorie wird die räumliche Varia-
tion des Ordnungsparameters berücksichtigt, was auf das exakte Ergebnis [vergleiche hier-
zu (13.4.52)]
Φ0 1
B c1 = 2
(ln κ + 0.08) = ⌋︂ (ln κ + 0.08)B cth (13.4.24)
4πλ L 2κ
113
Eine ausführliche Herleitung wird z. B. in Fundamentals of the Theory of Metals, A. A. Abrikosov,
North-Holland, Amsterdam (1988) gegeben.
114
Die Integration müsste eigentlich über das Probenvolumen erfolgen. Da aber λ L üblicherweise sehr
viel kleiner als die Probenabmessung ist und die Exponentialfunktion für große r schnell abfällt,
können wir von 0 bis ∞ integrieren.
13.4 Typ-I und Typ-II Supraleiter 833
120
In (4 at% Bi)
90
𝑩𝒄𝟐
Bc (mT)
Shubnikov-Phase
60 Abb. 13.26: Temperaturverlauf des unteren
und des oberen kritischen Feldes sowie des
𝑩𝐜𝐭𝐡 daraus berechneten thermodynamischen
30 kritischen Feldes einer InBi-Legierung
(In mit 4 at % Bi). Die durchgezogenen
Meißner-Phase 𝑩𝒄𝟏 Linien geben den empirischen 1 − (T⇑Tc )2
0 Temperaturverlauf wieder (nach T. Kinsel,
0 1 2 3 4 E. A. Lynton, B. Serin, Rev. Mod. Phys. 36,
T (K) 105 (1964)).
154
führt. Die Beziehungen (13.4.24) und (13.4.19) zeigen, dass wir durch Messung des unteren
und oberen kritischen Feldes die GL-Kohärenzlänge und die Londonschen Eindringtiefe be-
stimmen können. Der Ausdruck (13.4.19) für das obere kritische Feld ist leicht einsichtig.
Da sich der Ordnungsparameter nicht schneller als auf der Längenskala ξ GL ändern kann,
2
können wir die kleinste Fläche eines normalleitenden Bereiches zu πξ GL abschätzen. Der
Flussinhalt dieser Fläche beträgt wegen der Flussquantisierung gerade ein Flussquant, wor-
aus sich sofort (13.4.19) ergibt. Mit B c2 ∼ κB cth und B c1 ∼ B cth ⇑κ folgt B c1 ∼ B c2 ⇑κ 2 ∼ Φ 0 ⇑λ 2L .
Abb. 13.26 zeigt den gemessenen Temperaturverlauf des unteren und oberen, sowie des dar-
aus berechneten thermodynamischen kritischen Feldes einer InBi-Legierung. Alle drei kriti-
schen Felder weisen in der Nähe der kritischen Temperatur einen ähnlichen Temperaturver-
lauf auf, der gut mit einer 1 − (T⇑Tc )2 Abhängigkeit beschrieben werden kann. In Abb. 13.27
sind die oberen kritischen Felder einiger Hochfeldsupraleiter gezeigt.
Wir haben oben erwähnt, dass sowohl die Londonsche Eindringtiefe als auch die GL-Kohä-
renzlänge von der mittleren freien Weglänge ℓ abhängen [vergleiche (13.3.83) und (13.3.84)],
wobei λ L mit abnehmendem ℓ zu- und ξ GL abnimmt. Wir können deshalb einen Typ-I Su-
praleiter leicht in einen Typ-II Supraleiter umwandeln, indem wir ihn gezielt verunreinigen.
50
PbMo5.1S6
40
Bc2 (T)
30
Nb3(Al0.7Ge0.3)
20
Nb3Sn
Tabelle 13.2: Ginzburg-Landau Parameter κ∞ , Londonsche Eindringtiefe λ L und kritische Felder B cth
bzw. B c2 einiger supraleitender Elemente und Verbindungen (aus Springer Handbook of Condensed
Matter and Materials Data, W. Martienssen und H. Warlimont (Eds.), Springer, Berlin (2005)).
Element Al In Nb Pb Sn Ta Tl V
Tc [K] 1.19 3.408 9.25 7.196 3.722 4.47 2.38 5.46
B cth [mT] 10.49 28.15 206 80.34 30.55 82.9 17.65 140
λ L (0) [nm] 50 40–65 32–45 40 50 35 40
κ∞ 0.03 0.06 ∼ 0.8 0.4 0.1 0.35 0.3 0.85
Verbindung NbTi Nb3 Sn NbN PbIn PbIn Nb3 Ge V3 Si YBa2 Cu3 O7
(2–30%) (2–50%) (ab-Ebene)
Tc [K] ≃ 10 ≃ 18 ≃ 16 ≃7 ≃ 8.3 23 16 92
B c2 [T] ≃ 10–13 ≃ 23–29 ≃ 15 ≃ 0.1–0.4 ≃ 0.1–0.2 38 20–23 160±25
λ L (0) [nm] ≃ 300 ≃ 80 ≃ 200 ≃ 150 ≃ 200 90 60 ≃ 140 ± 10
κ∞ ≃ 75 ≃ 20–25 ≃ 40 ≃ 5–15 ≃ 8–16 30 20 ≃ 100 ± 20
Verunreinigen wir z. B. den Typ-I Supraleiter In mit Bi, so erfolgt bei etwa 1.5 Atom-% Bi
ein Übergang zu einem Typ-II Supraleiter. Ähnliches gilt für die Verunreinigung des Typ-I
Supraleiters Pb mit In. Von Gor’kov und Goodman wurde ein empirischer Zusammenhang
zwischen dem GL-Parameter κ und der mittleren freien Weglänge ℓ angegeben, der die ex-
perimentellen Ergebnisse gut beschreibt:
0.72λ L (0) ⌈︂
κ(ℓ) ≃ κ∞ + ≃ κ∞ + 7.5 × 104 ρ(︀Ωm⌋︀ γ(︀J⇑m3 K2 ⌋︀ . (13.4.25)
ℓ
Hierbei ist γ der Sommerfeld-Koeffizient und κ∞ = κ(ℓ → ∞). Für die Berechnung von κ(ℓ)
müssen wir κ∞ kennen. Diese Größe erhalten wir durch Extrapolation der gemessenen κ(ℓ)
von Legierungen auf die Fremdatomkonzentration null. Die κ∞ -Werte einiger Supraleiter
sind in Tabelle 13.2 angegeben.
wählen, dass x 0 , die Position des Minimums der potenziellen Energie, gerade um etwa ξ GL
von der Oberfläche entfernt im Innern des Supraleiters zu liegen kommt. Damit die Randbe-
dingung ∂Ψ⇑∂x = 0 an der Oberfläche x = 0 erfüllt wird, muss Ψ(x) offensichtlich eine sym-
metrische Funktion sein. Das dazugehörige symmetrische Potenzial erhalten wir dadurch,
dass wir dem Potenzial bei x = x 0 im Supraleiter ein Spiegelpotenzial bei x = −x 0 außerhalb
des Supraleiters hinzufügen. Die neue Oberflächeneigenfunktion hat dann einen niedrige-
ren Eigenwert als solche weit im Inneren des Supraleiter, da sie zu einem Potenzial gehört,
dass niedriger ist und flacher verläuft als die einfachen Parabeln.
können. Die Lösungen (13.4.27) beschreiben die quantisierte Kreisbewegung der supralei-
tenden Elektronen in der Ebene senkrecht zum Magnetfeld. Die Quantisierung gewährleis-
tet, dass die von der Kreisbewegung umschlossene Fläche immer ein ganzzahliges Vielfaches
eines Flussquants enthält. Nur so sind stationäre Lösungen möglich.
Gleichung (13.4.27) stellt eine spezielle Lösung des Problems dar. Die allgemeine Lösung
besitzt die Form
(x − x m )2
ψ L = ∑ C m ψ m = ∑ C m exp(ıβ m y) exp (− 2
). (13.4.31)
m m 2ξ GL
Diese Lösung ist periodisch in y. Die Periodizität in x-Richtung setzt voraus, dass C m−N =
C m für festes N. Die Lösung für N = 1, die von Abrikosov117 anfangs berechnet wurde, ent-
spricht einem Quadratgitter. Diese Lösung hat aber für freie Elektronen nicht die niedrigste
Energie, sondern die Lösung für N = 2, die einem Dreiecksgitter entspricht. Der Energie-
unterschied zwischen einem Quadrat- und einem Dreiecksgitter liegt nur bei etwa 1.7%,
so dass der Einfluss der speziellen Kristallsymmetrie von manchen Supraleitern dazu führt,
dass diese nicht ein Dreiecksgitter, sondern ein quadratisches Flussliniengitter bevorzugen.
Dieser kleine Unterschied (und das Fehlen numerischer Rechenverfahren) erklärt auch, dass
Abrikosov anfangs vorhersagte, dass ein quadratisches Gitter den stabilsten Zustand bil-
det. Die Tatsache, dass ein Dreiecksgitter den stabilsten Zustand bildet, können wir an-
hand der bei der Diskussion von Kristallgittern verwendeten Argumente verstehen. Das
in Abb. 13.28b gezeigte Dreiecksgitter ist eine dicht gepackte Struktur, bei der jede Fluss-
linie von einem Hexagon von weiteren Flusslinien umgeben ist. Die Fläche der primitiven
Gitterzelle beträgt F▲ = 1.5a▲2
tan 30○ = 0.866a▲2
. Setzen wir diese Fläche gleich Φ 0 ⇑B, also
⌈︂
gleich der Fläche, die ein Flussquant bei der angelegten Flussdichte B einnimmt, ⌈︂so erhalten
wir a▲ = 1.075 Φ 0 ⇑B. Beim in Abb. 13.28a gezeigten Quadratgitter ist a∎ = Φ 0 ⇑B. Das
heißt, der Abstand benachbarter Flusslinien im Dreicksgitter ist a▲ = 1.075a∎ . Aufgrund
der abstoßenden Wechselwirkung der einzelnen Flusslinien, die wir als kleine Stabmagnete
betrachten können, ist das Gitter mit dem größtmöglichen Abstand, also das Dreiecksgitter,
energetisch am günstigsten.
(a) (b)
Wir erhalten in einem Typ-II Supraleiter im Mischzustand also eine periodische Anordnung 159
(a) (b)
𝝁𝟎 𝑯𝐞𝐱𝐭
ns , B / Bc1
1.2 𝒏𝒔 𝒓
0.8
0.4
0.0
200 nm -4 -2 0 2 4
r / L
160
Abb. 13.29: (a) Schematische Darstellung des Flussliniengitters in einem Typ-II Supraleiter. Für ei-
ne einzelne Flusslinie sind exemplarisch der Flusslinienverlauf und die ringförmigen Abschirmströme
skizziert. (b) Konturlinien von n s = ⋃︀ψ⋃︀2 in einem Abrikosov-Dreiecksgitter. (c) Mit einem Rastertun-
nelmikroskop gewonnene Abbildung eines für B ext = 1 T erhaltenen Flussliniengitters in einem NbSe2 -
Einkristall (nach H. F. Hess et al., Phys. Rev. Lett. 62, 214 (1989), © (2012) American Physical Society).
(d) Radialer Verlauf von n s (r) und B(r)⇑B c1 in einer isolierten Flusslinie (nach E. H. Brandt, Phys.
Rev. Lett. 78, 2208 (1997)).
Anordung, die in Abb. 13.29a und b schematisch gezeigt ist, nennt man Abrikosov-Gitter.
Das Magnetfeld durchdringt die Probe in normalleitenden Kanälen, die wir als Flusslinien
oder Flusswirbel bezeichnen. Letztere Bezeichnung rührt daher, dass um den Kern der
Flusslinie ein wirbelartiger Abschirmstrom fließt. Das Flussliniengitter kann durch Deko-
ration mit feinen Eisenkolloidteilchen und anschließender Abbildung dieser Teilchen mit
einem Elektronenmikroskop sichtbar gemacht werden.118 , 119 Heute werden auch Neutro-
nenstreuung, magnetooptische Verfahren oder Rastertunnelmikroskie verwendet (siehe
Abb. 13.29c). Der Kontrast beim Rastertunnelmikroskop basiert auf der unterschiedlichen
Zustandsdichte am Fermi-Niveau zwischen dem normalleitenden Kern der Flusslinie und
der supraleitenden Umgebung. In Abb. 13.29d ist ein Schnitt durch eine isolierte Flusslinie
gezeigt. Die magnetische Flussdichte ist im Zentrum der Flussline maximal und fällt mit
der Londonschen Eindringtiefe in radialer Richtung in etwa exponentiell ab. Die Dichte n s
der supraleitenden Elektronen ist im Zentrum der Flusslinie null und steigt dann innerhalb
der GL-Kohärenzlänge in radialer Richtung auf ihren Gleichgewichtswert an.
118
U. Essmann, H. Träuble, The direct observation of individual flux lines in type II superconductors,
Phys. Lett. 24 A, 526 (1967).
119
U. Essmann, Intermediate state of superconducting niobium, Phys. Lett. 41 A, 477 (1972).
838 13 Supraleitung
Dieser Ansatz berücksichtigt die axiale Symmetrie und die Tatsache, dass die Phase von ψ
um 2π variiert, wenn wir uns einmal um den Kern der Flusslinie herumbewegen. Setzen
wir diesen Ansatz in die nichtlineare 1. GL-Gleichung (13.3.65) ein, so erhalten wir eine
Bestimmungsgleichung für den radialen Verlauf f (r) des Ordnungsparameters. Es zeigt sich
[vergleiche hierzu (13.3.87)], dass f (r) in sehr guter Näherung durch121
r
f (r) = tanh (c ) (13.4.33)
ξ GL
beschrieben werden kann, wobei c ≃ 1 eine Konstante ist. Das heißt, dass der Ordnungspa-
rameter innerhalb der Länge ξ GL fast auf seinen vollen Wert ansteigt.
120
Wir benutzen b für die lokale Flussdichte und B für den makroskopischen mittleren Wert der
Flussdichte.
121
Introduction to Superconductivity, M. Tinkham, McGraw-Hill, New York (1975).
13.4 Typ-I und Typ-II Supraleiter 839
| , bz / Bext
| , bz / Bc1
1.2
0.5
0.8
2
2
0.4
0.0 0.0
-4 -3 -2 -1 0 1 2 3 4 -0.4 -0.3 -0.2 -0.1 0.0 0.1 0.2 0.3 0.4
r / L r / L
Abb. 13.30: (a) Verlauf der normierten Flussdichte b(r)⇑B c1 und des Absolutquadrats des Ordnungs-
parameters ⋃︀ψ(r)⋃︀2 = ⋃︀Ψ⇑Ψ0 ⋃︀2 = n s (r) entlang eines Schnitts durch das Zentrum einer einzelnen Fluss-
linie. (b) Verlauf der normierten Flussdichte b(r)⇑B ext und des Absolutquadrats des Ordnungsparame-
ters ⋃︀ψ(r)⋃︀2 entlang einer periodischen Anordnung von Flusslinien für B ext ≃ 0.6B c2 . Für die Rechnung
wurde jeweils λ L = 10ξ GL angenommen.
Term Φ 0 δ 2 (r) ergänzen, welcher der Präsenz des Vortexkerns Rechnung trägt:122 , 123 , 124
∇ × (ΛJs ) + b = ⧹︂
zΦ 0 δ 2 (r) . (13.4.34)
Hierbei ist δ 2 (r) eine zweidimensionale Delta-Funktion und ⧹︂ z der Einheitsvektor parallel
zur Flusslinie. Aus der Maxwell-Gleichung ∇ × b = −µ 0 Js folgt b = −(Λ⇑µ 0 ) ∇ × ∇ × b. Ver-
wenden wir ferner rot rot = grad div − ∇2 und div b = 0, erhalten wir
b Φ0
∇2 b − = − 2 ⧹︂
zδ 2 (r) . (13.4.35)
λ 2L λL
Hierbei ist 𝒦0 die modifizierte Bessel-Funktion nullter Ordnung. Für r⇑λ L ≫ 1 kann
die Bessel-Funktion durch r −1⇑2 exp(−r⇑λ L ) angenähert werden. Für r⇑λ L → 0 erhalten
wir mit ln(λ L ⇑r) eine logarithmische Divergenz, die allerdings in Wirklichkeit bei r ≃ ξ
abgeschnitten wird, da hier der Ordnungsparameter abnimmt.
Der radiale Verlauf von b(r) und ⋃︀ψ(r)⋃︀2 ist in Abb. 13.30a für eine einzelne, isolierte Fluss-
linie gezeigt. Er stellt einen Schnitt durch das Zentrum einer Flusslinie dar. Da λ L ≫ ξ GL ,
ist der Vortexkern im Vergleich zur Flussdichteverteilung sehr schmal und kann, wie oben
gemacht, in erster Näherung durch eine δ-Funktion angenähert werden. Wir weisen aber
122
A. A. Abrikosov, Zh. Eksperim. Teor. Fiz. 32, 1141 (1957).
123
A. A. Abrikosov, Sov. Phys. JETP 5, 1174 (1957).
124
Dieser Ansatz wurde zuerst von Abrikosov gemacht und war anfänglich umstritten. So ist bekannt,
dass Landau den Ansatz zunächst abgelehnt hat, als Abrikosov diesen ihm vorstellte. Dies führte
zu einer mehrjährigen Verzögerung der Publikation von Abrikosov’s Theorie.
840 13 Supraleitung
darauf hin, dass der in Abb. 13.30a gezeigte Verlauf von b(r) nur für κ ≫ 1 eine gute Nä-
herung ist, da wir nur in diesem Fall den Einbruch des Ordnungsparameters bei r = 0 gut
durch eine δ-Funktion annähern können. Für kleinere κ-Werte wird die b(r)-Kurve breiter,
wie es in Abb. 13.29 gezeigt ist. In Abb. 13.30b ist der Verlauf von b(r) und ⋃︀ψ(r)⋃︀2 entlang ei-
ner periodischen Anordnung von Vortices für ein externes Feld nahe dem oberen kritischen
Feld gezeigt. Da der Abstand der Vortices klein gegen λ L ist, überlappen sich die Flussdichte-
verteilungen der einzelnen Vortices stark, so dass die räumliche Variation der resultierenden
Flussdichteverteilung nur noch gering ist. Die Modulation von ⋃︀ψ(r)⋃︀2 ist dagegen noch be-
trächtlich, da der Abstand der Vortices bei dem gewählten externen Feld immer noch 2ξ GL
beträgt.
wir diesen in einen Bereich R ≫ λ L legen können, wo die mit der Flusslinie verbundene
Stromdichte verschwindend klein ist. Es bleibt also nur der Beitrag für den inneren Umfang
mit Radius R ≃ ξ GL . Da b parallel zur Flusslinie ist, gilt ⋃︀∇ × b⋃︀ = −db⇑dr und wir erhalten
λ 2L −db
єL = ]︀b 2πr{︀ . (13.4.41)
2µ 0 dr ξ GL
Φ20 B2
єL = 2
ln κ = cth 4πξ GL
2
ln κ . (13.4.44)
4πµ 0 λ L 2µ 0
⌋︂
Hierbei haben wir B cth = Φ 0 ⇑2π 2ξ GL λ L benutzt. Wir sehen, dass die Linienenergie um den
Faktor 4 ln κ größer ist als die Kondensationsenergie (B 2cth ⇑2µ 0 )πξ GL
2
, die im Vortexkern mit
Fläche πξ GL verloren geht. Falls also κ ≫ 1, ist es nicht relevant, ob wir die verlorene Kon-
2
Der erste Term auf der rechten Seite stellt gerade die Linienenergie von zwei nicht wechsel-
wirkenden Flusslinien und der zweite ihre Wechselwirkungsenergie
Φ0 Φ20 r 12
W12 = b 1 (r2 ) = 𝒦0 ( ) (13.4.48)
µ0 2πµ 0 λ 2L λL
dar. Diese ist positiv (abstoßend) für den Fall, dass der Fluss der beiden Flusslinien in die
gleiche Richtung zeigt.
Da die freien Enthalpien für den Meißner-Zustand und den Zustand mit einer eingedrun-
genen Flusslinie für B ext = B c1 gleich sein müssen, folgt mit (13.4.45)
µ0є L Φ0
B c1 = = (ln κ + 0.08) , (13.4.52)
Φ0 4πλ 2L
was dem bereits oben ohne Herleitung angegebenen Ausdruck (13.4.24) entspricht.
125
Es gilt 𝒢 = 𝒰 − T S + pV − mB ext [vergleiche hierzu (G.4.1) in Anhang G]. Im Meißner-Zustand
ist m = −B ext V ⇑µ 0 und damit −mB ext = µV0 B 2ext . Durch das Eindringen einer Flusslinie bei B ext =
B c1 wird dieser Beitrag um µ10 B c1 ∫ bdV reduziert.
126
Diese Annahme ist nicht unbedingt notwendig. Wir hätten auch n Flusslinien eindringen lassen
können, wodurch wir nє L für die Linienenergie und ∫ b(r) ⋅ dF = nΦ 0 für den eingedrungenen
Fluss erhalten hätten.
13.4 Typ-I und Typ-II Supraleiter 843
Bean-Livingston Barriere: Wenn eine Flusslinie nahe an der Oberfläche eines Supralei-
ter erzeugt wird, wirken auf sie zwei entgegengesetzt gerichtete Kräfte. Die Abschirmströme
erzeugen eine Lorentz-Kraft senkrecht zur Oberfläche. Gehen wir von der in Abb. 13.15 ge-
zeigten Geometrie aus, so erhalten wir mit (13.3.8) für die Lorentz-Kraft pro Längeneinheit
H ext −x⇑λ L
f x,L = Φ 0 J s, y = Φ 0 e . (13.4.53)
λL
Die zweite Kraft ist die Bildkraft, welche die Flusslinie zur Oberfläche zieht. Sie resultiert aus
der anziehenden Wechselwirkungsenergie pro Längeneinheit [vergleiche hierzu (13.4.48)]
Φ 0 b(r) Φ20 2x
WB = − =− 2
𝒦0 ( ) (13.4.54)
µ0 2πµ 0 λ L λL
einer Flusslinie mit Abstand x von der Oberfläche und ihres Bildes im Abstand −x vor der
Oberfläche. Für die modifizierte Besselfunktion 2. Art gilt d𝒦0 (x)⇑dx = −𝒦1 (x), so dass
wir für die Bildkraft pro Längeneinheit
Φ20 2x
f x,B = − 𝒦 ( )
3 1
(13.4.55)
2πµ 0 λ L λL
erhalten. Wir vergleichen nun die beiden Kräfte für x = ξ GL , da dies der geringste Abstand
von der Oberfläche ist, den wir im Rahmen des Vortex-Modells realisieren können. Das
nach C. P. Bean und J. D. Livingston benannte Bean-Livingston Feld127 erhalten wir gerade
aus der Bedingung, dass die Summe der beiden Kräfte verschwindet:
Φ0 2ξ GL −ξ GL ⇑λ L
B BL = 𝒦1 ( )e . (13.4.56)
2πλ 2L λL
Für ξ GL ⇑λ L ≪ 1 können wir 𝒦1 (x) ≃ 1⇑x und ex ≃ 1 verwenden, wodurch wir die für
große κ gültige Näherung
Φ0 B cth
B BL = = ⌋︂ (13.4.57)
4πξ GL λ L 2
erhalten. Für Typ-II Supraleiter mit κ ≫ 1 ist das Bean-Livingston Feld wesentlich größer
als B c1 . Es stellt eine Oberflächenbarriere dar, die verhindert, dass Flusslinien in den Supra-
leiter bereits bei B c1 eindringen und hat dadurch eine wichtige praktische Bedeutung. Um
die Oberflächenbarriere aber voll ausnutzen zu können, müssen die betroffenen Oberflächen
auf der Längenskala λ L glatt sein.
I c = B c 2πR⇑µ 0 . (13.4.59)
Diese Gleichung sieht zunächst anders aus als (13.4.58). Allerdings müssen wir für einen
richtigen Vergleich die Stromdichte J c = I c ⇑A eff bestimmen. Da der Strom nur in einer Ober-
flächenschicht der Breite λ L fließt, ist A eff = 2πRλ L und wir erhalten wiederum das Er-
gebnis (13.4.59) für die kritische Stromdichte. Unsere Überlegung zeigt, dass der kritische
Strom I c in einem Typ-I Supraleiter wegen der kleinen effektiven Fläche sehr gering sein
kann. Ein Al-Zylinder mit R = 0.5 mm hätte nur einen kritischen Strom von etwa 30 A. Ei-
ne wesentliche Verbesserung könnten wir erzielen, indem wir den einen Zylinder in viele
dünne Filamente mit Radius R ≃ λ L aufteilen würden. Dies entspricht der Verwendung von
dünnen Filamenten in Hochfrequenzkabeln, da hier der Strom aufgrund des Skin-Effekts
auch in Normalleitern nur an der Oberfläche fließt.
128
Die Maxwell-Gleichung lautet in Zylinderkoordinaten
1 ∂ ∂b r
⌊︀ (rb φ ) − }︀ = µ 0 J s,z .
r ∂r ∂φ
Da für die betrachtete Konfiguration ∂b r ⇑∂φ = 0 gilt, erhalten wir
b φ (r) ∂b φ (r)
⌊︀ + }︀ = µ 0 J s,z .
r ∂r
Für R ≫ λ L beträgt der erste Term in der eckigen Klammer b φ ⇑R auf der Zylinderoberfläche und
ist deshalb viel kleiner als der zweite Term, der etwa b φ ⇑λ L beträgt. Vernachlässigen wir den ersten
Term vollkommen, erhalten wir die Differentialgleichung
∂b φ (r)
= µ 0 J s,z
∂r
mit der Lösung b φ (R − r) = b surface
φ e−(R−r)⇑λ L für die Randbedingung b φ (0) = b surface
φ .
13.4 Typ-I und Typ-II Supraleiter 845
Der Verlauf von ⋃︀ψ⋃︀2 (v s ) ist in Abb. 13.31 dargestellt. Da α ja die pro Cooper-Paar gewonnene
Kondensationsenergie ist, sehen wir, dass die Abnahme von ⋃︀ψ⋃︀2 mit v s gerade proportional
zum Verhältnis der kinetischen Energie und der Kondensationsenergie der supraleitenden
Elektronen ist. Durch die zusätzliche kinetische Energie der sich bewegenden Elektronen
nimmt der Ordnungsparameter ab.
Aus (13.4.62) ergibt sich für die Stromdichte Js die Beziehung (siehe Abb. 13.31)
m 2s ξ GL
2
v s2
Js = q s ⋃︀Ψ⋃︀2 vs = q s ⋃︀Ψ0 ⋃︀2 (1 − 2
) vs . (13.4.63)
ħ
Den Maximalwert der Stromdichte, die kritische Stromdichte J cGL des Drahtes, erhalten wir
aus ∂J s ⇑∂v s = 0 zu
2 ħq s Φ0
J cGL = ⌋︂ ⋃︀Ψ0 ⋃︀2 = ⌋︂ . (13.4.64)
m ξ
3 3 s GL 3 3πµ 0 λ 2L (T)ξ GL (T)
846 13 Supraleitung
1.0
0.8
| , Js / Jc
0.6
2
0.4
Hierbei haben wir Φ 0 = h⇑q s und λ 2L (T) = m s ⇑µ 0 ⋃︀Ψ0 ⋃︀2 q 2s verwendet. Nahe Tc erwarten wir
mit den Temperaturabhängigkeiten (13.3.79) und (13.3.80) dann J cGL ∝ (1 − T⇑Tc )3⇑2 , was
gut mit den experimentellen Befunden übereinstimmt. Mit Hilfe von Gleichung (13.3.82)
können wir J cGL auch durch das thermodynamische kritische Feld ausdrücken:
⌋︂
2 2 B cth B cth
J cGL = ⌋︂ = 0.544 . (13.4.65)
3 3 µ0 λL µ0 λL
Wir sehen, dass J cGL nur etwa halb so groß wie die nach der London-Theorie erwartete kriti-
sche Stromdichte B cth ⇑µ 0 λ L ist. Dies liegt daran, dass die London-Theorie die Abnahme der
Amplitude des Ordnungsparameters mit zunehmender Stromdichte nicht berücksichtigt.
BCS kritische Stromdichte: Schätzen wir die kritische Stromdichte eines dünnen Drahtes
mit Hilfe der BCS-Theorie ab, so müssen wir die kinetische Energie aufgrund des Trans-
portstromes mit der Energie vergleichen, die durch Bildung der Cooper-Paare gewonnen
wird. Beim Erreichen der kritischen Stromdichte wird die kinetische Energie so groß,
dass Cooper-Paare aufgebrochen werden können und damit die Supraleitung zerstört
wird. Wir nennen die damit verbundene Stromdichte deshalb die paarbrechende kritische
Stromdichte.
Wie wir später sehen werden [vergleiche Abschnitt 13.5.2 und (13.5.83)], erhalten wir durch
die Bildung der Cooper-Paare eine mittlere Energieabsenkung um 14 D(E F )∆2 , wobei D(E F )
die Zustandsdichte für beide Spinrichtungen und ∆ die BCS-Energielücke ist. Da diese mitt-
lere Energieabsenkung der Kondensationsenergie B 2cth ⇑2µ 0 in der GL-Theorie
⌈︂ entspricht,
können wir das thermodynamische kritische Feld formal als B cth = µ 0 D(E F )∆2 ⇑2V
schreiben. Benutzen wir den GL-Ausdruck J c = 0.544B cth ⇑µ 0 λ L , können wir die BCS
kritische Stromdichte zu
∆ ⌈︂
J cBCS = 0.544 D(E F )⇑2µ 0 V (13.4.66)
λL
angeben.
13.5 Mikroskopische Theorie 847
Wir wollen noch darauf hinweisen, dass in der Praxis die mit obigen Formeln abgeschätz-
ten kritischen Stromdichtewerte meist nicht erreicht werden. Dafür gibt es mehrere Gründe.
Neben Materialdefekten wie Korngrenzen (diese spielen vor allem bei den Kuprat-Supralei-
tern eine wichtige Rolle)129 , 130 , 131 reduziert vor allem das Eindringen und die Bewegung von
Flusslinien die kritische Stromdichte beträchtlich (vergleiche hierzu Abschnitt 13.7).
129
P. Chaudhari, J. Mannhart, D. Dimos, C. C. Tsuei, J. Chi, M. M. Oprysko, and M. Scheuermann,
Direct measurement of the superconducting properties of single grain boundaries in YBa2 Cu3 O7−δ ,
Phys. Rev. Lett. 60, 1653 (1988).
130
R. Gross, P. Chaudhari, A. Gupta, G. Koren, Thermally Activated Phase Slippage in High-Tc Grain
Boundary Josephson Junctions, Phys. Rev. Lett. 64, 228 (1990).
131
R. Gross, B. Mayer, Transport Processes and Noise in YBa2 Cu3 O7−δ Grain Boundary Junctions, Phy-
sica C 180, 235 (1991).
132
L. N. Cooper, Bound Electron Pairs in a Degenerate Fermi Gas, Phys. Rev 104, 1189–1190 (1956).
848 13 Supraleitung
𝒌𝟏 + 𝒒, 𝝈𝟏
𝒌𝟐 − 𝒒, 𝝈𝟐
𝒌𝟏 , 𝝈𝟏
Abb. 13.32: Feynman-Diagramm des Beitrags zur Elek- 𝒌𝟐 , 𝝈𝟐
tron-Elektron-Wechselwirkung durch Austausch ei-
nes virtuellen Phonons oder anderen Austauschbosons.
Sn
0.580
0.575
log (Tc / K)
133
J. Bardeen, L. N. Cooper, J. R. Schrieffer, Microscopic Theory of Superconductivity, Phys. Rev. 106,
162–164 (1957).
134
J. Bardeen, L. N. Cooper, J. R. Schrieffer, Theory of Superconductivity, Phys. Rev. 108, 1175 (1957).
135
C. A. Reynolds, B. Serin, W. H. Wright, L. B. Nesbitt, Superconductivity of Isotopes of Mercury, Phys.
Rev. 78, 487 (1950).
136
E. Maxwell, Isotope Effect in the Superconductivity of Mercury, Phys. Rev. 78, 477 (1950).
13.5 Mikroskopische Theorie 849
Austauschbosons spielt aber in der BCS-Theorie keine Rolle. Neben Phononen kommen an-
dere bosonische Anregungen in Festkörpern wie z. B. Magnonen, Polaronen, Plasmonen etc.
in Frage. Während wir heute wissen, dass in den klassischen metallischen Supraleitern Pho-
nonen für die attraktive Wechselwirkung verantwortlich sind, vermitteln diese Wechselwir-
kung in suprafluidem 3 He und vermutlich auch in den supraleitenden Kupraten Spinfluk-
tuationen.
die über das Kristallgitter vermittelt wird. Ausgehend von dieser Wechselwirkung schlugen
dann im Jahr 1957 Bardeen, Cooper und Schrieffer die BCS-Theorie vor, die eine Vielzahl
von experimentellen Befunden quantitativ auf einer mikroskopischen Basis erklären konnte.
Es stellt sich natürlich sofort die Frage, wie das Matrixelement V (k1 , k2 , q) für die Streu-
ung eines Elektrons mit Wellenvektor k1 nach k1′ = k1 + q unter simultaner Streuung eines
zweiten Elektrons von k2 nach k2′ = k2 − q aussieht. Das Ergebnis ist für die reine Coulomb-
Wechselwirkung gut bekannt:
e2
V (q) = . (13.5.1)
є0 q2
Das Matrixelement ist positiv, was wir für die abstoßende Wechselwirkung von gleich-
namigen Ladungen erwarten. In einem Medium müssen wir zusätzlich die dielektri-
sche Funktion є(q, ω) berücksichtigen, die sowohl vom Streuvektor q als auch der Fre-
quenz ω = (︀E(k′ ) − E(k)⌋︀⇑ħ abhängt. Das Matrixelement lässt sich damit schreiben als
e2
V (ω, q) = . (13.5.2)
є(q, ω)є 0 q 2
Eine frequenz- und impulsabhängige dielektrische Funktion є(q, ω) ist notwendig, da sich
das erste Elektron, während es von k1 nach k1′ gestreut wird, in einem Mischzustand befin-
det.144 Dieser enthält eine oszillierende Ladungsverteilung, die durch ω und q charakterisiert
wird. Wir sehen, dass das Medium die reine Coulomb-Wechselwirkung reduziert, indem die
nackten Ladungen abgeschirmt werden. Es ist jedoch schwierig zu sehen, wie das Medium
das Vorzeichen der Wechselwirkung ändern kann, um eine attraktive Wechselwirkung zu
erzeugen. Offenbar können wir einen solchen Vorzeichenwechsel dadurch erhalten, indem
wir є(q, ω) negativ machen. Dies ist in der Tat möglich, wie wir bereits in Abschnitt 11.7.3 bei
der Diskussion der Abschirmung von Gitterschwingungen in Metallen detailliert diskutiert
haben. Aus der dort abgeleiteten Gleichung (11.7.70) können wir z. B. die Wechselwirkungs-
energie zu
e2 e2 ⎛ ̃ 2 (q) ⎞
Ω
V (ω, q) = = +
p
1 (13.5.3)
є(q, ω)є 0 q 2 є 0 (k s + q ) ⎝
2 2
ω −Ω
2 ̃ 2p (q) ⎠
einem Metall aufgefasst werden. Falls die Energiedifferenz der wechselwirkenden Elek-
̃ p (q), wird der Nenner in (13.5.3)
tronen klein genug ist, d. h. falls (E k − E k′ )⇑ħ = ω < Ω
negativ.
Um eine erste Idee für die gittervermittelte attraktive Elektron-Elektron-Wechselwirkung
zu geben, wird häufig ein statisches Modell verwendet. In diesem Modell führt ein Elektron
zu einer elastischen Verzerrung des Gitters, indem es die es umgebenden positiv geladenen
144
Wir weisen darauf hin, dass є(q, ω) komplex ist und das effektive Matrixelement für die Wech-
selwirkung durch Austausch virtueller Phononen durch den Realteil von (13.5.2) gegeben ist. Der
Imaginärteil ist mit der Streuung an realen Phononen verknüpft.
13.5 Mikroskopische Theorie
+ +
+ + + + + +
- Elektron 1
+ +
Elektron 2
+
- +
+ + + +
+
Abb. 13.34: Reaktion der positiven Ionenrümpfe in einem Metall auf die negative Ladung eines Elek-
trons. (a) Zum Zeitpunkt t = 0 zieht das Elektron die positiven Ionen Richtung Zentrum. (b) Für 0 <
t < τ hat sich das Elektron bereits weiterbewegt, die positive Raumladung bleibt allerdings zurück, da
die Ionen nur langsam reagieren können. (c) Für t ≤ τ ist ein zweites Elektron im Zentrum angekom-
men und erfährt eine Energieabsenkung aufgrund der vorhandenen positiven Raumladung. Insgesamt
erhalten wir eine attraktive Elektron-Elektron Wechselwirkung.
Atomrümpfe anzieht. Für ein zweites Elektron stellt diese positive Ladungsanhäufung eine
Potenzialmulde dar. Es wird deshalb angezogen.145 Dieses sehr einfache Bild ist allerdings mit
Vorsicht zu genießen, da es suggeriert, dass eine Paarung im Ortsraum stattfindet und dass
die Paare, wenn sie einmal gebildet sind, zeitlich stabil bleiben (wie z. B. ein Wasserstoffmo-
lekül). Dies entspricht aber nicht der Realität. Vielmehr findet eine Paarung im Impulsraum
statt und die mittlere Lebensdauer eines Cooper-Paares ist sehr kurz.
Eine bessere Vorstellung können wir gewinnen, wenn wir zu einem dynamischen Modell
übergehen. Dabei gehen wir davon aus, dass die Elektronen bei ihrer Bewegung durch das
Kristallgitter dieses verzerren, da sie die positiven Ionenrümpfe beim Vorbeiflug anziehen
(siehe Abb. 13.34a). Dadurch bildet sich in ihrer Spur eine positive Ladungswolke, die ihrer-
seits wiederum Elektronen anziehen kann. Das Entscheidende ist nun, dass diese positive
Ladungswolke nicht instantan, sondern nur innerhalb einer Zeitskala τ = 1⇑ω q relaxieren
kann, wobei ω q die Frequenz der Gitterschwingung ist. Das Elektron gibt einem positiven
Ion beim Vorbeiflug nämlich einen Kraftstoß in Richtung der Elektronenbahn, wodurch das
Ion aus seiner Gleichgewichtslage ausgelenkt wird. Es dauert dann aber eine Zeit der Grö-
ßenordnung τ, bis das Ion wieder in seiner Ruhelage angekommen ist.146 Wir sehen also, dass
für ein bestimmtes Zeitintervall τ die langsamen Ionen die negative Ladung des Elektrons
abschirmen, obwohl sich dieses längst weiterbewegt hat (siehe Abb. 13.34b). Diesen Effekt
nennt man Überabschirmung. Innerhalb dieses Zeitintervalls kann nun ein zweites Elektron
an die gleiche Stelle gelangen und sieht dann die positive Raumladung (siehe Abb. 13.34c).
Dieses zweite Elektron erfährt dadurch eine Energieabsenkung, was einer effektiven attrak-
tiven Wechselwirkung entspricht. Wir können diese intuitive Bild auch verwenden, um die
Reichweite der attraktiven Wechselwirkung abzuschätzen. Ein Elektron kann in der Zeit τ
maximal die Strecke v F τ zurücklegen. Da die Fermi-Geschwindigkeit v F für Metalle eini-
145
Zur Veranschaulichung wird oft eine elastische Membran verwendet, auf die man eine Kugel legt.
Die durch das Gewicht der Kugel erzeugte Mulde in der Membran führt dazu, dass eine zweite
Kugel in diese Mulde rollt, also von der anderen Kugel angezogen wird.
146
Wir können dies einfach ausprobieren, indem wir an einem ruhenden Pendel vorbeilaufen und
dieses im Vorbeilaufen durch einen Kraftstoß auslenken. Wir können dann noch eine beträchtliche
Strecke weiterlaufen, bevor das Pendel wieder in seine Ruhelage zurückgeschwungen ist.
852 13 Supraleitung
ge 106 m/s beträgt und die untere Schranke von τ durch 1⇑ω D gegeben ist und somit im
Bereich von 10−14 bis 10−13 s liegt, erhalten wir eine untere Grenze für die Laufstrecke von
etwa 10–100 nm. Wir sehen, dass durch die verzögerte Reaktion der Ionen zwei wechsel-
wirkende Elektronen weit voneinander entfernt sein können. Dies ist essentiell wichtig, da
sonst die abstoßende Coulomb-Wechselwirkung dominieren würde. Aufgrund der verzö-
gerten Reaktion der langsamen Ionen sprechen wir von einer retardierten Wechselwirkung.
13.5.1.2 Cooper-Paare
Nachdem wir eine anschauliche Vorstellung dafür entwickelt haben, wie eine attraktive
Wechselwirkung zwischen Leitungselektronen über das Kristallgitter zustande kommen
kann, müssen wir uns überlegen, wie wir das Wechselwirkungspotenzial beschreiben kön-
nen und zwischen welchen Elektronen die attraktive Wechselwirkung maximal wird. Wir
gehen dazu von einem Gas freier Elektronen bei T = 0 aus, bei dem alle Zustände bis zur
Fermi-Energie E F = ħ 2 k F2 ⇑2m besetzt sind. In einem Gedankenexperiment addieren wir
nun zwei weitere Elektronen hinzu, die über das Gitter miteinander wechselwirken können.
Den Wechselwirkungsprozess beschreiben wir durch den Austausch von virtuellen Phono-
nen mit dem Wellenvektor q. Wir sprechen von einem virtuellen Phonon, da dieses von
dem einen Elektron erzeugt und innerhalb der Zeitunschärfe ∆t = 1⇑ω q von dem anderen
sofort wieder absorbiert werden muss, um die Energieerhaltung zu gewährleisten. Nach
dem Austausch des virtuellen Phonons besitzen die beiden Elektronen mit ursprünglichen
Wellenvektoren k1 und k2 die Impulse
Der Gesamtimpuls
bleibt erhalten. Da für T = 0 alle Zustände unterhalb von E F besetzt sind, sind für die bei-
den zusätzlichen Elektronen nur Zustände oberhalb von E F zugänglich. Da ferner die ma-
ximale Energie für Phononen durch ħω D gegeben ist [hierbei ist ω D die Debye-Frequenz,
vergleiche (6.1.49)], spielt sich die Wechselwirkung in einem Energiebereich zwischen E F
und E F + ħω D ab. Der zugehörige Bereich im k-Raum entspricht einer Kugelschale mit Ra-
dius k F und Dicke ∆k ≃ mω D ⇑ħk F , wobei wir ħω D ≪ E F angenommen haben.147 Da wir
die Impulserhaltung (13.5.4) erfüllen müssen, sind für einen vorgegebenen Gesamtwellen-
vektor K Wechselwirkungsprozesse nur für Wellenvektoren aus einem bestimmten Phasen-
raumvolumen möglich. Wie in Abb. 13.35 gezeigt ist, müssen die Wellenvektoren innerhalb
der Schnittmenge der um K gegeneinander verschobenen Kugelschalen mit Breite ∆k liegt.
Wir sehen sofort, dass das Phasenraumvolumen für die attraktive Wechselwirkung für K = 0
maximal wird. Die Wechselwirkung kann dann über die gesamte Fermi-Oberfläche wirksam
werden. Wir können daraus folgern, dass die attraktive Elektron-Elektron-Wechselwirkung
durch Austausch virtueller Phononen für Elektronenpaare mit Wellenvektoren k1 = −k2 op-
timal wird. Wir nennen solche Elektronen Cooper-Paare und kennzeichnen sie im Folgen-
den mit (k, −k).
147
Es gilt ħ 2 k F2 ⇑2m + ħω D = ħ 2 (k F + ∆k)2 ⇑2m ≃ ħ 2 (k F2 + 2k F ∆k)⇑2m, woraus wir ∆k ≃ mω D ⇑ħk F
erhalten.
13.5 Mikroskopische Theorie 853
(a) (b)
𝚫𝒌
𝒒
𝒌𝟏 𝒌
𝒌𝟐
−𝒌′ 𝒌′
𝑲
−𝒌
−𝒒
Abb. 13.35: (a) Zur Veranschaulichung der Impulserhaltung bei der Paarwechselwirkung. Die mögli-
′
𝑲 = 𝒌der
chen Endzustände müssen wegen 𝟏 +𝒌 𝟐 >𝟎
Erhaltung 𝑲 = 𝒌𝟏 K
des Gesamtimpulses, +𝒌=𝟐K=, 𝟎innerhalb der Schnitt-
fläche der beiden farbig hinterlegten Kugelschalen der Breite ∆k liegen. In drei Dimensionen ist das
Schnittvolumen ein Torus. (b) Typischer Streuprozess für ein Cooper-Paar (k, −k). Für K = K′ = 0
ℏ2 𝑘𝐹2 Kugelschalen
wird die Schnittfläche der beiden ℏ2 𝑘𝐹2 + 2𝑘𝐹 Δ𝑘
ℏ2 𝑘 + Δ𝑘maximal.
2 ℏ2 𝑘𝐹2 ℏ2 𝑘𝐹 Δ𝑘
+ ℏ𝜔𝐷 = ≃ = +
2𝑚 2𝑚 2𝑚 2𝑚 𝑚
𝒎𝝎𝑫
𝚫𝒌 =
Wir diskutieren als nächstes die Wellenfunktion ℏ𝒌 𝑭
eines
Cooper-Paares und ihre Energieei-
genwerte. Dazu setzen wir für ein Elektronenpaar aus Elektronen mit Wellenvektoren 179
k1 =
−k2 = k die Zweiteilchenwellenfunktion als Produkt von zwei ebenen Wellen an, das heißt,
Ψ(r1 , r2 ) = a exp(ık1 ⋅ r1 ) exp(ık2 ⋅ r2 ) = a exp(ık ⋅ r), wobei wir die Relativkoordinate r =
r1 − r2 benutzt haben. Wie Abb. 13.35b zeigt, werden die zu einem Paar korrelierten Elek-
tronen ständig in neue Zustände mit anderen Wellenvektoren gestreut, die aber immer anti-
parallel stehen müssen. Wir setzen deshalb für die Paarwellenfunktion eine Überlagerung
aus Produktwellenfunktionen an:
k F +∆k
Ψ(r1 , r2 ) = ∑ a k e ık⋅r . (13.5.6)
k=k F
Hierbei gibt ⋃︀a k ⋃︀2 die Wahrscheinlichkeit an, ein spezielles Elektronenpaar mit Wellenvekto-
ren (k, −k) anzutreffen. Da für T = 0 der Wechselwirkungsbereich auf Energien zwischen E F
und E F + ħω D beschränkt ist, muss der Wellenvektor der wechselwirkenden Elektronen im
Bereich zwischen k F und k F + ∆k liegen. Elektronen mit k < k F können nicht an der Wech-
selwirkung teilnehmen, da hier nach unserer obigen Annahme alle Zustände besetzt sind
und deshalb keine Streuzustände frei sind. Wir werden später sehen, dass im Gegensatz zu
dem hier gemachten Gedankenexperiment in Supraleitern selbst bei T = 0 die Fermi-Vertei-
lung aufgeweicht ist, um die attraktive Wechselwirkung einer großen Zahl von Elektronen
zu ermöglichen. Dazu muss zunächst die kinetische Energie des Elektronensystems erhöht
werden, was aber durch den Gewinn an potenzieller Wechselwirkungsenergie überkompen-
siert wird.
Wir nehmen nun an, dass das Wechselwirkungspotenzial V nur von der Relativkoordinate r
abhängt. Die Schrödinger-Gleichung für das Elektronenpaar lautet dann
ħ2
− (∇2 + ∇22 )Ψ(r1 , r2 ) + V (r)Ψ(r1 , r2 ) = EΨ(r1 , r2 ) . (13.5.7)
2m 1
In das Wechselwirkungspotenzial geht sowohl die abstoßende Coulomb-Wechselwirkung
als auch die oben beschriebene attraktive Wechselwirkung ein. Der genaue Potenzialverlauf
ist nicht bekannt, ist aber für die nun folgende Diskussion unwichtig. Um die Schrödinger-
Gleichung zu lösen, setzen wir den Lösungsansatz (13.5.6) in (13.5.7) ein und multiplizieren
mit exp(−ık′ ⋅ r). Integrieren wir dann über das gesamte Probenvolumen Ω, so verschwindet
854 13 Supraleitung
das Integral über exp(︀ı(k − k′ ) ⋅ r⌋︀ für k ≠ k′ und ist gleich dem Probenvolumen für k = k′ .
Wir erhalten somit
k F +∆k
ħ2 k2 ′
a k Ω + ∑ a k ′ ∫ V (r)e ı(k−k )⋅r dV = Ea k Ω . (13.5.8)
m k ′ =k F Ω
Benutzen wir für das Streuintegral, das die Wahrscheinlichkeit für einen Streuprozess von k
nach k′ angibt, die Abkürzung148
Vk,k ′ = V (k − k′ ) = V (q)
1 ′ 1
= ∫ V (r)e ı(k−k )⋅r dV = ∫ V (r)e ıq⋅r dV , (13.5.9)
Ω Ω
Ω Ω
so erhalten wir
k F +∆k
ħ2 k2
(E − ) a k = ∑ a k ′ Vk,k ′ . (13.5.10)
m k ′ =k F
Um das Problem zu lösen, müssen wir die Matrixelemente Vk,k ′ kennen. Ein mögliches
Wechselwirkungspotenzial V (q), das wir in Abschnitt 11.7.3 im Zusammenhang mit der
Abschirmung von Phononen in Metallen abgeleitet haben, ist z. B. durch (13.5.3) gegeben.
Cooper nahm nun vereinfachend eine vollkommen isotrope Wechselwirkung an, so dass die
Matrixelemente für das gesamte Intervall k F < k ′ , k < k F + ∆k den konstanten Wert Vk,k ′ =
−V0 annehmen und sonst verschwinden:
)︀
⌉︀
⌉︀−V0 für k F < k ′ , k < k F + mω D
V k,k ′ = ⌋︀ ħk F . (13.5.11)
⌉︀
⌉︀
]︀0 sonst
Diesen Ausdruck können wir weiter vereinfachen, indem wir auf beiden Seiten über al-
le k aufsummieren. Da das Ergebnis nicht von der Benennung der Wellenvektoren abhängt,
gilt ∑ k a k = ∑ k ′ a k ′ und wir erhalten
k F +∆k
1
1 = V0 ∑ . (13.5.13)
k=k F
ħ 2 k2
m
−E
̃
Wir führen nun eine Paarzustandsdichte D(E) ≃ D(E)⇑2 ein und ersetzen die Summation
durch eine Integration. Dabei nehmen wir an, dass die elektronische Zustandsdichte D(E)
(für beide Spinrichtungen) in dem schmalen Energiebereich ħω D ≪ E F gut durch die Zu-
standsdichte bei der Fermi-Energie D(E F ) beschrieben wird. Der Faktor 1⇑2 resultiert aus
148
Vk,k′ steht für Vk1 ,k2 ,q mit k1 = k, k2 = −k und q = k − k′ .
13.5 Mikroskopische Theorie 855
der Tatsache, dass wir es mit Elektronenpaaren zu tun haben.149 Benutzen wir noch die Ab-
kürzung є = ħ 2 k 2 ⇑2m, so können wir (13.5.13) wie folgt umschreiben:
E F +ħω D
D(E F ) dє
1 = V0 ∫ . (13.5.14)
2 2є − E
EF
Führen wir die Integration aus und lösen nach E auf, so erhalten wir
Wir sehen, dass die Energie der wechselwirkenden Elektronen kleiner als 2E F ist. Das bedeu-
tet, dass wir einen gebundenen Zweielektronenzustand (Cooper-Paar) erhalten haben. Wir
haben in unserem Gedankenexperiment nur zwei Elektronen betrachtet, die wir dem System
bei T = 0 zugeführt haben. Wir werden später sehen, dass in Wirklichkeit alle Elektronen
in einem bestimmten Energieintervall um E F miteinander in Wechselwirkung stehen. Dies
führt zur Ausbildung von Paarzuständen, deren Energie gegenüber der Energie der freien
Elektronen abgesenkt ist. Dadurch wird das Gas der wechselwirkungsfreien Elektronen in-
stabil gegenüber Paarbildung. Diese Instabilität verursacht einen Übergang in einen neuen
Grundzustand des Elektronensystems, den so genannten BCS-Grundzustand, dessen Eigen-
schaften wir im nächsten Abschnitt diskutieren werden.
Die Bindungsenergie der Cooper-Paare wird außer durch die Wechselwirkungsstärke V0
durch die maximale Energie ħω D der Phononen bestimmt. Da ħω D ≪ E F und außer-
dem 1⇑D(E F )V0 ebenfalls meist wesentlich kleiner als eins ist, wird sofort klar, dass die
Übergangstemperaturen von klassischen Supraleitern niedrig sind. Die Wellenfunkti-
on (13.5.6) eines Cooper-Paares enthält eine Überlagerung von Wellenvektoren aus dem
Bereich k F < k < k F + ∆k, so dass wir ihm keinen definierten Wellenvektor mehr zuordnen
können. Der Ausdruck (13.5.12) für die Wichtungsamplituden a k zeigt allerdings, dass
diejenigen Zustände das größte Gewicht besitzen, deren kinetische Energie vergleichbar
149
Wir möchten darauf hinweisen, dass D(E F ) die Zustandsdichte pro Energieintervall für beide
Spinrichtungen ist. In manchen Lehrbüchern wird auch die Zustandsdichte N(E F ) = D(E F )⇑2 für
eine Spin-Richtung benutzt. In diesem Fall ist die Paarzustandsdichte gerade durch N(E F ) gege-
ben.
150
Wir haben in unserem Gedankenexperiment angenommen, dass alle Zustände unterhalb von E F
besetzt und deshalb nicht für Streuprozesse zugänglich sind. In manchen Lehrbüchern wird da-
gegen angenommen, dass für die Streuprozesse alle Zustände im Energieintervall ±ħω D um die
Fermi-Energie zugänglich sind. Dann muss die Integration in (13.5.14) von E F − ħω D bis E F + ħω D
erfolgen und wir erhalten in dem Exponentialterm 2⇑D(E F )V0 statt 4⇑D(E F )V0 . Wir werden spä-
ter in der Tat sehen, dass im Supraleiter selbst bei T = 0 die Fermi-Verteilung aufgeweicht ist und
somit auch bei T = 0 Zustände unterhalb von E F für die Paarwechselwirkung zur Verfügung ste-
hen.
856 13 Supraleitung
mit E F ist, also Elektronen bei der Fermi-Energie. Wir wollen noch darauf hinweisen, dass
die oben geführte Diskussion auch für andere Austauschbosonen gilt. Wir müssen nur
die für Phononen geltende Energieskala ħω D durch die charakteristische Energieskala des
neuen Austauschbosons ersetzen und die Wechselwirkung Vk,k ′ entsprechend wählen.
Wir haben oben bereits erwähnt, dass wir die untere Grenze für die Reichweite der
attraktiven Wechselwirkung in Metallen zu v F τ = v F ⇑ω D ≃ 10–100 nm abschätzen kön-
nen. Das gleiche Ergebnis erhalten wir aus der Unschärferelation. Aus ∆x∆k > 1 folgt
mit ∆k < mω D ⇑ħk F = ω D ⇑v F sofort ∆x ≃ 1⇑∆k < v F ⇑ω D . Wir können daraus folgern, dass
die Cooper-Paare in klassischen metallischen Supraleitern eine charakteristische „Grö-
ße“ besitzen, deren obere Schranke zwischen 10 und 100 nm liegt. Dies gilt auch für die
Ginzburg-Landau Kohärenzlänge ξ GL , da sich die Dichte der Cooper-Paare ja nicht auf
einer Längenskala ändern kann, die wesentlich kleiner als die Ausdehnung der Paare selbst
ist. Die Tatsache, dass die „Größe“ eines Cooper-Paares mindestens im Bereich zwischen 10
und 100 nm liegt, macht sofort deutlich, dass sich bei einer Elektronendichte von typi-
scherweise 1022 bis 1023 cm−3 in Metallen innerhalb des Volumens eines Cooper-Paares
eine enorm hohe Zahl von typischerweise weit mehr als 1 Million weiterer Cooper-Paare
befindet. Dies ist in Abb. 13.36 schematisch veranschaulicht. Wir können uns leicht vorstel-
len, dass sich aufgrund dieses starken Überlapps ein kohärenter Vielteilchenzustand aller
Cooper-Paare ausbildet.
1
Ψ(r1 , σ1 , r2 , σ2 ) = ⌋︂ e ıKS ⋅R f (r1 − r2 )χ(σ1 , σ2 ) = −Ψ(r2 , σ2 , r1 , σ1 ). (13.5.17)
V
Hierbei haben wir den Ortsanteil in eine Schwerpunkts- und Relativ- oder Orbitalbewegung
aufgespalten. Es gilt R = (r1 + r2 )⇑2, r = r1 − r2 und KS = (k1 + k2 )⇑2 und wir nehmen KS =
0 an. Zu einer symmetrischen Orbitalfunktion gehört eine antisymmetrische Spin-Funktion
und umgekehrt. Wenn wir die Elektronenspins s1 = s2 = 12 und ihre Projektionen σ1 , σ2 zu
13.5 Mikroskopische Theorie 857
Abb. 13.37: Schematische Darstellung der Symmetrie des Orbitalanteils verschiedener Paarwellen-
funktionen: (a) s-Wellensymmetrie (L = 0), (b) p-Wellensymmetrie (L = 1) und (c) d-Wellensymme-
trie (L = 2). Die Farben entsprechen unterschiedlichen Vorzeichen bzw. einer Phasenänderung von π.
)︀
⌉︀ = χ =
a ⌋︂1 (↑↓ − ↓↑)
⌉︀
⌉︀
⌉︀
0, m s 0 2
(Singulett-Paarung)
⌉︀
⌉︀
⌉︀ )︀−1 =↓↓
⌉︀
⌉︀
⌉︀
S = ⌋︀ ⌉︀ . (13.5.18)
⌉︀
⌉︀
⌉︀1, m s = ⌋︀ 0 χ s = ⌋︂12 (↑↓ + ↓↑) (Triplett-Paarung)
⌉︀
⌉︀
⌉︀ ⌉︀
⌉︀
⌉︀ ⌉︀
⌉︀
]︀ ]︀+1 =↑↑
Der Spin-Anteil ist antisymmetrisch für Singulett-Paarung und symmetrisch für Triplett-
Paarung. Dies erfordert, dass die zugehörige Orbitalfunktion gerade symmetrisch bzw. anti-
symmetrisch ist. Deshalb können wir die Orbitalwellenfunktion durch die orbitalen Quan-
tenzahlen L = 0, 2, . . . für Singulett-Paarung bzw. L = 1, 3, . . . für Triplett-Paarung klassifi-
zieren. Die zugehörige Paarung können wir dann als s-, d-, . . . wellenartig bzw. p-, f -, . . .
wellenartig bezeichnen. Insgesamt erhalten wir
In Abb. 13.37 sind die räumlichen Strukturen einer s-, p- und d-Ortswellenfunktion gezeigt.
Mit der oben gemachten Annahme Vk,k ′ = −V0 hängt die Wechselwirkung nur vom Betrag
von k ab, weshalb der Bahnanteil der Wellenfunktion isotrop, also symmetrisch sein muss.
Der Spin-Anteil der Wellenfunktion muss somit antisymmetrisch sein. Dies wird durch
einen Spin-Singulett-Zustand (S = 0) erfüllt, bei dem die Spins der beiden Elektronen
anti-parallel stehen. Dadurch können wir das Cooper-Paar im einfachsten Fall durch die
Quantenzahlen
vollständig charakterisieren.
Wir wollen an dieser Stelle darauf hinweisen, dass die Wechselwirkung Vk,k ′ in vielen Su-
praleitern mehr oder weniger stark von der Richtung von k abhängt und daher andere Sym-
metrien des Ordnungsparameters bevorzugt werden. So besitzt zum Beispiel für die Ku-
prat-Supraleiter der Bahnanteil eine symmetrische d-Wellenfunktion (L = 2) und der Spin-
Anteil deshalb einen antisymmetrischen Spin-Singulett (S = 0) Zustand. Für 3 He sowie für
858 13 Supraleitung
∑
†
Vk,k′ c k,σ c†
1 −k,σ 2
c−k′ ,σ2 c k′ ,σ1 (13.5.26)
k,k′ ,σ 1 ,σ 2 )︁⌊︂⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂]︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ )︂ )︁⌊︂⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ]︂⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂)︂
Pk† Pk′
151
Es gilt
† †
c k,σ ⋃︀0̃︀ = ⋃︀1̃︀, c k,σ ⋃︀0̃︀ = 0, c k,σ ⋃︀1̃︀ = 0, c k,σ ⋃︀1̃︀ = ⋃︀0̃︀ (13.5.22)
und es gelten folgende Vertauschungsrelationen:
beschreibt in dieser Notation die Streuung eines Elektrons aus dem Zustand (k′ σ1 , −k′ σ2 )
in den Zustand (kσ1 , −kσ2 ), wobei das attraktive Zweiteilchen-Streumatrixelement Vk,k′ nur
für Wellenvektoren k und k′ innerhalb einer dünnen Schale um die Fermi-Fläche endlich
sein soll. Die Operatoren Pk† und Pk sind der Paarerzeugungs- und Paarvernichtungsope-
rator. Aufgrund der attraktiven Elektron-Elektron-Wechselwirkung gibt es eine spontane
Paarbildung unterhalb der Sprungtemperatur Tc , die wir mit dem statistischen Mittelwert
Der Spin-Anteil von g kσ1 σ2 erlaubt uns die Unterscheidung zwischen Singulett- und Triplett-
Paarung. Dies erfordert, dass g kσ1 σ2 gerade bzw. ungerade Parität hinsichtlich der Operati-
on k → −k besitzt. Da die Größe g kσ1 σ2 im Normalzustand null ist und unterhalb von Tc
kontinuierlich ansteigt, können wir sie als Ordnungsparameter betrachten. Alternativ wird
häufig die Größe
verwendet, die wir als Paarpotenzial bezeichnen. Sie gibt den statistischen Mittelwert der
Paarwechselwirkung (13.5.26) an.
13.5.2.2 BCS-Vielteilchenwellenfunktion
Nachdem wir gesehen haben, dass wir den supraleitenden Zustand phänomenologisch
sehr gut mit einer makroskopischen Wellenfunktion ψ(r, t) = ψ 0 (r, t)e ı θ(r,t) [vergleiche
(13.3.11)], also mit einem kohärenten Vielteilchenzustand beschreiben können, ist es na-
heliegend, einen kohärenten Zustand zur Beschreibung der supraleitenden Elektronen zu
konstruieren. Für Bosonen wäre dies einfach. Es ist bekannt, dass wir für Bosonen einen
idealen kohärenten Zustand als Überlagerung von Zuständen verschiedener Teilchenzahl
konstruieren können. In der so genannten Fock-Raum-Schreibweise (nach Wladimir Alex-
androwitsch Fock) ergibt sich der kohärente Zustand ⋃︀α̃︀ als unendliche Linearkombination
∞ ∞
⋃︀α 2 ⋃︀ αn ⋃︀α 2 ⋃︀ (αa† )n ⋃︀α 2 ⋃︀
⋃︀α̃︀ = e− −
⋃︀0̃︀ = e− 2 e(α a ) ⋃︀0̃︀ ,
†
2
∑ ⌋︂ ⋃︀ϕ n ̃︀ = e 2 ∑ (13.5.30)
n=0 n! n=0 n!
wobei a† der Erzeugungsoperator, ⋃︀0̃︀ der Vakuumzustand und α = ⋃︀α⋃︀e ı φ eine komplexe
Zahl ist. Der durch (13.5.30) beschriebene kohärente Zustand wurde von Erwin Schrödin-
ger bereits 1926 entdeckt,153 als er nach einem Zustand des quantenmechanischen harmoni-
schen Oszillators suchte, der dem des klassischen harmonischen Oszillators entspricht, und
wurde später von Roy J. Glauber auf den Fock-Raum übertragen.154 Die Wahrscheinlichkeit
für eine Besetzung von genau n Teilchen ist gegeben durch
⋃︀α⋃︀2n −⋃︀α⋃︀2
P(n) = ⋃︀∐︀ϕ n ⋃︀α̃︀⋃︀2 = e , (13.5.31)
n!
entspricht also einer Poisson-Verteilung. Demnach ist N = ⋃︀α⋃︀2 der Erwartungswert
⌋︂ der Be-
setzungszahl des kohärenten Zustandes und es gilt ferner ∆N⇑N = 1⇑ N und ∆N ⋅ ∆φ ≥ 12 .
Der durch (13.5.30) gegebene kohärente Zustand kann für die Beschreibung von kohären-
ten bosonischen Vielteilchenzuständen wie Laserlicht oder Bose-Einstein-Kondensaten ver-
wendet werden. Wollen wir einen ähnlichen Zustand für die Beschreibung der supraleiten-
den Elektronen verwenden, so stellt sich die Frage, wie wir einen kohärenten Zustand aus
den fermionischen Wellenfunktionen der Elektronen aufbauen können. Es war ein wesent-
liches Verdienst von Schrieffer, einen solchen Zustand zu konstruieren.
Um einen Zustand ähnlich zu (13.5.30) zu erzeugen, brauchen wir noch die Eigenschaften
von Potenzen der Paarerzeuger. Es gilt
2
Pk† Pk† = (Pk† ) = c k,σ
†
c† c† c†
1 −k,σ 2 k,σ 1 −k,σ 2
= −c k,σ
†
c† c† c†
1 k,σ 1 −k,σ 2 −k,σ 2
=0, (13.5.32)
†
Wir sehen, dass eine Vertauschung von c−k,σ c † ein Minuszeichen erzeugt und deshalb ei-
2 k,σ 1
ne Serie von zwei gleichen Erzeugern, die auf den Grundzustand wirken, null ergibt. Wenden
wir dies zusammen mit den Vertauschungsrelationen für die Paarerzeuger an, so können wir
einen zu (13.5.30) analogen kohärenten Zustand wie folgt schreiben:
Hierbei ist c 1 eine Normierungskonstante und wir haben für die letzte Umformung ausge-
nutzt, dass alle Potenzen von Pk† höher als eins verschwinden. Die Normierungsbedingung
152
C. Cohen-Tannoudji, B. Diu, F. Laloë, Quantenmechanik, Band 1 und 2, Walter de Gruyter, Berlin
(2007).
153
E. Schrödinger, Der stetige Übergang von der Mikro- zur Makromechanik, Die Naturwissenschaften
14, 664-666 (1926).
154
R. J. Glauber, Coherent and Incoherent States of the Radiation Field, Phys. Rev. 131, 2766-2788
(1963).
13.5 Mikroskopische Theorie 861
∗
∐︀ΨBCS ⋃︀ ΨBCS ̃︀ = 1 = c 12 ∐︀0⋃︀ ∏ (1 + α k∗ Pk ) (1 + α k Pk† ) ⋃︀0̃︀ (13.5.34)
k
⋃︀ΨBCS ̃︀ = ∏ (u k + v k c k↑
† †
c−k↓ ) ⋃︀0̃︀ (13.5.36)
k
mit
1 αk
u k = ⌈︂ , v k = ⌈︂ . (13.5.37)
1 + ⋃︀α k ⋃︀2 1 + ⋃︀α k ⋃︀2
Die Größen ⋃︀u k ⋃︀2 bzw. ⋃︀v k ⋃︀2 , die üblicherweise als Kohärenzfaktoren bezeichnet werden, ge-
ben die Wahrscheinlichkeiten dafür an, dass ein Paarzustand mit Wellenvektor k unbesetzt
bzw. besetzt ist. Die Größen u k und v k sind komplexe Wahrscheinlichkeitsamplituden mit
Amplitude und Phase und es gilt
Die Wellenfunktion (13.5.36) stellt eine kohärente Superposition von Zuständen mit
0, 1, 2, 3, . . . Elektronenpaaren dar. Das heißt, wir haben einen Zustand konstruiert, für den
nur die mittlere Teilchenzahl festgelegt ist.
Da wir es mit einem System mit fester Teilchenzahl zu tun haben, ist es zunächst verwun-
derlich, dass ein Zustand, für den nur die mittlere Teilchenzahl festgelegt ist, eine gute Be-
schreibung ist. Die allgemeinste Form, wie wir eine N-Elektronen-Wellenfunktion unter Be-
rücksichtigung der Paarkorrelationen aus Eigenfunktionen des Impulsoperators aufbauen
können, lautet
Hierbei kennzeichnen k i und k l den ersten und letzten der M Wellenvektoren, die für einen
bestimmten Term in der Summe besetzt sind. Die Größe g gibt das Gewicht an, mit der das
Produkt dieses Satzes von N⇑2 Paarerzeugungsoperatoren eingeht. Die Summe läuft über
alle k-Werte. Das Problem besteht nun darin, dass die Zahl der Realisierungsmöglichkeiten
der N⇑2 Paarzustände (wir verteilen N⇑2 Teilchen auf M verfügbare Zustände)
M! 20
≈ 1010 (13.5.40)
(︀M − (N⇑2)⌋︀!(N⇑2)!
Dabei wird angenommen, dass die Besetzungswahrscheinlichkeit eines Zustandes k nur von
der mittleren Besetzungswahrscheinlichkeit der anderen Zustände abhängt. Da dadurch die
Besetzungswahrscheinlichkeiten nur statistisch behandelt werden, gibt man die Forderung
auf, dass die Teilchenzahl genau N sein muss. Nur die mittlere Teilchenzahl N ist festge-
⌈︂ allerdings kein Problem dar, da die relative Schwankung der Teilchenzahl,
legt. Dies stellt
∆N⇑N ≃ 1⇑ N, aufgrund der Größe von N sehr klein ist. Für N ≃ 1022 ist ∆N⇑N ≃ 10−11 .
Es wurde später von P. W. Anderson155 , 156 gezeigt, dass der N-Teilchenanteil des BCS-
Grundzustands leicht herausprojeziert werden kann, indem man den Paarerzeugern einen
beliebigen Phasenfaktor e ı φ zuordnet:
Führen wir die Multiplikation über k aus, so erzeugen wir viele Terme, die wir in eine Summe
der Form ∑ N α N ⋃︀ΨN ̃︀ gruppieren können. Alle Terme, die zu einer Gruppe ⋃︀ΨN ̃︀ gehören,
zeichnen sich durch denselben Phasenfaktor e ı N φ⇑2 aus, wobei N⇑2 die Anzahl der Paare im
N-Teilchenzustand ist. Wir können jetzt ⋃︀ΨN ̃︀ einfach dadurch herausprojezieren, indem wir
mit e−ı N φ⇑2 multiplizieren und über die Phase φ von 0 bis 2π integrieren. Es verschwinden
dadurch alle Beiträge außer denjenigen, die exakt den Phasenfaktor e ı N φ⇑2 enthalten, also
zur Paarzahl N⇑2 gehören. Es gilt
2π 2π
⋃︀ΨN ̃︀ = ∫ dφe−ı N φ⇑2 ∏(⋃︀u k ⋃︀ + ⋃︀v k ⋃︀e ı φ c k↑
† †
c−k↓ )⋃︀0̃︀ = ∫ dφe−ı N φ⇑2 ⋃︀Ψφ ̃︀ . (13.5.42)
0 k 0
Durch die Integration über φ machen wir die Phase völlig unscharf und erzwingen dadurch
eine scharfe Teilchenzahl N. Zwischen Teilchenzahl N und Phase φ besteht die Unschärfe-
beziehung
∆N ∆φ ≥ 1 . (13.5.43)
Dies ist völlig analog zur Unschärfebeziehung zwischen Phase und Photonenzahl von elek-
tromagnetischer Strahlung. Ein semi-klassisches E-Feld mit wohldefinierter Phase erfordert
eine genügend hohe Photonenzahl, so dass wir eine Superposition von Zuständen mit un-
terschiedlicher Photonenzahl tolerieren können. Für einen Zustand mit fester Photonenzahl
(Fock-Zustand) ist die Phase beliebig unscharf.
155
Philip Warren Anderson, amerikanischer Theoretischer Physiker, geboren am 13. Dezember 1923
in Indianapolis, Indiana, USA. Er erhielt 1977 zusammen mit Nevill F. Mott und John H. van Vleck
den Nobelpreis für Physik „für seine grundlegenden theoretischen Leistungen zur Elektronenstruktur
in magnetischen und ungeordneten Systemen“.
156
P. W. Anderson, The Josephson Effect and Quantum Coherence Measurements in Superconductors
and Superfluids, in C. J. Gorter (ed.), Prog. Low Temp. Phys. 5, 5 (1967).
13.5 Mikroskopische Theorie 863
wir157
∗
∐︀n k↑ ̃︀ = ∐︀ΨBCS ⋃︀ c k↑
†
c k↑ ⋃︀ ΨBCS ̃︀
= ∐︀0⋃︀(u∗k + v k∗ c−k↓ c k↑ )c k↑
†
c k↑ (u k + v k c k↑
† †
c−k↓ )
× ∏(u∗l + v l∗ c−l↓ c l↑ )(u l + v l c l↑
† †
c−l↓ )⋃︀0̃︀ . (13.5.44)
l≠k
Die Faktoren für l ≠ k ergeben ⋃︀u k ⋃︀2 + ⋃︀v k ⋃︀2 = 1 und wir erhalten
+ v k∗ u k ∐︀0 ⋃︀ †
c−k↓ c k↑ c k↑ c k↑ ⋃︀ 0̃︀ +⋃︀v k ⋃︀ ∐︀0 ⋃︀ c−k↓ c k↑ c k↑ 2 †
c k↑ c k↑ † †
c−k↓ ⋃︀ 0̃︀
)︁⌊︂⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂]︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ )︂ )︁⌊︂⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ]︂⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ )︂
=0 =1
= ⋃︀v k ⋃︀2 . (13.5.45)
N = ̂︀∑ n kσ ̃︂ = ∑⋃︀v k ⋃︀2 = 2 ∑⋃︀v k ⋃︀2 = ∑ (1 − ⋃︀u k ⋃︀2 + ⋃︀v k ⋃︀2 ) , (13.5.46)
kσ kσ k k
was wir aufgrund der Einführung von v k als Wahrscheinlichkeitsamplitude für die Beset-
zung des Zustandes k so erwartet hätten. Wir können ferner zeigen, dass
∗
∐︀ΨBCS ⋃︀ c k↑
† †
c−k↓ c−k′ ↓ c k′ ↑ ⋃︀ ΨBCS ̃︀ = v k v k∗′ u k′ u∗k . (13.5.47)
g k† ≡ ∐︀c k↑
† †
c−k↓ ̃︀ = u k v k∗ . (13.5.49)
⌈︂
Wir sehen also, dass ∆N⇑N = 1⇑ N und somit die relative Fluktuation der Teilchenzahl
für N → ∞ verschwindend klein wird. Die Teilchenzahl hat die statistischen Eigenschaften
eines kohärenten Zustandes.
157
Wir benutzen hier, dass ∐︀𝒪ϕ⋃︀ψ̃︀ = ∐︀ϕ⋃︀𝒪† ⋃︀ψ̃︀ und dass das Adjungierte eines Produkts von Opera-
toren gleich dem Produkt der adjungierten Operatoren in umgekehrter Reihenfolge ist.
864 13 Supraleitung
Hierbei ist n kσ = c kσ
†
c kσ der Teilchenzahloperator und ξ k die kinetische Einteilchenenergie
bezogen auf das chemische Potenzial µ. Es gilt also
ħ2 k 2
ξk = єk − µ = −µ. (13.5.52)
2m
Der zweite Term auf der rechten Seite von (13.5.51) enthält das für die Supraleitung relevante
Wechselwirkungspotenzial Vk,k′ . Wir nehmen an, dass der Hamilton-Operator alle für die
Supraleitung wichtigen Beiträge enthält, obwohl wir Terme, die zu Elektronen gehören, die
nicht zu (k ↑, −k ↓) gepaart sind, unberücksichtigt lassen. Diese Beiträge haben für die BCS-
Grundzustandswellenfunktion den Erwartungswert null.
Für die Paarerzeuger und -vernichter können wir formal schreiben
Setzen wir dies in (13.5.51) ein und berücksichtigen nur Terme, die linear in der Abwei-
chung δg k vom statistischen Mittelwert der Paaramplitude sind, so erhalten wir
= ∑ (ξ k c k↑
†
c k↑ − ξ k c−k↓ c−k↓
†
+ ξk ) (13.5.56)
k
ξ k −∆ k c k↑
ℋBCS = ∑ {ξ k + g k† ∆ k + (c k↑
†
, c−k↓ ) ( ) ( † )(︀ . (13.5.57)
k
−∆†k −ξ k c−k↓
u∗k v k α†
(c k↑
†
, c−k↓ ) = ( ∗ )( k ) (13.5.58)
−v k u k βk
u k v k∗ α
(c k↑ , c−k↓
†
)=( ) ( †k ) (13.5.59)
−v k u∗k βk
Da ⋃︀u k ⋃︀2 + ⋃︀v k ⋃︀2 = 1 gilt, entspricht die Transformation einer Drehung. Bei geeigneter Wahl
des Drehwinkels rotieren wir in die Eigenbasis der neuen Quasiteilchenzustände und dia-
gonalisieren dadurch den Hamilton-Operator. Offensichtlich trägt α k dazu bei, ein Elektron
mit k ↑ mit der Wahrscheinlichkeitsamplitude u ∗k zu zerstören und eines mit −k ↓ mit der
Wahrscheinlichkeitsamplitude −v k∗ zu erzeugen. Beides zusammen resultiert in einer Ab-
nahme des Gesamtimpulses um k und des Gesamtspins um ħ⇑2. Der Operator β†k hat ähn-
liche Eigenschaften: β†k erzeugt ein Elektron mit k ↑ mit der Wahrscheinlichkeitsamplitude
v k und vernichtet eines mit −k ↓ mit der Wahrscheinlichkeitsamplitude u k , er erhöht damit
insgesamt den Gesamtimpuls um k und den Gesamtspin um ħ⇑2. Setzen wir (13.5.59) in den
158
N. N. Bogoliubov, On a New Method in the Theory of Superconductivity, Zh. Experim. i Teor. Fiz. 34,
58 (1958), [Sov. Phys. JETP 7, 41 (1958)].
159
N. N. Bogoliubov, On a New Method in the Theory of Superconductivity, Nuovo Cimento 7, 794
(1958).
160
J. G. Valatin, Comments on the Theory of Superconductivity, Nuovo Cimento 7, 843 (1958).
866 13 Supraleitung
+ ∑ )︀ξ k (u k2 − v k2 ) + ∆ k u k v k∗ + ∆†k u ∗k v k ⌈︀ α k† α k
k
Wir wählen nun u k und v k so, dass nur noch diagonale Terme α k† α k und β†k β k auftauchen.
Dies erreichen wir für
2ξ k u k v k + ∆†k v k2 − ∆ k u k2 = 0 . (13.5.61)
Multiplizieren wir diese Gleichung mit ∆†k ⇑u k2 und lösen dann die daraus für ∆†k v k ⇑u k resul-
tierende quadratische Gleichung, so erhalten wir
∆†k v k ⌉︂
( ) = −ξ k ± ξ k2 + ⋃︀∆ k ⋃︀2 = −ξ k ± E k (13.5.62)
u k 1,2
mit
⌉︂
Ek = ξ k2 + ⋃︀∆ k ⋃︀2 . (13.5.63)
In (13.5.62) ist die Lösung mit dem negativen Vorzeichen vor der Wurzel physikalisch nicht
relevant, da sie maximaler statt minimaler Energie entspricht. Wir sehen ferner, dass die
Phasen von u k , v k und ∆ k miteinander verknüpft sein müssen, da die Größe auf der rechten
Seite von (13.5.62) reell ist. Die relative Phase der Koeffizienten u k und v k muss also fest
sein und der Phase von Ơk entsprechen. In vielen Darstellungen wird deshalb u k als reelle
Größe angenommen. In diesem Fall können wir v k = ⋃︀v k ⋃︀e ı φ schreiben und die Phase von v k
entspricht derjenigen von Ơk .
Mit dem aus (13.5.62) folgenden Ergebnis ⋃︀v k ⇑u k ⋃︀ = (E k − ξ k )⇑⋃︀∆ k ⋃︀ und der Normierungs-
bedingung ⋃︀u k ⋃︀2 + ⋃︀v k ⋃︀2 = 1 erhalten wir
1 ξk ∆†k
⋃︀v k ⋃︀2 = ⌊︀1 − }︀ u k v k∗ =
2 Ek 2E k
(13.5.64)
1 ξk ∆k
⋃︀u k ⋃︀ = ⌊︀1 + }︀
2
u∗k v k = .
2 Ek 2E k
161
Introduction to Superconductivity, M. Tinkham, McGraw-Hill, New York (1975).
13.5 Mikroskopische Theorie 867
𝒇 𝑻 = 𝑻𝒄
1.0
𝟐𝚫𝒌
ukvk , |vk| , |uk| , f(T=Tc)
𝟐 𝟐
𝒗𝒌 𝒖𝒌
0.8
2
Die beiden Wahrscheinlichkeiten ⋃︀u k ⋃︀ und ⋃︀v k ⋃︀ sind in Abb. 13.38 für T = 0 zusammen mit
2 2
Dies stellt eine Summe aus dem mittleren Molekularfeldterm H 0 und dem Beitrag des zwei-
komponentigen, effektiv nicht wechselwirkenden Fermionengases dar.
162
Die Zustandssumme eines idealen Fermi-Gases ist gegeben durch
Z = ∏ ∑ exp (−n k (є k − µ)⇑k B T) = ∏ (︀1 + exp (−(є k − µ)⇑k B T)⌋︀ .
k n k =0,1 k
13.5 Mikroskopische Theorie 869
Wir können nun die Energielücke ∆ k bestimmen, indem wir die freie Energie hinsichtlich
von Variationen von ∆ k minimieren. Wir fordern also163
∂ℱ ∂ℱ
=0 =0. (13.5.69)
∂∆ k ∂∆†k
∂E k e−E k ⇑k B T eE k ⇑k B T
g k† + ⌊︀ − }︀ = 0 (13.5.70)
∂∆ k 1 + e−E k ⇑k B T 1 + eE k ⇑k B T
und damit
tanh(E k ⇑2k B T)
g k† = ∆†k . (13.5.71)
2E k
Der Faktor tanh(E k ⇑2k B T)⇑2E k wird meist als Paarsuszeptibilität bezeichnet, da sie die
Empfindlichkeit des Elektronensystems bezüglich Paarbildung beschreibt. Verwenden wir
die Definition (13.5.29), so erhalten wir die BCS-Energielückengleichung
tanh(E k′ ⇑2k B T)
∆ k = − ∑ Vk,k′ ∆ k′ (13.5.72)
k′ 2E k′
Dies stellt einen Satz von Bestimmungsgleichungen für alle Variablen ∆ k dar. Da E k′ von ∆ k′
abhängt, sind die Gleichungen nichtlinear. Sie können numerisch oder, wie weiter unten für
den Fall schwacher Kopplung gezeigt wird, näherungsweise gelöst werden.
tanh(E k′ ⇑2k B T)
1 = V0 ∑ . (13.5.73)
k′ 2E k′
Für die Grenzfälle T → Tc und T → 0 können wir diese Gleichung einfach lösen.
Wir betrachten zuerst den Fall T → 0, für den tanh(E k′ ⇑2k B T) ≃ 1. Wir können ferner wie-
̃
derum die Paarzustandsdichte D(E) ≃ D(E F )⇑2 verwenden und damit die Summation in
163
Es handelt sich hierbei um eine Funktionalableitung. Es wird nur ein Term in der k-Raumsumme
herausgegriffen, wenn die Ableitung durchgeführt wird.
870 13 Supraleitung
Hierbei gilt die Näherung nur für den Fall schwacher Kopplung V0 D(E F ) ≪ 1. Wir erken-
nen sofort, dass Gleichung (13.5.75) große Ähnlichkeit mit dem Ausdruck (13.5.16) hat, der
die Energieänderung zweier Elektronen aufgrund ihrer Paarwechselwirkung angibt.
Für T → Tc geht E k → ⋃︀ξ k ⋃︀, das heißt, das Anregungsspektrum geht in das eines Normallei-
ters über. Ersetzen wir E k in (13.5.73) durch ⋃︀ξ k ⋃︀ und gehen von der Summation wiederum
zu einer Integration über, so erhalten wir mit x = ξ k ⇑2k B T
ħω D ⇑2k B Tc
D(E F )V0 tanh x
1= ∫ dx . (13.5.76)
4 x
−ħω D ⇑2k B Tc
Das Integral ergibt den Wert 2 ln(pħω D ⇑2k B Tc ), wobei p = 2eγ ⇑π ≃ 1.13 und γ = 0.5772 . . .
die Euler-Konstante ist. Damit erhalten wir für die kritische Temperatur den Ausdruck
Tabelle 13.3: Energielücke 2∆(T = 0) und kritische Temperatur Tc für einige Element-Supraleiter und
Verbindungen (Daten aus E. L. Wolf, Principles of Elektron Tunneling Spectroscopy, Oxford University
Press, Oxford (1985); R. D. Parks, Superconductivity, Marcel Dekker, New York (1969); Physik-Daten,
Superconductivity Data, Nr.19-1 (1982)).
Vergleichen wir das Ergebnis (13.5.77) mit dem Ausdruck (13.5.75) für die Energielücke
bei T = 0, so erhalten wir für das Verhältnis von ∆(0) und Tc
∆(0) π
= = 1.764 . (13.5.78)
k B Tc eγ
Diese Beziehung stellt eine Kernaussage der BCS-Theorie dar. Experimentell werden Wer-
te zwischen 1.5 und 2.5 gefunden (siehe Tabelle 13.3). Vor allem für klassische Supraleiter
wie z. B. Pb mit niedriger Debye-Frequenz werden meist Werte oberhalb von 1.764 gemes-
sen. Für diese Materialien ist die Wechselwirkungsstärke relativ groß, so dass die Annah-
me D(E F )V0 ≪ 1 keine gute Näherung mehr ist. Wir bezeichnen diese Supraleiter als stark
koppelnde Supraleiter.
Im Temperaturbereich 0 < T < Tc muss die Temperaturabhängigkeit durch numerische Lö-
sung des Integrals
ħω D
D(E F )V0 tanh(E k ⇑2k B T)
1= ∫ d ξk (13.5.79)
2 2E k
−ħω D
bestimmt werden.166 Das Ergebnis ist in Abb. 13.39 gezeigt. Wir erkennen, dass die Vorher-
sage der BCS-Theorie die experimentellen Daten gut beschreiben kann. Die Abweichungen
resultieren nicht aus Messfehlern, sondern aus der Tatsache, dass die bei der theoretischen
Beschreibung gemachte Näherung Vk,k′ = −V0 zu einfach ist. In der Nähe von Tc erhält man
∆(T) T 1⇑2
≃ 1.74 (1 − ) für T ≃ Tc . (13.5.80)
∆(0) Tc
⌋︂
Die Tc − T Abhängigkeit ist ein charakteristisches Ergebnis der Molekularfeld-Theorie.
Zum Beispiel erhält man für die Temperaturabhängigkeit der Magnetisierung eines Ferro-
magneten das gleiche Ergebnis.
166
B. Mühlschlegel, Die thermodynamischen Funktionen des Supraleiters, Z. Phys. 115, 313–327
(1959).
872 13 Supraleitung
1.0
0.8
BCS Theorie
Pb
/ (0)
0.6
Sn
In
0.4
Abb. 13.39: Temperaturabhängig-
keit der supraleitenden Energielücke 0.2
in Pb, Sn und In zusammen mit dem
nach der BCS-Theorie erwarteten Ver- 0.0
lauf (Daten aus I. Giaever, K. Meger- 0.0 0.2 0.4 0.6 0.8 1.0
le, Phys. Rev. 122, 1101–1111 (1961)). T / Tc
189
13.5.2.5 Grundzustandsenergie
Wir wollen jetzt noch die Absenkung der Energie beim Übergang in den supraleitenen Zu-
stand berechnen. Wir gehen dabei von (13.5.65) aus und berücksichtigen, dass der Beitrag
∑k E k )︀α k† α k − β†k β k ⌈︀ der Bogoliubov-Quasiteilchen keinen Beitrag sowohl bei T = 0 (keine
Quasiteilchen angeregt) als auch im Normalzustand liefert. Für den supraleitenden Zustand
bei T = 0 erhalten wir
∐︀ℋBCS ̃︀ = ∑ (ξ k − E k + g k† ∆ k ) . (13.5.81)
k
Die Energie des Normalzustandes ⌈︂ bei T = 0 können wir durch die Betrachtung des Grenz-
falls ∆ k → 0 erhalten. Mit E k = ξ k2 + ∆2k ≃ ⋃︀ξ k ⋃︀ ergibt sich
Hierbei haben wir ausgenutzt, dass ⋃︀ξ k ⋃︀ = −ξ k für ⋃︀k⋃︀ ≤ k F (Teilchen-Loch-Symmetrie). Die
Absenkung der Grundzustandsenergie für T = 0 erhalten wir nach einigen Rechenschritten
zu (siehe Anhang H.3 und R. Gross, A. Marx, D. Einzel, Festkörperphysik. Aufgaben und
Lösungen, Oldenbourg Verlag, München (2013))
1
E Kond (0) = ∐︀ℋBCS ̃︀ − ∐︀ℋn ̃︀ = − D(E F )∆2 (0) . (13.5.83)
4
Hierbei haben wir ⋃︀∆ k ⋃︀ = ∆ benutzt, um die Diskussion einfach zu halten. Die Energiedichte
erhalten wir, indem wir noch durch das Volumen teilen:
E Kond 1 D(E F ) 2
=− ∆ (0) . (13.5.84)
V 4 V
Verwenden wir noch D(E F )⇑V = 3n⇑2E F und die BCS-Beziehung ∆(0)⇑k B Tc = π⇑eγ =
1.76387699 (mit der Euler-Konstante γ = 0.5772 . . .), so ergibt sich
E Kond 3 ∆2 (0) 3π 2 (k B Tc )2 (k B Tc )2
=− n = − 2γ n = −1.167n . (13.5.85)
V 8 EF 8e EF EF
13.5 Mikroskopische Theorie 873
Hierbei ist n die Elektronendichte. Die Kondensationsenergie ist also von der Größenord-
nung (k B Tc )2 ⇑E F . Das Ergebnis (13.5.83) können wir intuitiv verstehen. Da die Verschmie-
rung der Besetzungswahrscheinlichkeit eines Zustandes bei T = 0 etwa ∆(0) beträgt, kann
am Paarwechselwirkungsprozess nur ein kleiner Anteil ∆(0)⇑E F aller Elektronen teilneh-
men. Da dieser Anteil der Elektronen im Mittel eine Energieabsenkung von etwa ∆(0) er-
fährt, ergibt sich eine Kondensationsenergiedichte ∼ ∆2 (0)⇑E F . Die Kondensationsenergie
bei T = 0 entspricht der Differenz der freien Enthalpien 𝒢n − 𝒢s = V B 2cth (0)⇑2µ 0 zwischen
dem normal- und supraleitenden Zustand, woraus wir
}︂
µ 0 D(E F )∆2 (0)
B cth (0) = (13.5.86)
2V
erhalten.
gegeben. Da ξ k beliebig sein kann, ergibt sich die minimale Anregungsenergie zu ∆ k . Wir
erkennen daraus sofort, dass die für den supraleitenden Zustand wichtige Größe ∆ k die
Energielücke für Anregungen aus dem Grundzustand beschreibt. Die zum Aufbrechen eines
Cooper-Paares notwendige Energie ist 2E k . Entfernen wir zum Beispiel ein Elektron mit k ↑
aus einem Paarzustand (k ↑, −k ↓), so bleibt ein ungepaartes Elektron mit −k ↓ zurück. Die
beiden ungepaarten Elektronen haben die gleiche Energie.
𝑻=𝟎
3
Ek / k
1
Abb. 13.40: Quasiteilchen-Anregungsener-
gie in der Nähe der Fermi-Energie. Die
0 gestrichelte Kurve zeigt die Anregungsener-
-4 -2 0 2 4 gie von Elektronen und Löchern in einem
k / k Normalleiter.
190
874 13 Supraleitung
Das Ergebnis (13.5.87) stellt die Dispersionsrelation der Anregungen aus dem supraleiten-
den Grundzustand dar. Sie ist in Abb. 13.40 zusammen mit der Dispersionsrelation freier
Elektronen in einem normalleitenden Metall, E k = ξ k , dargestellt. Die Natur der Anregungen
aus dem supraleitenden Grundzustand ist nicht sofort einsehbar. Sie stellen im Allgemeinen
gemischte Zustände aus elektronen- und lochartigen Einteilchenanregungen dar und wer-
den als Quasiteilchen bezeichnet. Quasiteilchen mit ξ k > 0 haben elektronenartigen, solche
mit ξ k < 0 lochartigen Charakter. Für ξ k ≫ 0 und ξ k ≪ 0 liegen jeweils reine Elektronen und
reine Löcher vor. Für ξ k = 0 haben wir es mit einer gleichgewichtigen Überlagerung eines
Elektrons mit Wellenvektor k und eines Lochs mit Wellenvektor −k zu tun. Dies wird sofort
klar, wenn wir uns vor Augen führen, dass eine Einteilchenanregung in Zustand k nur dann
existieren kann, wenn der Zustand −k nicht besetzt ist, also ein Loch mit Wellenvektor −k
existiert. Wäre der Zustand −k nämlich besetzt, würde sich sofort ein Cooper-Paar bilden.
Die Zustandsdichte der Quasiteilchen in einem Supraleiter erhalten wir aus der Tatsache,
dass beim Übergang in den supraleitenden Zustand keine Zustände verloren gehen. Es muss
deshalb ∫ D s (E k )dE k = ∫ D n (ξ k )d ξ k = ∫ D n (ξ k )(d ξ k ⇑dE k )dE k gelten. In der unmittelba-
ren Nähe zur Fermi-Energie können wir in guter Näherung D n (ξ k ) ≃ D n (E F ) = const an-
nehmen und erhalten für T = 0 die Quasiteilchen-Zustandsdichte
)︀
d ξ k ⌉︀
⌉︀ D n (E F ) ⌉︂E 2 −∆ 2
⌉︀ Ek > ∆
Ek
für
D s (E k ) = D n (ξ k ) = ⌋︀ k . (13.5.88)
dE k ⌉︀⌉︀
⌉︀ Ek < ∆
]︀0 für
In Abb. 13.41a ist diese Zustandsdichte zusammen mit der Zustandsdichte eines Normallei-
ters gezeigt. Wir sehen, dass D s (E k ) bei E k = ∆ divergiert und für E k ≫ ∆ in die Zustands-
(a) 4 (b)4
Pb/MgO/Mg
𝚫 = 𝟏. 𝟑𝟒 meV
3 3 𝑻 = 𝟎. 𝟑𝟑 K
𝑫𝒔 𝑫𝒔
Ds / Dn(EF)
Ds / Dn(EF)
2 2
𝑫𝒏 𝑫𝒏
1 1
0 0
0 1 2 3 4 0 4 8 12
Ek / k E/
Abb. 13.41: (a) Zustandsdichte der Quasiteilchen als Funktion der Anregungsenergie E191k
in einem
Supraleiter bei T = 0. (b) Gemessene Zustandsdichte von Blei normiert auf die Zustandsdichte im
Normalzustand als Funktion der normierten Anregungsenergie. Die Messung wurde mit einem
Pb/MgO/Mg-Tunnelkontakt bei 0.33 K durchgeführt (nach I. Giaever, Phys. Rev. 126, 941 (1962)).
13.5 Mikroskopische Theorie 875
dichte des Normalleiters übergeht. Die Zustandsdichte wurde erstmals von Ivar Giaever167
mit Hilfe von Tunnelspektroskopie direkt gemessen.168 Das Ergebnis ist in Abb. 13.41b ge-
zeigt.
13.5.4 Quasiteilchentunneln
Da die Untersuchung der Zustandsdichte und die Bestimmung der Größe der Energielücke
häufig mit Hilfe von Tunnelexperimenten durchgeführt wird, diskutieren wir im Folgenden
das Tunneln von Quasiteilchen zwischen zwei Supraleitern, die durch eine dünne isolierende
Barriere getrennt sind. Die Tunnelprozesse führen zu einer endlichen Kopplung der beiden
Supraleiter, die wir mit dem Hamilton-Operator
ℋtun = ∑ Tkq c kσ
†
c qσ + c.c. (13.5.89)
kqσ
beschreiben können. Hierbei ist Tkq das Tunnelmatrixelement, das durch die Eigenschaften
†
der Tunnelbarriere bestimmt ist, und c kσ c qσ beschreibt die Erzeugung eines Elektrons mit
Wellenvektor k im einen und die Vernichtung eines Elektrons mit Wellenvektor q im anderen
Supraleiter (der Spin soll beim Tunnelprozess erhalten bleiben). Der konjugiert komplexe
Term beschreibt den umgekehrten Prozess.
Wir müssen jetzt allerdings beachten, dass die Elektronenzustände in einem Supraleiter
durch die Quasiteilchen-Erzeugungs- und Vernichtungsoperatoren ausgedrückt werden
müssen [vergleiche hierzu (13.5.58) und (13.5.59)]. Da das Tunneln in den Zustand k
nur dann möglich ist, wenn der Paarzustand (k ↑, −k ↓) nicht besetzt ist, ist die zuge-
hörige Tunnelwahrscheinlichkeit ∝ ⋃︀u k ⋃︀2 ⋃︀Tkq ⋃︀2 , da ja ⋃︀u k ⋃︀2 gerade die Wahrscheinlichkeit
dafür angibt, dass der Paarzustand unbesetzt ist. Zu dem Zustand k gibt es aber einen
weiteren Zustand k′ mit gleicher Quasiteilchenenergie E k = E k′ , aber mit ξ k′ = −ξ k .
Da ⋃︀u(−ξ)⋃︀ = ⋃︀v(ξ)⋃︀ (vergleiche Abb. 13.40), trägt das Tunneln in den Zustand k′ mit
der Wahrscheinlichkeit ∝ ⋃︀u k′ ⋃︀2 ⋃︀Tk′ q ⋃︀2 = ⋃︀v k ⋃︀2 ⋃︀Tk′ q ⋃︀2 bei. Machen wir die vernünftige
Annahme, dass ⋃︀Tkq ⋃︀2 = ⋃︀Tk′ q ⋃︀2 , da k und k′ beide nahe am gleichen Punkt der Fermi-
Oberfläche liegen, so ist die gesamte Tunnelwahrscheinlichkeit für diese beiden Kanä-
le ∝ (⋃︀u k ⋃︀2 + ⋃︀v k ⋃︀2 )⋃︀Tkq ⋃︀2 = ⋃︀Tkq ⋃︀2 . Das heißt, die Tunnelwahrscheinlichkeit hängt im Ge-
gensatz zu anderen Prozessen wie der Absorption von Ultraschall oder elektromagnetischer
Strahlung nicht von den Kohärenzfaktoren u k und v k ab. Diese wichtige Tatsache erlaubt
es uns, das Tunneln zwischen zwei Supraleitern durch ein einfaches Halbleiter-Modell zu
beschreiben (siehe Abb. 13.42). In diesem beschreiben wir ein normales Metall durch eine
kontinuierliche Verteilung von Zuständen mit Zustandsdichte D n (E). Den Supraleiter
stellen wir wie einen Halbleiter mit Energielücke 2∆ dar, indem wir die Quasiteilchenzu-
standsdichte (13.5.88) am chemischen Potenzial µ spiegeln. In diesem Fall geht für ∆ → 0
die Quasiteilchenzustandsdichte gerade in die Zustandsdichte eines normalen Metalls
167
Ivar Giaever, geboren am 5. April 1929 in Bergen, Norwegen. Er erhielt 1973 zusammen mit Leo
Esaki und Brian David Josephson den Nobelpreis für Physik für seine theoretischen Vorhersagen zu
den Eigenschaften eines Suprastromes durch eine Tunnelbarriere, insbesondere zu den Phänomenen,
die allgemein als Josephson-Effekte bekannt sind.
168
I. Giaever, Tunneling into Superconductors at Temperatures below 1 K, Phys. Rev. 126, 941 (1962).
876 13 Supraleitung
(a) 𝑬 (b) 𝑬
𝝁𝟏 𝟐𝚫 𝝁𝟐 𝝁𝟏 𝟐𝚫 𝟐𝚫 𝝁𝟐
𝒆𝑼
𝒆𝑼
N S S S
𝑫𝟏𝒏 𝑫𝟐𝒔 𝑫𝟏𝒔 𝑫𝟐𝒔
𝑬
𝑬
𝝁𝟏 𝟐𝚫
𝝁𝟏
𝟐𝚫 𝝁𝟐 𝟐𝚫 𝝁𝟐
𝒆𝑼 𝒆𝑼 S
N
𝑫𝟏𝒔
𝑫𝟏𝒏 S S
𝑫𝟐𝒔 𝑫𝟐𝒔
194
Abb. 13.42: Zum Quasiteilchentunneln zwischen (a) einem Normalleiter (N) und einem Supraleiter (S)
sowie (b) zwischen zwei Supraleitern für zwei unterschiedliche angelegte Spannungen U. Es sind die
Zustandsdichten nach links und rechts als Funktion der Energie aufgetragen. Die besetzten Zustände
sind farbig markiert. In (a) setzt ein starker Stromanstieg bei eU ≥ ∆ und in (b) bei eU ≥ 2∆ ein, da
hier eine große Dichte von besetzten Zuständen auf der einen einer großen Dichte von unbesetzten
Zuständen auf der anderen Seite gegenübersteht.
über. Bei T = 0 sind alle Zustände bis µ(0) = E F gefüllt, für T > 0 ist die Besetzungswahr-
scheinlichkeit durch die Fermi-Funktion gegeben. Wir weisen darauf hin, dass das einfache
Halbleiter-Modell nicht angewendet werden darf, wenn Paarzustände eine Rolle bei den
Tunnelprozessen spielen. Außerdem können mit ihm keine Interferenzeffekte zwischen den
beiden entarteten Transportkanälen beschrieben werden, die als Funktion der Spannung
oder der Probendicke169 auftreten können.
Im Rahmen des Halbleiter-Modells können wir den elastischen Tunnelstrom170 von einem
Metall 1 in ein Metall 2 schreiben als
∞
I 1→2 = C ∫ ⋃︀T⋃︀2 D 1 (E) f (E)D 2 (E + eU)(︀1 − f (E + eU)⌋︀ dE . (13.5.90)
−∞
Hierbei ist U die angelegte Spannung, C eine Proportionalitätskonstante und D 1,2 (E) sind
die jeweiligen Zustandsdichten der normal oder supraleitenden Metalle. Der Tunnelstrom
169
W. J. Tomasch, Geometrical Resonance in the Tunneling Characteristics of Superconducting Pb, Phys.
Rev. Lett. 15, 672–675 (1965).
170
Die Energie der tunnelnden Elektronen bzw. Quasiteilchen bleibt unverändert. Inelastische Tun-
nelprozesse, bei denen z. B. ein Energieaustausch mit der Tunnelbarriere stattfindet, werden hier
nicht behandelt.
13.5 Mikroskopische Theorie 877
ist also proportional zum Tunnelmatrixelement ⋃︀T⋃︀2 , das wir als spannungsunabhängig an-
genommen haben, und dem Produkt aus besetzten Zuständen D 1 (E) f (E) auf der einen und
unbesetzten Zuständen D 2 (E + eU)(︀1 − f (E + eU)⌋︀ auf der anderen Seite. Einen entspre-
chenden Ausdruck erhalten wir für den Tunnelstrom I 2→1 in die entgegengesetzte Richtung.
Der Nettotunnelstrom ergibt sich aus der Differenz zu
∞
I(U) = C ∫ ⋃︀T⋃︀2 D 1 (E)D 2 (E + eU)(︀ f (E) − f (E + eU)⌋︀ dE . (13.5.91)
−∞
−∞
= C⋃︀T⋃︀2 D n1 (E F )D n2 (E F )eU = G nn U . (13.5.92)
Wir sehen, dass der Tunnelstrom proportional zur anliegenden Spannung und unabhängig
von der Temperatur ist. Wir erhalten also eine Ohmsche Kennlinie, deren Steigung durch
den Leitwert G nn bestimmt ist.
Da die Zustandsdichte D s2 (E) bei T = 0 für e⋃︀U⋃︀ < ∆ verschwindet [vergleiche (13.5.88) und
Abb. 13.42a], verschwindet auch der Tunnelstrom in diesem Spannungsbereich. Für eU ≥ ∆
steigt der Tunnelstrom dann stark an, da hier eine große Dichte von besetzten Zuständen
im Normalleiter einer großen Dichte von unbesetzten Zuständen im Supraleiter gegenüber-
steht (siehe Abb. 13.43a). Für negative Spannungen wäre es genau umgekehrt, so dass eine
bezüglich U = 0 symmetrische Kennlinie resultiert.
Für den differentiellen Tunnelleitwert erhalten wir
∞
dI ns D s2 (E) ∂ f (E + eU)
G ns (U) ≡ = G nn ∫ ⌊︀− }︀ dE . (13.5.94)
dU D n2 (E F ) ∂(eU)
−∞
878 13 Supraleitung
N/S S/S
1.5 3
𝑻 > 𝑻𝒄 𝑻 > 𝑻𝒄
Ins / (Gnn/e) (0)
𝟎 ≤ 𝑻 ≤ 𝑻𝒄 𝟎 ≤ 𝑻 ≤ 𝑻𝒄
0.5 1
𝑻=𝟎 𝑻=𝟎
0.0 0
0.0 0.5 1.0 1.5 2.0 0 1 2 3 4
eU / (0) eU / (0)
Abb. 13.43: Strom-Spannungs-Charakteristiken für einen (a) NIS- und (b) SIS-Tunnelkontakt für T =
0 (durchgezogen) und 0 < T < Tc (gestrichelt) und T ≥ Tc (gepunktet).
D s2 (eU)
G ns (U) = G nn . (13.5.95)
D n2 (E F )
Wir können also durch Messung des Tunnelleitwerts bei tiefen Temperaturen direkt die Zu-
standsdichte des Supraleiters bestimmen. Bei endlichen Temperaturen beschreibt G ns (U)
die mit etwa ±2k B T verschmierte Zustandsdichte.
D s2 (E) ⎛ E ⎞
= R ⌈︂ . (13.5.96)
D n2 (E F ) ⎝ E 2 − ∆2 (E) ⎠
gegeben sein sollte. Falls ∆ reell und energieunabhängig ist, resultiert daraus wiederum der
BCS-Ausdruck (13.5.88). Im Falle von stark koppelnden Supraleitern wird ∆ allerdings kom-
plex und energieabhängig. Der komplexe Anteil kommt durch eine endliche Lebensdauer
der Quasiteilchenanregungen durch Zerfall unter Erzeugung von Phononen zustande. Die-
ser ist immer dann groß, wenn eine große Phononenzustandsdichte F(ω) und eine starke
171
J. R. Schrieffer, D. J. Scalapino, J. W. Wilkins, Effective Tunneling Density of States in Superconductors,
Phys. Rev. Lett. 10, 336–339 (1963).
172
D. J. Scalapino, J. R. Schrieffer, J. W. Wilkins, Strong-Coupling Superconductivity I, Phys. Rev. 148,
263–279 (1966).
13.5 Mikroskopische Theorie 879
Die resultierende Kennlinie ist in Abb. 13.43b gezeigt. Qualitativ können wir sagen, dass der
Tunnelstrom für 0 ≤ eU < 2∆ klein sein wird, da hier nur eine kleine Dichte von thermisch
angeregten Quasiteilchen in Supraleiter 1 bzw. eine kleine Dichte von freien Zuständen in
Supraleiter 2 vorhanden ist. Für T = 0 würde der Tunnelstrom in diesem Spannungsbereich
vollkommen verschwinden. Für negative Spannungen wäre es genau umgekehrt, so dass wir
eine bezüglich U = 0 symmetrische Kennlinie erhalten. Bei Spannungen eU ≥ 2∆ steigt der
Tunnelstrom dann stark an, da hier eine große Dichte von Quasiteilchenzuständen in Su-
praleiter 1 einer großen Dichte von freien Zuständen in Supraleiter 2 gegenübersteht (siehe
Abb. 13.42b).
festgelegt. Aus diesem Ausdruck können wir die Wärmekapazität C s = T(∂S s ⇑∂T) p,B ext ab-
leiten. Wir erhalten
∂ f (E k ) f (E k )
C s = −2k B T ∑ ln ( ). (13.5.99)
k ∂T 1 − f (E k )
173
G. M. Eliashberg, Interactions Between Electrons and Lattice Vibrations in a Superconductor, Zh.
Eksperim. i Teor. Fiz 38, 966 (1960); Soviet Phys. JETP 11, 696 (1960).
174
J. Carbotte, Properties of boson-exchange superconductors, Rev. Mod. Phys. 62, 1027–1157 (1990).
175
W. L. McMillan, J. M. Rowell, Lead Phonon Spectrum Calculated from Superconducting Density of
States, Phys. Rev. Lett. 14, 108–112 (1965).
880 13 Supraleitung
2 ∂ f (E k ) 2 1 d∆2k (T)
Cs = ∑− (E k − T ). (13.5.100)
T k ∂E k 2 dT
Der erste Term in der Klammer resultiert dabei aus der üblichen Umverteilung der Qua-
siteilchen auf die verfügbaren Energieniveaus bei einer Temperaturänderung, während der
zweite Term die Auswirkung der temperaturabhängigen Energielücke beschreibt, die zu ei-
ner Veränderung der Energieniveaus selbst führt. Die Größe
∞
1 ∂ f (E k ) 1 d ξk
Y(T) = ∑− = ∫ (13.5.101)
D(E F )V k ∂E k 4k B T cosh2 2kEBkT
−µ
ist dabei die so genannte Yosida-Funktion, welche die Temperaturabhängigkeit der normal-
fluiden Dichte n n (T) = nY(T) beschreibt.
Wir betrachten zuerst den Fall tiefer Temperaturen, T ≪ Tc , wo wir die Näherungen
d⋃︀∆ k ⋃︀2 (T)⇑dT ≃ 0 und f (E k ) ≃ exp(−E k ⇑k B T) verwenden können. Wir nehmen ferner
zur Vereinfachung wieder ⋃︀∆ k ⋃︀ = ∆ an. Führen wir die Summe in eine Integration über, so
ergibt sich176
⌈︂ ∞
D(E F ) 2 − ξ 2 −∆ 2 (0)⇑k B T
Cs ≃ ∆ (0) ∫ e dξ
kB T 2
0
∞
D(E F ) 2
∆ (0)e−∆(0)⇑k B T ∫ e−ξ ⇑2k B T d ξ .
2
≃ (13.5.102)
kB T 2
0
)︁⌊︂⌊︂⌈︂
⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ]︂⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ )︂
πk B T ∆(0)⇑2
π2
C n = γV T = D(E F )k B2 T , (13.5.103)
3
wobei γ der Sommerfeld-Koeffizient ist.
176
⌈︂ ⌈︂
Wir nehmen hier ∆2 + ξ 2 = ∆2 (︀1 + (ξ 2 ⇑∆2 )⌋︀ ≃ ∆2 und ∆2 + ξ 2 = ∆ 1 + (ξ 2 ⇑∆2 ) ≃ ξ 2 ⇑2∆ an,
da ∂ f (E k )⇑∂E k nur für sehr kleine Werte von ξ⇑∆ großes Gewicht hat.
13.5 Mikroskopische Theorie 881
(a) (b) 24
1 𝑻𝒄
∝ 𝟗. 𝟏𝟕 𝐞𝐱𝐩 −𝟏. 𝟓
/ T (mJ/K mol)
𝑻
16
2
cs / Tc
0.1
8
mol
Vanadium Vanadium 𝑩𝐞𝐱𝐭 = 𝟎
c
Zinn Vanadium 𝑩𝐞𝐱𝐭 > 𝑩𝐜𝐭𝐡
0.01 0
1 2 3 4 0 10 20
2
Tc / T T (K )
Abb. 13.44: (a) Temperaturabhängigkeit der spezifischen Wärme von Zinn und Vanadium. (b) Sprung
der elektronischen spezifischen Wärme von Vanadium bei Tc . Die spezifische Wärme im normallei-
tenden Zustand wird durch Unterdrückung der Supraleitung mit einem externen Feld B ext > B cth ge-
messen (nach M. A. Biondi, A. T. Forrester, M. P. Garfunkel, C. B. Satterthwaite, Rev. Mod. Phys. 30,
1109–1136 (1958)). 201
Der zweite Term in (13.5.100) ist für T < Tc endlich, da d∆2 (T)⇑dT endlich ist, und ver-
schwindet oberhalb von Tc . Dies resultiert in einem Sprung der Wärmekapazität bei Tc , der
gegeben ist durch
∞
D(E F ) d∆2 (T) −∂ f (E k )
∆C = (C s − C n )Tc = ( ) ∫ ( ) d ξk
2
2k B Tc dT ∂⋃︀ξ k ⋃︀
Tc −∞
Benutzen wir ∆(0) = 1.76k B Tc und die Näherung (13.5.80), so erhalten wir ∆C =
4.7D(E F )k B2 Tc und damit
∆C 4.7
= = 1.43 . (13.5.105)
C n π 2 ⇑3
Diese Vorhersage der BCS-Theorie stimmt mit den experimentellen Daten vieler schwach
koppelnder Supraleiter sehr gut überein (siehe Abb. 13.44). Ein weiteres Beispiel haben wir
bereits in Abb. 13.13 gezeigt.
Nachdem wir die Wärmekapazität C s (T) mit (13.5.100) bestimmt haben (dies muss nu-
merisch erfolgen), können wir C s (T) aufintegrieren, um die Änderung 𝒰n − 𝒰s der inne-
ren Energie sowie 𝒢n − 𝒢s der freien Enthalpie zu erhalten, wenn wir unter Tc abkühlen.
Bei T = Tc muss die innere Energie im normal- und supraleitenden Zustand gleich sein. Es
gilt also
Tc
Tc
Tc
+ 12 γV T 2
= 𝒰n (0) − 12 γV T 2 + pV . (13.5.109)
Wenn wir annehmen, dass beim Übergang in den supraleitenden Zustand das Gitter unver-
ändert bleibt (pV = const), erhalten wir für die Differenz der freien Enthalpien
1 1 T 2
𝒢n (T) − 𝒢s (T) = γV (Tc2 − T 2 ) = γV Tc2 ⌊︀1 − ( ) }︀ . (13.5.110)
2 2 Tc
B2
Da 𝒢n (T) − 𝒢s (T) gerade der Kondensationsenergie V 2µcth0 entspricht, erhalten wir
B 2cth 1 T 2 1 T 2
V = γV Tc2 ⌊︀1 − ( ) }︀ ≃ ∆2 (0)D(E F ) ⌊︀1 − ( ) }︀ . (13.5.111)
2µ 0 2 Tc 4 Tc
2
Hierbei haben wir die Sommerfeld-Konstante γV = π3 k B2 D(E F ) und ∆(0)⇑k B Tc = 1.764 be-
nutzt [vergleiche (7.2.8)]. Wir sehen also, dass wir bei Kenntnis von ∆(T) alle relevanten
thermodynamischen Größen eines Supraleiters berechnen können. Die erhaltenen Abhän-
gigkeiten entsprechen den in Abb. 13.11 und 13.12 gezeigten qualitativen Abhängigkeiten.177
Der Vorfaktor 14 ∆2 (0)D(E F ) ist die bereits oben diskutierte Kondensationsenergie bei T = 0
[vergleiche (13.5.83)].
177
Für B cth erhalten wir nach (13.5.111) die Temperaturabhängigkeit B cth (T) = B cth (0)(︀1 − (T⇑Tc )⌋︀.
Da wir zur Herleitung den Ausdruck (13.5.80) benutzt haben, der nur in der Nähe von Tc
gilt, weicht diese Abhängigkeit natürlich von der empirisch gefundenen Abhängigkeit B cth (T) =
B cth (0)(︀1 − (T⇑Tc )2 ⌋︀ ab. Berechnen wir B cth (T) mit Hilfe von (13.5.79) für 0 < T < Tc numerisch,
so finden wir Abweichungen von bis zu etwa 5% zwischen dem BCS-Ergebnis und der empirisch
gefundenen Abhängigkeit.
13.6 Josephson-Effekt 883
13.6 Josephson-Effekt
In Abschnitt 13.5.4 haben wir das Quasiteilchentunneln in einem Supraleiter-Isolator-Su-
praleiter (SIS) Kontakt diskutiert. Wir haben dabei aber das Tunneln von Cooper-Paaren
nicht diskutiert. Lange Zeit hat man geglaubt, dass das Tunneln von Cooper-Paaren zwar
möglich, aber unmessbar klein ist. Da bereits die Tunnelwahrscheinlichkeit von einzelnen
Elektronen typischerweise kleiner als 10−4 ist, erwartete man für das Tunneln eines Cooper-
Paares die extrem kleine Wahrscheinlichkeit von weniger als (10−4 )2 . Im Jahr 1962 durch-
brach Brian Josephson178 diese Denkweise. Er postulierte, dass die Tunnelwahrscheinlich-
keit von Cooper-Paaren genauso groß wie diejenige von ungepaarten Elektronen ist, da das
Tunneln von Cooper-Paaren einen kohärenten Prozess darstellt. Das heißt, wir sollten das
Tunneln von Cooper-Paaren nicht als zwei inkohärente Tunnelprozesse von zwei einzelnen
Elektronen, sondern als einen kohärenten Tunnelprozess des Paares betrachten, für den die
Tunnelwahrscheinlichkeit genauso groß ist wie für das Tunneln eines einzelnen Elektrons.
Analog können wir argumentieren, dass die makroskopische Wellenfunktion, welche die
Gesamtheit der supraleitenden Elektronen beschreibt, durch die Barriere tunnelt. Nur ein
Jahr später bestätigten Philip W. Anderson und John M. Rowell179 die Vorhersage von Bri-
an Josephson. Wir werden sehen, dass sie eine direkte Konsequenz der makroskopischen
Quantennatur des supraleitenden Zustandes ist.
𝒛 𝑾
I
1 2 𝒚
𝑳 Abb. 13.45: Schematische Darstellung der Geo-
S1 S2 metrie eines Josephson-Tunnelkontakts. Die
zwei Supraleiter mit Wellenfunktionen Ψ1 =
⌋︂ ⌋︂
Ψ1 = 𝑛𝑠,1 e𝑖𝜃1 𝟎 Ψ2 = 𝑛𝑠,2 e𝑖𝜃2 𝒙 n s,1 e ı θ 1 und Ψ2 = n s,2 e ı θ 2 werden über eine
𝒅 Tunnelbarriere der Dicke d gekoppelt.
178
Brian D. Josephson, Possible New Effects in Superconductive Tunnelling, Phys. Lett. 1, 251–253
(1962).
179
P. W. Anderson, J. M. Rowell, Probable Observation of the Josephson Superconducting Tunneling Ef-
fect, Phys. Rev. Lett. 10, 230–232 (1963).
180
Dynamics of Josephson Junctions and Circuits, K. K. Likharev, Gordon and Breach Science Publis-
hers, New York (1986).
884 13 Supraleitung
L. D. Landau und E. M. Lifschitz181 eingeführt wurden. Mit diesen Argumenten lassen sich
die beiden Josephson-Gleichungen aus den allgemeinen Ausdrücken für die Suprastrom-
dichte (13.3.20) und die Energie-Phasen-Beziehung (13.3.23) ableiten. Dies zeigt uns, dass
die Josephson-Gleichungen eine direkte Konsequenz der makroskopischen Quantennatur
des supraleitenden Zustandes sind.
181
L. D. Landau, E. M. Lifschitz, Lehrbuch der Theoretischen Physik, Bd. IX, Akademie-Verlag, Berlin
(1980).
13.6 Josephson-Effekt 885
gegeben ist. Die Integration erfolgt dabei in Richtung des Suprastromes, d. h. senkrecht zur
Barriere. Für die Geometrie in Abb. 13.45 erstreckt sich der Integrationspfad von Punkt 1
bei x = −d⇑2 nach Punkt 2 bei x = d⇑2.
1.0
𝑛𝑠 𝑥
∫ 𝛾 𝑥 d𝑥, 𝛾 𝑥 (arb. units)
0.5
ns /n
0.0
𝛾 𝑥
Abb. 13.46: Schematische Darstellung der Va-
-0.5 riation der Cooper-Paardichte n s und des ei-
chinvarianten Phasengradienten γ über den
∫ 𝛾 𝑥 d𝑥 Barrierenbereich (farbig hinterlegt) eines Jo-
-1.0 sephson-Kontakts, der sich in x-Richtung er-
-6 -4 -2 0 2 4 6 streckt. Ebenfalls gezeigt ist das Integral ∫ γdx
x (arb. units) des eichinvarianten Phasengradienten.
886 13 Supraleitung
Nach (13.6.1) erwarten wir, dass die Suprastromdichte J s nur eine Funktion von φ ist, das
heißt, J s = J s (φ). Da allerdings eine Phasenänderung von n ⋅ 2π (n = ganze Zahl) die Wel-
lenfunktionen Ψ1 und Ψ2 der Kontaktelektroden unverändert lässt, muss J s (φ) eine 2π-pe-
riodische Funktion sein:
J s (φ = 0) = J s (φ = n ⋅ 2π) = 0 (13.6.4)
gelten. Daraus können wir schließen, dass der Zusammenhang zwischen J s und φ im allge-
meinsten Fall die Form182
∞
J s (φ) = J c sin φ + ∑ J m sin(mφ) (13.6.5)
m=2
hat. Dabei ist J c die kritische oder maximale Josephson-Stromdichte, die durch die Stärke
der Kopplung zwischen den beiden Kontaktelektroden bestimmt wird. Gleichung (13.6.5)
stellt die allgemeine Formulierung der 1. Josephson-Gleichung dar. Sie wird auch als Strom-
Phasen-Beziehung bezeichnet, da sie die Suprastromdichte mit der Phasendifferenz ver-
knüpft. Eine weitergehende theoretische Behandlung zeigt, dass in den meisten Fällen –
insbesondere im Fall schwacher Kopplung der Kontaktelektroden – der zweite Term auf der
rechten Seite von (13.6.5) weggelassen werden kann, wodurch wir die Beziehung (vergleiche
hierzu Anhang H.4)
erhalten, die von Josephson in seiner ursprünglichen Arbeit abgeleitet wurde. Sie besagt:
Die Suprastromdichte über einen Josephson-Kontakt variiert sinusförmig mit der Phasen-
differenz φ zwischen den Kontaktelektroden.
Bisher haben wir eine homogene Suprastromdichte angenommen. Die Beziehung (13.6.6)
gilt aber auch bei einer inhomogenen Stromdichte lokal für jeden Punkt (y, z) der Kon-
taktfläche (siehe Abb. 13.45). Einen inhomogenen Kontakt können wir durch die kritische
Stromdichte J c (y, z) charakterisieren, mit der wir die Strom-Phasen-Beziehung zu
182
Wir könnten natürlich J s als Fourier-Reihe von Sinus- und Kosinus-Termen schreiben. Allerdings
erfordert (13.6.4), dass alle Koeffizienten der Kosinus-Terme verschwinden müssen.
13.6 Josephson-Effekt 887
∂θ 1
−ħ = ΛJ2 + q s ϕ + µ (13.6.9)
∂t 2n s s
in (13.6.8), erhalten wir
∂φ 1 Λ 2
=− ( )︀J (2) − J2s (1)⌈︀ + q s (︀ϕ(2) − ϕ(1)⌋︀ + (︀µ(2) − µ(1)⌋︀)
∂t ħ 2n s s
2
2π ∂
− ∫ A ⋅ dl . (13.6.10)
Φ 0 ∂t
1
Da J s über die Kontaktfläche kontinuierlich sein muss, gilt Js (2) = Js (1) und wir erhalten
mit q s = 2e und Φ 0 = h⇑2e
2
∫ (−∇ϕ̃ −
∂φ 2π ∂A
= ) ⋅ dl . (13.6.11)
∂t Φ 0 ∂t
1
Hierbei haben wir die Differenz des elektrochemischen Potenzials ϕ̃ = ϕ + µ⇑q s als Linien-
integral seines Gradienten ausgedrückt. Da der Term in Klammern gerade dem elektrischen
Feld E entspricht [vergleiche (13.3.17)], erhalten wir die 2. Josephson-Gleichung zu
2
∂φ 2π
= ∫ E(r, t) ⋅ dl . (13.6.12)
∂t Φ 0
1
Das Integral ∫1 E(r, t) ⋅ dl entspricht dem Spannungsabfall U über den Kontakt, weshalb die
2
∂φ 2π
= U (13.6.13)
∂t Φ 0
888 13 Supraleitung
12 𝑈 = 𝐼𝑅𝑛
8
I (mA)
0
2𝐼𝑐
-4
-8
Abb. 13.47: Strom-Spannungs-Kenn- 2Δ/𝑒
linie eines Nb/AlOx /Nb-Josephson- -12
Kontakts mit einer Kontaktfläche
von 380 µm2 bei T = 4.2 K (Quel- -4 -2 0 2 4
le: Walther-Meißner-Institut). U (mV)
207
f ω 1 MHz
= = ≃ 483.597 8525(30) . (13.6.15)
U 2πU Φ 0 µV
Ein Josephson-Kontakt kann deshalb als ein spannungsgesteuerter Oszillator betrachtet wer-
den, der zur Erzeugung hoher Frequenzen (etwa 500 GHz bei 1 mV) verwendet werden
kann. Ein Vergleich der Proportionalitätskonstanten 2e⇑h zwischen Frequenz und Span-
nung, die mit Josephson-Kontakten gewonnen wurden, die aus verschiedenen Materialien
hergestellt wurden, ergab eine extrem gute Übereinstimmung innerhalb von 2 × 10−16 .183 In
jüngeren Experimenten wurde sogar eine Übereinstimmung im Bereich von 10−19 gefun-
den. Die Größe 2e⇑h wurde deshalb von 1990 bis 2007 dafür benutzt, die Spannung über die
Frequenz zu definieren.184
Abb. 13.47 zeigt die Strom-Spannungs-Kennlinie eines Nb/AlOx /Nb-Josephson-Kontakts.
Zu erkennen ist der Josephson-Strom bei U = 0 mit einem Maximalwert von I c . Bei endli-
chen Spannungen oszilliert der Josephson-Strom sinusförmig, so dass sein zeitlicher Mit-
telwert verschwindet. Der für U > 0 gemessene Strom entspricht dann dem Quasiteilchen-
Tunnelstrom, den wir bereits in Abschnitt 13.5.4 diskutiert haben.
lautet dann
2eU 0 2eU 1
φ(t) = φ 0 + t+ sin(ω 1 t) . (13.6.16)
ħ ħω 1
Setzen wir dies in die Strom-Phasen-Beziehung (13.6.6) ein, so erhalten wir
2eU 0 2eU 1
J s (t) = J c sin ]︀φ 0 + t+ sin(ω 1 t){︀ . (13.6.17)
ħ ħω 1
Mit Hilfe der Fourier-Bessel-Reihe können wir diesen Ausdruck umschreiben in
∞
2eU 1 2eU 0
J s (t) = J c ∑ 𝒥n ( ) sin ]︀φ 0 + t ± n ω 1 t{︀ . (13.6.18)
n=0 ħω 1 ħ
Hierbei sind 𝒥n die Bessel-Funktionen erster Gattung und n ist eine ganze Zahl. In Experi-
menten misst man häufig nur den Gleichstromanteil von J s (t). Wir sehen, dass dieser immer
dann endlich wird, wenn das Argument der Sinus-Funktion zeitunabhängig wird, wenn also
ħω 1
U0 = n ⋅ (13.6.19)
2e
ist. Zwischen diesen Spannungswerten oszilliert J s (t) sinusförmig, so dass sein zeitlicher
Mittelwert verschwindet. Nehmen wir die Strom-Spannungs-Kennlinie eines Josephson-
Kontakts auf, so treten in ihr bei den durch (13.6.19) gegebenen Spannungswerten Strom-
stufen auf, deren Höhe durch die Besselfunktionen 𝒥n gegeben wird, in deren Argument die
Amplitude der Wechselspannung steht. Diese Stufen werden Shapiro-Stufen genannt.185
𝒙 𝒙 𝒕𝟏
𝒕𝟏
S1 𝒅
𝒅
Abb. 13.48: Josephson-Kontakt im
externen Magnetfeld: Der Strom fließt +𝝀𝐋 𝑩𝒚
Qa Pd
𝒛
𝒕𝟐
in x-Richtung und das äußere Ma- 𝟎 I
gnetfeld zeigt in y-Richtung. Die rote −𝝀𝐋 Qb Pc
𝒚
gestrichelte Linie markiert den ge- 𝑩𝒚
schlossenen Integrationspfad. Auf
der linken Seite ist der exponenti- S2
𝑰
elle Abfall der Magnetfeldstärke in 𝒕𝟐 𝑳
den Kontaktelektroden skizziert.
208
Um den Effekt des äußeren Magnetfeldes zu analysieren, bestimmen wir die Ände-
rung φ(Q) − φ(P) der eichinvarianten Phasendifferenz zwischen zwei Punkten P und Q
entlang der z-Achse, die durch einen infinitesimalen Abstand dz getrennt sein sollen. Wir
können diese berechnen, indem wir die Phasengradienten und Differenzen entlang der in
Abb. 13.48 markierten geschlossenen Schleife aufintegrieren. Dabei müssen wir fordern,
dass
(θ Q b − θ Q a ) + (θ Pc − θ Q b ) + (θ Pd − θ Pc ) + (θ Q a − θ Pd ) = 2π ⋅ n (13.6.20)
(n = ganze Zahl) ist. Zur Bestimmung der einzelnen Terme verwenden wir die Ausdrücke
für den eichinvarianten Phasengradienten [vergleiche (13.3.38)]
2π
∇θ = (ΛJs + A) (13.6.21)
Φ0
und die eichinvariante Phasendifferenz [vergleiche (13.6.2)]
2
2π
φ = θ2 − θ1 − ∫ A ⋅ dl . (13.6.22)
Φ0
1
Φ
φ(P) − φ(Q) = 2π . (13.6.23)
Φ0
Wir sehen, dass die normalisierte Änderung (︀φ(P) − φ(Q)⌋︀⇑2π der eichinvarianten Pha-
sendifferenz gerade durch den normalisierten magnetischen Fluss Φ⇑Φ 0 gegeben ist, der
den Kontakt zwischen den Punkten z und z + dz durchsetzt.
Da das Magnetfeld den Kontakt nur auf einer Dicke t B = d + λ L1 + λ L2 durchsetzt, beträgt
der vom Integrationspfad eingeschlossene Fluss
Φ = B y (d + λ L1 + λ L2 )dz = B y t B dz . (13.6.24)
13.6 Josephson-Effekt 891
∂φ 2π
= B y tB (13.6.25)
∂z Φ 0
und in analoger Weise für die y-Richtung
∂φ 2π
= − Bz tB . (13.6.26)
∂y Φ0
2π
∇φ(r, t) = t B (︀B(r, t) × ⧹︂
x⌋︀ (13.6.27)
Φ0
zusammenfassen, wobei ⧹︂
x der Einheitsvektor in x-Richtung, also senkrecht zur Kontaktflä-
che ist.
Die Integration von (13.6.25) ergibt
2π
φ(z) = B y t B z + φ0 , (13.6.28)
Φ0
wobei die Integrationskonstante φ 0 die Phasendifferenz bei z = 0 ist. Mit der Strom-Phasen-
Beziehung erhalten wir die Suprastromdichte
2π
J s (y, z, t) = J c (y, z) sin ( t B B y z + φ 0 ) = J c (y, z) sin (kz + φ 0 ) . (13.6.29)
Φ0
209
892 13 Supraleitung
Falls J c (y, z) räumlich homogen ist, ist i c (z) = const für −L⇑2 ≤ z ≤ +L⇑2 und i c (z) = 0
für ⋃︀z⋃︀ > L⇑2 (siehe Inset von Abb. 13.50). Die Funktion i c (z) entspricht also einer Spaltfunk-
tion und die in Abb. 13.50 gezeigte Magnetfeldabhängigkeit des maximalen Josephson-Stro-
mes I sm (B y ) entspricht dem Fraunhofer-Beugungsmuster für die Beugung an einem Spalt
der Breite L. Die Integration von (13.6.31) ergibt nämlich
∫︀∫︀∫︀ sin k L ∫︀∫︀∫︀ ∫︀∫︀∫︀ sin πΦ ∫︀∫︀∫︀
I sm (Φ) = I c ∫︀∫︀∫︀∫︀∫︀ k L 2 ∫︀∫︀∫︀∫︀∫︀ = I c ∫︀∫︀∫︀∫︀∫︀ πΦ 0 ∫︀∫︀∫︀∫︀∫︀ .
Φ
(13.6.32)
∫︀∫︀∫︀ 2 ∫︀∫︀∫︀ ∫︀∫︀∫︀ Φ 0 ∫︀∫︀∫︀
Hierbei ist Φ = B y t b L der magnetische Fluss, der den gesamten Kontakt durchsetzt und I c =
i c L. Die I sm (Φ) Abhängigkeit zeigt für Φ = n ⋅ Φ 0 Nullstellen. Wie Abb. 13.49c für n = 1
zeigt, fließt hier die Josephson-Stromdichte in den beiden Kontakthälften in entgegenge-
setzte Richtung und kompensiert sich gerade. Dies kann als destruktive Interferenz der Teil-
ströme in den beiden Kontakthälften aufgefasst werden.
1.0
𝒊𝒄
0.8
0.6
Is / Ic
m
Wir wollen abschließend noch darauf hinweisen, dass wir in der obigen Diskussion Magnet-
felder, die durch die in den Kontaktelektroden fließenden Ströme entstehen, vernachlässigt
haben. Dies ist nur für Josephson-Kontakte zulässig, deren Länge und Breite kleiner als die
charakteristische Längenskala
}︂
Φ0
λJ ≡ , (13.6.33)
2πµ 0 t B J c
die so genannte Josephson-Eindringtiefe sind. Solche Kontakte werden als klein oder kurz
bezeichnet. Das Verhalten von großen oder langen Kontakten ist wesentlich komplizierter
und soll hier nicht behandelt werden. Die Josephson-Eindringtiefe stellt die Längenskala
dar, auf der ein Josephson-Kontakt Magnetfelder abschirmen kann. Da die Supraleitung in
der Kontaktregion wesentlich schwächer ist als in den Kontaktelektroden, ist die Josephson-
Eindringtiefe wesentlich größer als die Londonsche Eindringtiefe.
man zwischen DC (direct current) und RF (radio frequency) SQUIDs. DC-SQUIDs187 , 188 , 189
bestehen aus zwei in einem supraleitenden Ring parallel geschalteten Josephson-Kontakten
und werden mit einem Gleichstrom betrieben. RF-SQUIDs190 , 191 bestehen aus einem supra-
leitenden Ring, in den nur ein Josephson-Kontakt eingebracht ist, und werden mit einem
zeitlich variierenden Fluss betrieben. Wir werden im Folgenden nur DC-SQUIDs diskutie-
ren.
13.6.4.1 DC-SQUIDs
Der prinzipielle Aufbau eines DC-SQUIDs ist in Abb. 13.51 gezeigt. Die beiden Joseph-
son-Kontakte sind parallel geschaltet und durch die supraleitende Schleife verbunden. Wir
nehmen an, dass beide Kontakte den gleichen kritischen Strom I c besitzen und durch die
Strom-Phasen-Beziehungen I s1 = I c sin φ 1 und I s2 = I c sin φ 2 beschrieben werden können.
Mit Hilfe des Kirchhoffschen Gesetzes erhalten wir192
φ1 − φ2 φ1 + φ2
I s = I s1 + I s2 = 2I c cos ( ) sin ( ). (13.6.34)
2 2
Die eichinvarianten Phasendifferenzen φ 1 und φ 2 sind nicht unabhängig voneinander, da
die gesamte Phasenänderung entlang der geschlossenen Schleife in Abb. 13.51 n ⋅ 2π sein
muss:
(θ Q b − θ Q a ) + (θ Pc − θ Q b ) + (θ Pd − θ Pc ) + (θ Q a − θ Pd ) = n ⋅ 2π . (13.6.35)
𝑰
𝑰𝟏 𝑰𝟐
𝑩
Qa 𝑰𝒔𝟏 = 𝑰𝒔𝟐 = Pd
Abb. 13.51: Prinzipieller Aufbau eines DC-SQUIDs: Qb 𝑰𝒄 𝐬𝐢𝐧 𝝋𝟏 𝑰𝒄 𝐬𝐢𝐧 𝝋𝟐 Pc
Supraleitende Schleife mit zwei Josephson-Kon-
takten in den beiden Armen der Schleife. Der
obere und untere Teil der Schleife kann mit den
Wellenfunktionen Ψ1 = Ψ1,0 exp(ıθ 1 ) und Ψ2 =
Ψ2,0 exp(ıθ 2 ) beschrieben werden. Die gestrichel-
te Linie zeigt den geschlossenen Integrationspfad.
187 211
R. C. Jaklevic, J. Lambe, A. H. Silver, J. E. Mercereau, Quantum Interference Effects in Josephson
Tunneling, Phys. Rev. Lett. 12, 159 (1964).
188
J. Clarke, A superconducting galvanometer employing Josephson tunnelling, Phil. Mag. 13, 115
(1966).
189
R. L. Forgacs, A. Warnick, Digital-Analog Magnetometer Utilizing Superconducting Sensor, Rev. Sci.
Instr. 18, 214 (1967).
190
J. E. Zimmermann, P. Thiene, J. T. Harding, Design and Operation of Stable rf-biased Superconduc-
ting Point-contact Quantum Devices, J. Appl. Phys. 41, 1572 (1970).
191
J. E. Mercereau, Superconducting Magnetometers, Rev. Phys. Appl. 5, 13 (1970).
192
Wir benutzen sin α + sin β = 2 sin ( α+β
2
) cos ( α−β
2
).
13.7 Kritische Ströme in Typ-II Supraleitern 895
Die einzelnen Beiträge können wir mit Hilfe von (13.6.21) und (13.6.22) bestimmen und
erhalten
Pc Qa
2π 2π 2π
φ1 − φ2 = − ∮ A ⋅ dℓ − ∫ ΛJs ⋅ dℓ − ∫ ΛJs ⋅ dℓ . (13.6.36)
Φ0 Φ0 Φ0
C Qb Pd
Das Ringintegral über A ergibt den in der Schleife eingeschlossenen Fluss Φ. Die Integra-
tion über Js erfolgt über dieselbe Integrationsschleife, enthält aber nicht die Teile über die
Barriere der Josephson-Kontakte. Nehmen wir an, dass die supraleitende Schleife wesentlich
dicker ist als die Londonsche Eindringtiefe λ L , so können wir immer einen Integrationspfad
weit im Inneren des Supraleiters finden, entlang dem Js = 0, so dass wir das Integral über Js
vernachlässigen können. Wir erhalten dann
2πΦ
φ2 − φ1 = . (13.6.37)
Φ0
Wir sehen, dass die Phasendifferenzen über die Josephson-Kontakte über den die Schleife
durchsetzenden Fluss aneinander gekoppelt sind. Mit (13.6.37) können wir (13.6.34) wie
folgt ausdrücken:193
Φ Φ
I s = 2I c cos (π ) sin (φ 1 + π ) . (13.6.38)
Φ0 Φ0
Nehmen wir vereinfachend an, dass Φ = Φ ext ,194 erhalten wir für den maximal möglichen
Suprastrom
Φ ext
I sm = 2I c ⋀︀cos (π )⋀︀ . (13.6.39)
Φ0
Wir erhalten also eine ⋃︀cos⋃︀-Abhängigkeit, die uns an das Beugungsmuster eines Doppel-
spalts in der Optik erinnert.
193
Wir benutzen (φ 1 + φ 2 )⇑2 = (︀2φ 1 + (φ 2 − φ 1 )⌋︀⇑2 = φ 1 + (φ 2 − φ 1 )⇑2.
194
In vielen Fällen müssen wir genauer Φ = Φ ext + Φ L benutzen, wobei Φ ext der Fluss aufgrund des
externen Feldes und Φ L derjenige aufgrund der in der Schleife fließenden Ströme ist. Der zweite
Beitrag kann nur dann vernachlässigt werden, wenn die geometrische Induktivität L der Schleife
klein gegen Φ 0 ⇑2I c ist.
896 13 Supraleitung
𝑱𝒄
𝑱𝒄 𝟎
hinsichtlich ihrer kritischen Temperatur und ihres kritischen Magnetfelds optimiert wer-
den, sondern auch hinsichtlich ihrer kritischen Stromdichte. Typ-I Supraleiter kommen
für technische Anwendungen, für die hohe kritische Ströme oder Magnetfelder benötigt
werden, nicht in Frage. Ihre thermodynamisch kritischen Felder B cth liegen weit unterhalb
von 1 T (vergleiche Tabelle 13.2) und mit Leitern aus Typ-I Supraleitern können ferner keine
hohen kritischen Ströme realisiert werden, da der Stromtransport nur an der Oberfläche
der Leiter innerhalb der Londonschen Eindringtiefe erfolgt (siehe hierzu Abschnitt 13.4.8).
Wesentlich besser geeignet sind Typ-II Supraleiter. Sie können obere kritische Felder B c2
oberhalb von 100 T besitzen und außerdem ist der Stromfluss im Mischzustand von Typ-II
Supraleitern nicht auf eine dünne Oberflächenschicht reduziert. Wir werden jetzt diskutie-
ren, welche physikalischen Prozesse die kritischen Stromdichten von Typ-II Supraleitern
bestimmen.
213
13.7 Kritische Ströme in Typ-II Supraleitern 897
(a) 𝝁𝟎 𝑯 (b)
𝝁𝟎 𝑯
−𝝁𝟎 𝑴
𝑩 −𝝁𝟎 𝑴
𝑩 𝑱𝒕
𝑱𝑴 𝑱𝑴 Abb. 13.54: Verlauf der Größen H, B,
𝒓 𝒓
M, J M und J t entlang des Querschnitts
eines supraleitenden Zylinders für
(a) verschwindende und (b) endliche
Transportstromdichte J t .
195
Wir haben gesehen, dass wir durch Abkühlen eines Hohlzylinders im Magnetfeld unter Tc und
anschließendem Ausschalten des Feldes in dem Zylinder einen zirkulierenden Strom einfrieren
können. Auch hier handelt es sich um einen Nichtgleichgewichtszustand. Der Zustand kann rela-
xieren, indem eingefangener Fluss aus dem Zylinder entweicht. Die Energiebarriere für das Ent-
weichen eines einzelnen Flussquants entspricht aber I c Φ 0 und beträgt bei I c = 1 A etwa 10−15 J, was
898 13 Supraleitung
13.7.2 Lorentz-Kraft
Wir wollen nun die Kraft berechnen, die auf eine isolierte Flusslinie aufgrund des endlichen
Transportstroms wirkt. Wie oben diskutiert und in Abb. 13.55 gezeigt, können wir die ge-
samte Stromdichte in eine homogene Transportstromdichte J t und eine um den Kern der
Flusslinie zirkulierende Stromdichte J M aufteilen. Die Lorentz-Kraft auf J M wirkt in radia-
ler Richtung und führt zu keiner Nettokraft in eine bestimmte Richtung. Die Lorentz-Kraft
auf J t is gegeben durch
FL = L ∫ J t × B dA . (13.7.1)
A
Hierbei ist L die Länge der Flusslinie und die Flächenintegration erfolgt senkrecht zur Fluss-
linie. Da die Transportstromdichte J t homogen ist, können wir sie vor das Integral ziehen
und erhalten
FL = LJ t × ∫ B dA = LJ t × Φ̂ 0 . (13.7.2)
A
)︁⌊︂⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ]︂⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ )︂
Φ̂ 0
Hierbei ist Φ̂ 0 ein Vektor der Länge Φ 0 , der in Richtung der Flussdichte B zeigt. Im Misch-
zustand eines Typ-II Supraleiters haben wir es nicht nur mit einer Flusslinie zu tun, sondern
mit einem Flussliniengitter mit der mittleren Flussdichte B = Φ̂ 0 n Φ , wobei n Φ die Dichte
der Flusslinien pro Flächeneinheit ist. Wir erhalten für diesen Fall die mittlere Kraft pro
Volumen zu
FL
fL = nΦ = Jt × B . (13.7.3)
L
(a) 𝑩 (b) 𝑩
+ =
𝝃
𝑱𝑴
𝑱𝒕
𝑭𝐧𝐞𝐭𝐭𝐨
𝑱𝒕 Flusslinien- 𝑱𝑴
kern
+ =
𝑭𝐧𝐞𝐭𝐭𝐨
Abb. 13.55: Perspektivische Ansicht (a) und Draufsicht (b) der Transportstromdichte J t und der um
den Kern einer Flusslinie zirkulierenden Stromdichte J M . In (b) sind die aus diesen Stromdichten re-
sultierenden Lorentz-Kräfte gezeigt. Es resultiert insgesamt eine Nettokraft nach unten.
wesentlich größer als k B T ≃ 10−22 J bei T = 4 K ist. Die Relaxation des Nichtgleichgewichtszustands
dauert deshalb praktisch unendlich lange.
215
13.7 Kritische Ströme in Typ-II Supraleitern 899
ℓ 𝑏 𝑩
𝑬
Da die Ströme durch die Ränder der Probe eingeschlossen sind und sich deshalb nicht bewe-
gen können, resultiert gemäß actio gleich reactio eine Bewegung des Flussliniengitters senk-
recht zur Stromrichtung. Wir weisen darauf hin, dass das Entstehen der Nettokraft äquiva-
lent zum Entstehen der Magnus-Kraft in der Strömungslehre ist. In Analogie zur Entstehung
der Magnus-Kraft können wir argumentieren, dass die Suprastromdichte in Abb. 13.55b an
der Unterseite der Flusslinie größer ist und deshalb dort die kinetische Energie größer ist. Bei
konstanter Gesamtenergie muss dort dann die potenzielle Energie kleiner sein, was zu einem
Gradienten der potenziellen Energie in vertikaler Richtung und deshalb zu einer Nettokraft
in diese Richtung führt. 216
d 1
EMF = − ∫ B ⋅ dA = ∮ (eE + evL × B) ⋅ dℓ , (13.7.4)
dt e
A ∂A
die durch die zeitliche Rate der Flussänderung in der in Abb. 13.56 gezeigten geschlossenen
Schleife gegeben ist. Aufgrund der Flusslinienbewegung mit Geschwindigkeit vL im Supra-
leiter tritt zwar ständig magnetischer Fluss in die geschlossenen Schleife ein, die Flussdichte
bleibt aber gleich, da dieselbe Flussmenge an anderer Stelle wieder austritt. Dadurch muss
die EMF verschwinden, wodurch wir
E = −vL × B = B × vL (13.7.5)
erhalten. Dieses elektrische Feld führt im Supraleiter zu einer endlichen Spannung paral-
lel zur Richtung des Transportstroms, was in einer ohmschen Verlustleistung resultiert. Wir
sehen also, dass ein Typ-II Supraleiter im Mischzustand einen endlichen Ohmschen Wider-
stand besitzt und deshalb keinen Dauerstrom tragen kann, es sei den wir verhindern die
Bewegung der Flusslinien. Wir werden weiter unten sehen, dass dies durch die Verankerung
von Flusslinien an Defekten erreicht werden kann.
Das Durchqueren einer einzelnen Flusslinie führt zu einer Phasendifferenz φ zwischen den
beiden Enden des Supraleiters von 2π. Haben wir N Flusslinien in der Probe der Länge ℓ und
Breite b, die sich mit der Geschwindigkeit v L bewegen, so können wir die zeitliche Änderung
der Phasendifferenz schreiben als
∂φ 2π Φ 2π
=N = , (13.7.6)
∂t δt Φ 0 b⇑v L
900 13 Supraleitung
wobei wir für die mittlere Durchquerungszeit δt = b⇑v L und N = Φ⇑Φ 0 verwendet haben.
Mit Φ = Bℓb erhalten wir daraus
∂φ 2π 2π 2eU
= Bv L ℓ = Eℓ = , (13.7.7)
∂t Φ0 Φ0 ħ
wobei wir (13.7.5) und Φ 0 = h⇑2e benutzt haben. Diese Beziehung entspricht der 2. Joseph-
son-Gleichung (13.6.12).
13.7.3 Reibungskraft
Wir nehmen zunächst an, dass keine Haftkräfte für die Flusslinien vorliegen. In diesem Fall
wird die durch die Lorentz-Kraft getriebene Bewegung der Flusslinien nur durch die viskose
Dämpfung verzögert. Wir können rein phänomenologisch eine Reibungskraft pro Längen-
einheit Fη ⇑L = −ηvL einführen, wobei η ein viskoser Reibungskoeffizient ist, dessen physi-
kalische Ursache wir noch klären müssen. Im stationären Zustand sind Reibungskraft und
Lorentz-Kraft (13.7.2) gleich, so dass
J t × Φ̂ 0 − ηvL = 0 (13.7.8)
gilt. Verwenden wir E = B × vL , so erhalten wir für den spezifischen Widerstand ρ f aufgrund
der Flussbewegung
⋃︀E⋃︀ BΦ 0
ρf = = . (13.7.9)
⋃︀J t ⋃︀ η
Wir sehen also, dass ρ f ∝ B, falls der Reibungskoeffizient unabhängig von B ist. Wir müssen
jetzt aber noch klären, welche physikalischen Prozesse den Reibungskoeffizienten bestim-
men. Hierfür gibt es zahlreiche Modellvorstellungen, von denen wir nur auf das einfache
Bardeen-Stephen Modell196 eingehen wollen. Weitergehende Modelle,197 , 198 , 199 die auf den
zeitabhängigen GL-Gleichungen basieren, wollen wir hier nicht diskutieren.
196
J. Bardeen, M. J. Stephen, Theory of the Motion of Vortices in Superconductors, Phys. Rev. 140, A1197
(1965).
197
A. Schmid, A time dependent Ginzburg-Landau equation and its application to the problem of resis-
tivity in the mixed state, Phys. Kond. Materie 5, 302–317 (1966).
198
C. Caroli, K. Maki, Fluctuations of the Order Parameter in Type-II Superconductors. I. Dirty Limit,
Phys. Rev. 159, 306 (1967).
199
C. Caroli, K. Maki, Fluctuations of the Order Parameter in Type-II Superconductors. II. Pure Limit,
Phys. Rev. 159, 316–326 (1967); siehe auch Phys. Rev. 164, 591 (1967); Phys. Rev. 169, 381 (1968).
13.7 Kritische Ströme in Typ-II Supraleitern 901
in einem Normalleiter. Dass der Radius des normalleitenden Kernbereichs durch die Ko-
härenzlänge ξ gegeben sein sollte, folgt aus der GL-Theorie. Mit der Zirkulationsgeschwin-
digkeit v s = ħ⇑m s r folgt aus (13.4.62) für den normalisierten Ordnungsparameter ⋃︀ψ⋃︀2 = 1 −
(m 2s ξ 2 v s2 ⇑ħ 2 ) = 1 − (ξ⇑r)2 . Wir sehen also, dass für r ≤ ξ die Zirkulationsgeschwindigkeit so
groß wird, dass ⋃︀ψ⋃︀2 = 0. Dasselbe folgt aus der Beziehung B c2 = Φ 0 ⇑2πξ 2 . Bei B c2 , wo der
Übergang in den normalleitenden Zustand stattfindet, füllen die normalleitenden Kernbe-
reiche mit Radius ∼ ξ gerade das ganze Probenvolumen aus. Diese Argumente zeigen, dass
die Annahme eines normalleitenden Flusslinienkerns mit Radius ∼ ξ vernünftig ist.
Aus Gleichung (13.7.9) folgt, dass ρ f ∝ B zunimmt. Aufgrund der eben gemachten Überle-
gungen erwarten wir, dass ρ f → ρ n für B → B c2 . Dies können wir mit dem Ansatz
B
ρf ≃ ρn (13.7.10)
B c2
beschreiben. Setzen wir dies in (13.7.9) ein, so ergibt sich für den Reibungskoeffizienten
Φ 0 B c2
η≃ . (13.7.11)
ρn
Dieses intuitiv abgeleitete Ergebnis kann durch die explizite Berechnung des lokalen elektri-
schen Feldes im supraleitenden Bereich mit Hilfe der 1. London-Gleichung und im normal-
leitenden Flusslinienkern mit Hilfe des Ohmschen Gesetzes abgeleitet werden.200
13.7.4 Haftkraft
Wir wollen nun diskutieren, wie die Flusslinien in einem Supraleiter verankert werden kön-
nen, um ihre Bewegung und die daraus resultierende Dissipation zu vermeiden. Die Fluss-
linienverankerung ist von großer technischer Bedeutung, da sie die erreichbaren kritischen
Stromdichten in Typ-II Supraleitern bestimmt. Ihre exakte Modellierung kann sehr kom-
plex sein, da im Allgemeinen ein elastisches Flussliniengitter mit einer statistisch verteilten
Anordnung von Haftzentren wechselwirkt. Wir werden im Folgenden nur klarmachen, wie
die Flusslinienverankerung prinzipiell funktioniert und wie effektive Haftzentren aussehen
müssen. Hierzu betrachten wir die Verankerung einer einzelnen Flusslinie.
Abb. 13.57 zeigt zwei Flusslinien, von denen eine durch drei grau markierte Bereiche mit re-
duzierter Kondensationsenergie läuft. Dies können zum Beispiel nichtsupraleitende Fremd-
phasen sein. Die Flusslinie modellieren wir als flexiblen Schlauch mit einem normalleiten-
den Kern mit Radius ξ. Durch das Einbringen einer Flusslinie in den Supraleiter erhöhen
wir die potenzielle Energie, da wir im gesamten Kernbereich der Flusslinie die Kondensa-
tionenergie verlieren. Für die Flusslinie, die durch die Bereiche mit reduzierter Kondensati-
onsenergie verläuft, ist die Erhöhung der potenziellen Energie allerdings wesentlich geringer.
Das bedeutet, dass die Flusslinie, die durch die Defekte verläuft, in einem Potenzialminimum
sitzt. Die resultierende Haftkraft ist durch den Gradienten des Potenzialverlaufs gegeben.
Der Potenzialverlauf senkrecht zur Flusslinienrichtung ist schematisch in Abb. 13.58 ge-
zeigt. An der Stelle des Materialdefekts besitzt die potenzielle Energie ein Minimum. Die
200
Introduction to Superconductivity, M. Tinkham, McGraw-Hill, New York (1975).
902 13 Supraleitung
Defekt
𝟐𝝃
Potenzialtiefe ist durch ∆E pot = ẼKond πξ 2 L D p gegeben, wobei ẼKond die Kondensationsener-
gie pro Volumeneinheit, L D die Länge, auf der die Flusslinie durch die Defekte verläuft,
und 0 ≤ p ≤ 1 ein Faktor ist, der die Reduktion der Kondensationsenergie im Defektbereich
angibt. Die Breite und der genaue Verlauf des Potenzialminimums wird durch die Breite r p
und die genaue Form der Materialdefekte bestimmt. Bei gegebenem Potenzialverlauf E pot (r)
können wir die resultierende Haftkraft angeben zu
∂E pot (r) ∆E pot
Fp = − ≈− . (13.7.12)
∂r rp
Wir sehen daraus sofort, dass wir die Haftkraft optimieren können, indem wir ∆E pot maxi-
mieren und r p minimieren. Bei vorgegebenen Materialparametern ẼKond und ξ eines supra-
leitenden Materials erreichen wir Ersteres durch Maximieren von L D und p. Das heißt, die
Flusslinie sollte auf einer möglichst großen Länge durch Defekte verlaufen und diese sollten
nicht supraleitend sein (p = 1). Letzteres muss durch das Maßschneidern der Defektegröße
erreicht werden. Eine untere Schranke für die Verkleinerung der Defekte bildet allerdings die
Kohärenzlänge ξ, da für r p < ξ die Tiefe ∆E pot der Potenzialmulde um den Faktor (r p ⇑ξ)2
verkleinert würde. Das optimale Haftzentrum wäre demnach ein normalleitender Zylinder
mit Radius r p ≃ ξ, der parallel zur Flusslinie ausgerichtet ist. Die Haftkraft pro Längeneinheit
wäre in diesem Fall
opt
Fp
≃ −ẼKond πξ . (13.7.13)
L
Wir sehen, dass wir in Typ-II Supraleitern mit großer Kondensationsenergiedichte hohe
Haftkräfte und damit hohe kritische Stromdichten im Mischzustand erreichen können. Die
kritische Stromdichte ist durch die Transportstromdichte J t gegeben, bei der die Lorentz-
Kraft FL ⇑L = J t × Φ̂ 0 gerade gleich der Pinning-Kraft Fp ⇑L ist.
𝑬𝐩𝐨𝐭
𝒓𝒑
Wir weisen abschließend darauf hin, dass die Berechnung von kritischen Strömen in Typ-II
Supraleitern weit über die oben gemachten einfachen Überlegungen hinausgeht. Es muss
dabei beachtet werden, dass die Flusslinien elastische Objekte sind, die untereinander und
mit den statistisch verteilten Haftzentren wechselwirken.201 Ferner muss die thermisch akti-
vierte Bewegung von Flusslinien berücksichtigt werden. Für diese ist nicht der Potenzialgra-
dient ∂E pot (r)⇑∂r sondern die Tiefe der Potenzialmulde im Vergleich zur verfügbaren ther-
mischen Energie, ∆E pot ⇑k B T, entscheidend. Wegen der höheren Einsatztemperaturen der
Hochtemperatur-Supraleiter spielt die thermisch aktivierte Flusslinienbewegung für diese
Materialien eine wichtige Rolle.202
201
A. I. Larkin, Yu. V. Ovchinnikov, Pinning in Type II Superconductors, J. Low Temp. Phys. 34, 409
(1979).
202
G. Blatter, M. V. Feigel’man, V. B. Geshkenbein, A. I. Larkin, V. M. Vinokur, Vortices in high-tem-
perature superconductors, Rev. Mod. Phys. 66, 1125–1388 (1994).
904 13 Supraleitung
203
M. Sigrist, Introduction to Unconventional Superconductivity, AIP Conference Proceedings Vol.
789(1), 165 (2005).
204
M. R. Norman, The Challenge of Unconventional Superconductivity, Science 332, 196-200 (2011).
205
M. Vojta, Quantum Phase Transitions, Rep. Prog. Phys. 66, 2069 (2003).
13.9 Kuprat-Supraleiter 905
13.9 Kuprat-Supraleiter
Seit der Entdeckung der Supraleitung spielt die Suche nach Materialien mit einer höheren
Sprungtemperatur eine wichtige Rolle. Ein supraleitendes Material, das bei Raumtempe-
ratur funktionieren würde und gleichzeitig noch hohe kritische Felder besitzen sowie ho-
he kritische Stromdichten ermöglichen würde, hätte ein riesiges Anwendungspotenzial, da
die aufwändige Kühlung mit Kryoflüssigkeiten wegfallen würde. Die Suche nach Materiali-
en mit höheren Sprungtemperaturen machte allerdings anfangs nur langsame Fortschritte.
Seit der Entdeckung der Supraleitung im Jahr 1911 in Quecksilber (Tc = 4.2 K) konnte die
Sprungtemperatur bis 1973 nur bis auf 23.2 K in Nb3 Ge206 gesteigert werden. Supraleitung
bei Raumtemperatur schien ein unerfüllbarer Traum und selbst das Erreichen von 77 K, der
Siedetemperatur von flüssigem Stickstoff, schien in weiter Ferne. Es gab ferner keine kla-
ren Konzepte, wie die Sprungtemperaturen gezielt durch Maßschneidern von Materialien
erhöht werden können und wenig ermutigende theoretische Vorhersagen, dass die maxi-
malen Sprungtemperaturen auf Werte von unter etwa 40 K beschränkt sein sollten. Um so
erstaunlicher war es, als J. G. Bednorz und K. A. Müller 1986 Supraleitung in dem oxidi-
schen System La-Ba-Cu-O bei Temperaturen von mehr als 30 K entdeckten.207 Als kurze
Zeit später von C. W. Chu und Mitarbeitern in YBa2 Cu3 O7 (Tc = 93 K) erstmals Supralei-
tung bei einer Temperatur oberhalb der Siedetemperatur von flüssigem Stickstoff (77 K) ge-
funden wurde,208 begann eine intensive Forschungsaktivität mit dem Ziel, Supraleiter mit
noch höheren Sprungtemperaturen nahe oder sogar oberhalb von Raumtemperatur zu fin-
den. Kurze Zeit später wurden tatsächlich in den Systemen Bi-Sr-Ca-Cu-O209 (Tc ≃ 110 K),
Tl-Ba-Ca-Cu-O210 (Tc ≃ 125 K) und Hg-Ba-Ca-Cu-O211 (Tc ≃ 136 K bei Atmosphärendruck,
165 K bei hohem Druck) noch höhere Sprungtemperaturen gefunden. Da diese Supraleiter
alle Kupferoxidebenen als Grundbausteine enthalten, werden sie als supraleitende Kupra-
te bezeichnet. Sie sind nicht nur interessant für Anwendungen sondern auch von grundle-
gendem physikalischen Interesse. Bis heute besteht noch kein Konsens über den Mechanis-
mus, der für die hohen Sprungtemperaturen in den Kuprat-Supraleitern verantwortlich ist.
Trotzdem können viele Aspekte ihres Verhaltens mit den bekannten Konzepten der BCS-
und GLAG-Theorie gut beschrieben werden. Wir werden im Folgenden ihre wesentlichen
Eigenschaften kurz vorstellen.
206
J. R. Gavaler, Superconductivity in Nb3 Ge films above 22 K, Appl. Phys. Lett. 23, 480 (1973).
207
J. G. Bednorz, K. A. Müller, Possible High Tc Superconductivity in the Ba-La-Cu-O System,
Z. Phys. B 64, 189 (1986).
208
M. K. Wu, J. R. Ashburn, C. J. Torng, P. H. Hor, R. L. Meng, L. Gao, Z. J. Huang, Y. Q. Wang,
C. W. Chu, Superconductivity at 93 K in a New Mixed-Phase Y-Ba-Cu-O Compound System at Am-
bient Pressure, Phys. Rev. Lett. 58, 908–910 (1987).
209
H. Maeda, Y. Tanaka, M. Fukutomi, T. Asano, A New High-Tc Oxide Superconductor without a Rare
Earth Element, Jpn. J. Appl. Phys. 27, L209 (1988).
210
Z. Z. Sheng, A. M. Hermann, Superconductivity in the rare-earth-free Tl-Ba-Cu-O system above li-
quid nitrogen temperature, Nature 232, 55 (1988).
211
A. Schilling, M. Cautoni, J. D. Guo, H. R. Ott, Superconductivity above 130 K in the Hg-Ba-Ca-Cu-O
system, Nature 363, 56 (1993).
906 13 Supraleitung
(a) (b)
CuO2 Cu CuO2
Ebene Ketten
Ba BaO
LaO O Lage
Lagen
La, Sr
CuO2 CuO2
Ebene Y Ebenen
Cu
LaO
Lagen BaO
O Lage
Ba
Abb. 13.59: Kristallstruktur CuO2 CuO2
Ebene Ketten
von (a) La2−x Srx CuO4 und c
(b) YBa2 Cu3 O7−δ . Die grünen b
Linien zeigen die Einheitszelle. a
13.9 Kuprat-Supraleiter 907
CuO2
CuO2 BaO
BaO TlO
TlO TlO
Cu
BaO BaO
O
CuO2 Ca CuO2
Ca Ba Ca
CuO2 Tl CuO2
Ca Ca Abb. 13.60: Lagenstruktur der Tl-basierten
c
Kuprat-Supraleiter TlBa2 Ca2 Cu3 O9 (Tl-1223)
CuO2 CuO2 und Tl Ba Ca Cu O (Tl-2223). Die grünen
b 2 2 2 3 10
Tl-1223 a Tl-2223 Linien zeigen die Einheitszelle.
LHB
O-𝟐𝒑𝒙 DOS DOS
Abb. 13.61: Zur elektronischen Struktur von Kuprat-Supraleitern: (a) Orbitaler Charakter der relevan-
ten Cu-3d x 2 −y 2 und O-2p x, y Zustände. (b) Die Kristallfeldaufspaltung und Hybridisierung der Cu-3d
Orbitale und O-2p Orbitale mit atomaren Energien є d und є p resultiert in einem antibindenden (AB),
nichtbindenden (NB) und bindenden Band (B). Das antibindende Cu-3d/O-2p-Hybridband spaltet
aufgrund von starken elektronischen Korrelationen in ein unteres (LHB) und oberes (UHB) Hubbard-
Band auf. Der Abstand U von LHB und UHB beträgt typischerweise 8 eV und ist wesentlich größer als
der Abstand ∆ zwischen dem NB-Band und dem UHB.
für x = 0 ein antiferromagnetischer Isolator ist. Die Ursache dafür liegt in starken Korrela-
222
Zhang-Rice Singulett.212 Ganz allgemein gilt, dass wir Ladungsträger in die CuO2 -Ebenen
dotieren, indem wir Dotieratome in die benachbarten Lagen einbauen. Dies ist ähnlich zu
modulationsdotierten Halbleiter-Heterostrukturen (vergleiche Abschnitt 10.4.1). Wir kön-
nen deshalb die Kuprat-Supraleiter als intrinsisch modulationsdotierte Systeme betrachten.
Die Ladungsträger können sich hier ungestört in den CuO2 -Ebenen bewegen, da in diese
selbst keine streuenden Dotieratome eingebaut werden.
Bei YBa2 Cu3 O7−δ wird die Dotierung durch Einbau von O-Atomen in die CuO-Ketten be-
werkstelligt. Da Y, Ba und O als Y3+ -, Ba2+ - und O2− -Ionen vorliegen, erwarten wir, dass
für δ = 0.5 Cu als Cu2+ -Ion vorliegt. Dies entspricht einem Loch pro Cu und somit hal-
ber Bandfüllung. Durch Einbau von zusätzlichem Sauerstoff in die CuO-Ketten können wir
dann eine Lochdotierung erzielen. Dies entspricht grob der experimentellen Beobachtung.
13.9.2.1 Fermi-Fläche
Die niederenergetischen Anregungen in der Nähe der Fermi-Energie können gut mit Band-
strukturrechnungen in lokaler Dichtenäherung (LDA) beschrieben werden. Dies gilt ins-
besondere für die Form der Fermi-Fläche.213 Eine wesentliche Vereinfachung kann dabei
dadurch erhalten werden, dass man eine isolierte CuO2 -Ebene betrachtet und nur die drei
relevanten Orbitale Cu-3d x 2 −y 2 , O-2p x und O-2p y berücksichtigt (siehe Abb. 13.62). Dies
führt zu einem zweidimensionalen Tight-Binding Modell. Das AB-Band beim chemischen
Potenzial können wir im Rahmen dieses Modells in zufriedenstellender Weise mit
ξ(k) = −2t(cos k x a + cos k y a) + 4t ′ cos k x a cos k y a − µ (13.9.1)
beschreiben. Hierbei ist a die Gitterkonstante der CuO2 -Ebene, t charakterisiert das nächs-
te Nachbar- und t ′ das übernächste Nachbarhüpfen (siehe Abb. 13.62). Gemessene Daten
für Bi-2212 können gut mit t = 250 meV und t ′ ⇑t = 0.35 gefitted werden. Für andere Kupra-
te ergeben sich ähnliche Werte. Das chemische Potenzial µ wird der jeweiligen Dotierung
angepasst.
Die 1. Brillouin-Zone mit der Fermi-Fläche einer einzelnen CuO2 -Ebene ist in Abb. 13.62
gezeigt. Die Fermi-Fläche umschließt die leeren Zustände um den M-Punkt bei (π, π). Die
Zahl der Ladungsträger entspricht dem Umgleichgewicht der Flächen um den M- und Γ-
Punkt (Differenz der weißen und rötlichen Fläche in Abb. 13.62). Bei Lochdotierung ist die
weiße Fläche um den M-Punkt, bei Elektrondotierung die rötliche Fläche um den Γ-Punkt
größer. Bei halber Bandfüllung (ein Elektron pro CuO2 ) sind diese Flächen gleich. Wie oben
bereits diskutiert wurde, erhalten wir in diesem Fall aufgrund elektronischer Korrelationen
kein metallisches Verhalten sondern einen antiferromagnetischen Isolator. Die experimen-
tell gemessene Banddispersion ergibt eine Fermi-Geschwindigkeit v F ≃ 2 × 105 m/s.214 Diese
ist wesentlich geringer als der aus einfachen Bandstrukturrechnungen erhaltene Wert und
belegt erneut die Bedeutung der starken Korrelationen in den Kuprat-Supraleitern.
212
F. C. Zhang, T. M. Rice, Effective Hamiltonian for the superconducting Cu oxides, Phys. Rev. B 37,
3759–3761 (1988).
213
A. Damascelli, Z. Hussain, Z.-X. Shen, Angle-resolved photoemission studies of the cuprate super-
conductors, Rev. Mod. Phys. 75, 473–541 (2003).
214
X. J. Zhou et al., High-temperature superconductors: Universal nodal Fermi velocity, Nature 423, 398
(2003).
910 13 Supraleitung
+𝝅 𝑴
t
Cu 𝚪
𝑿
O
𝒕′
−𝝅
−𝝅 𝒌𝒙 𝒂 +𝝅
Abb. 13.62: Zweidimensionale Fermi-Fläche einer idealisierten, einzelnen CuO2 -Ebene. Links ist der
orbitale Charakter (ohne Phasen) der beteiligten Cu-3d x 2 −y 2 und O-2p x , y Zustände mit den Hüpfam-
plituden t und t ′ gezeigt. Das rechte Bild zeigt die Fermi-Fläche (rote Linie) in der2241. Brillouin-Zone.
Bei halber Füllung würde man für t ′ = 0 die gestrichelte Raute erhalten (vergleiche Abb. 8.14).
13.9.2.2 Spin-Struktur
Wir wollen nun noch kurz die Spin-Struktur von undotiertem La2 CuO4 diskutieren.
Da t⇑U ≪ 1, können Elektronen wegen der starken Coulomb-Abstoßung nicht auf be-
nachbarte Plätze wandern. Allerdings ist innerhalb der Unschärfe-Relation ∆t ≤ ħ⇑U ein
virtuelles Hüpfen auf Nachbarplätze möglich, falls die Spins auf benachbarten Plätzen anti-
parallel ausgerichtet sind. Ansonsten würde das Pauli-Prinzip dies verbieten. Da das virtuelle
Hüpfen gemäß Störungsrechnung 2. Ordnung zu einer Energieabsenkung J ≃ −t 2 ⇑U führt,
ist eine anti-parallele Spin-Ausrichtung bevorzugt (antiferromagnetische Superaustausch-
Wechselwirkung, vergleiche Abschnitt 12.5.2.3). Undotiertes La2 CuO4 ist also ein antifer-
romagnetischer Isolator. Bei Elektrondotierung bringen wir zusätzliche Elektronen auf die
Cu-Plätze. Dadurch entfernen wir Spins auf den Cu-Plätzen, da wir jetzt zwei Elektronen
mit entgegengesetztem Spin in die 3d x 2 −y 2 -Orbitale packen müssen. Die damit verbun-
dene Verdünnung des Spin-Gitters führt zu einer Schwächung des antiferromagnetischen
Zustands, der für eine Dotierung oberhalb von etwa 10% vollkommen verschwindet. Bei
Lochdotierung bringen wir zusätzliche Löcher auf die O-Plätze. Dadurch zerstören wir die
antiferromagnetische Superaustausch-Wechselwirkung zwischen benachbarten Cu-Plätzen.
Da die dotierten Löcher nicht lokalisiert sind, verursacht bereits eine kleine Lochdo-
tierungen von wenigen Prozent eine vollständige Zerstörung des antiferromagnetischen
Zustands.
300
Nd2-xCexCuO4 La2-xSrxCuO4
200
Temperatur (K)
T*
100 AFM
Abb. 13.63: Generisches Pha-
sendiagramm von Kuprat-Su-
SL SL praleitern ausgehend von undo-
0
-0.3 -0.2 -0.1 0.0 0.1 0.2 0.3 tiertem (x = 0) Nd2−x Cex CuO4
n (e/CuO2) Dotierung p (h/CuO2) bzw. La2−x Srx CuO4 .
sammenhang
Tc (p)
≃ 1 − 82.6(p − 0.16)2 (13.9.2)
Tcmax
gefunden wurde. Hierbei ist p die Zahl der Löcher pro CuO2 . Das Maximum von Tc liegt
immer bei einer Lochdotierung von p ≃ 0.16, die maximale Sprungtemperatur Tcmax variiert
aber zwischen etwa 30 und 135 K in den verschiedenen Systemen. Auf der elektrondotierten
Seite sind die Verhältnisse ähnlich bis auf die Tatsache, dass sich die antiferromagnetische
Phase über einen breiteren und die supraleitende Phase einen schmäleren Dotierbereich er-
streckt. Ferner werden nur kritische Temperaturen bis etwa 30 K beobachtet. Die genauen
Ursachen dieser experimentellen Befunde sind bis heute noch unklar. Für den empirischen
Zusammenhang zwischen Dotierung n und Tc findet man215
Tc (n)
≃ 1 − 1320(n − 0.1466)2 . (13.9.3)
Tcmax
Im Dotierbereich bis etwa p = 0.2 existiert noch eine weitere charakteristische Tempera-
tur T ∗ (p), die als Pseudolückentemperatur bezeichnet wird. Diese Nomenklatur resultiert
aus der experimentellen Beobachtung, dass unterhalb von T ∗ (p) in der Photoelektronen-
Spektroskopie ein reduziertes spektrales Gewicht auf Teilen der Fermi-Fläche gemessen
wird.216 Dieses fehlende spektrale Gewicht manifestiert sich auch in Anomalien vieler
anderer Eigenschaften. Die physikalische Ursache der Pseudolücke wird noch kontrovers
diskutiert. Eine Möglichkeit ist, dass sich bei der Temperatur T ∗ zwar bereits Paarkorrelatio-
nen zwischen Ladungsträgern bilden, sich aber aufgrund von starken Phasenfluktuationen
ein Zustand mit makroskopischer Phasenkohärenz erst bei der niedrigeren Temperatur Tc
ausbilden kann. Abschließend weisen wir noch darauf hin, dass im Zwischenbereich zwi-
schen antiferromagnetischer Ordnung und Supraleitung bei tiefen Temperaturen ein so
genanntes Spinglas auftreten kann.
215
M. Lambacher, Doktorarbeit, Walther-Meißner-Institut, Technische Universität München (2008).
216
M. R. Norman, D. Pines, C. Kallin, The pseudogap: friend or foe of high Tc ?, Adv. Phys. 54, 715
(2005).
912 13 Supraleitung
217
D. Estève et al., Observation of the ac Josephson effect inside copper-oxide-based superconductors,
Europhys. Lett. 3, 1237 (1987).
218
C. E. Gough et al., Flux quantization in a high-Tc superconductor, Nature 326, 855 (1987).
219
S. E. Barrett et al., 63 Cu Knight shifts in the superconducting state of YBa2 Cu3 O7−δ (Tc = 90 K), Phys.
Rev. B 41, 6283 (1990).
220
N. E. Bickers, D. J. Scalapino, S. R. White, Conserving Approximations for Strongly Correlated Elec-
tron Systems: Bethe-Salpeter Equation and Dynamics for the Two-Dimensional Hubbard Model,
Phys. Rev. Lett. 62, 961 (1989).
221
P. Monthoux, A. V. Balatsky, D. Pines, Toward a theory of high-temperature superconductivity in the
antiferromagnetically correlated cuprate oxides, Phys. Rev. Lett. 67, 3448 (1991).
13.9 Kuprat-Supraleiter 913
Enthalpien machen wir in Analogie zu (13.3.59) den als Lawrence-Doniach Modell bezeich-
neten Ansatz:222
⎨ 2 ⎬
⎝ ħ 2 ⎛ ∂Ψn 2 ∂Ψn ⎞⎠⎠ ħ2
⎝ 2 2 1
∆𝒢 = ∑ ∫ d r ⎝α⋃︀Ψn ⋃︀ + β⋃︀Ψn ⋃︀ +
4
⋀︀ ⋀︀ + ⋁︀ ⋁︀ ⎠ + ⋃︀Ψn − Ψn−1 ⋃︀ .
2
⎝ ab ⎝ ⎠⎠
2 2m ∂x ∂y 2m s 2
n
⎪ ⎮ c
(13.9.4)
Hierbei sind m ab und m c die effektiven Massen parallel und senkrecht zu den CuO2 -Ebenen,
s der Abstand der CuO2 -Schichten,223 n ist der Schichtindex und die Ableitung ∂Ψ⇑∂z wur-
de durch den Differenzenquotient ⋃︀Ψn − Ψn−1 ⋃︀⇑s ersetzt. Um die Diskussion einfach zu hal-
ten, haben wir das Vektorpotenzial weggelassen. Beschreiben wir jede supraleitende Schicht
mit Ψn = ⋃︀Ψn ⋃︀e ı θ n und nehmen an, dass ⋃︀Ψn ⋃︀ für alle Schichten gleich ist, so können wir den
letzten Term auf der rechten Seite von (13.9.4) schreiben als
ħ2
⋃︀Ψn ⋃︀ (︀1 − cos(θ n − θ n−1 )⌋︀ .
2
(13.9.5)
2m c s 2
Wir sehen, dass dieser Term gerade einer Josephson-Kopplung der supraleitenden Schichten
entspricht.
Da für Längenskalen, die groß im Vergleich zu s sind, die Ableitung ∂Ψ⇑∂z gut dem
Differenzenquotienten ⋃︀Ψn − Ψn−1 ⋃︀⇑s entspricht, sehen wir sofort, dass wir in diesem Fall
den Ausdruck (13.9.4) durch eine GL-Gleichung mit elliptischer Anisotropie ausdrücken
können. Wir erhalten dann durch Variationsrechnung eine der 1. Ginzburg-Landau Glei-
chung (13.3.65) entsprechende Beziehung mit anisotroper Masse:
1 ħ 1 ħ
0= ( ∇ − q s A) ⋅ ( ∗ ) ⋅ ( ∇ − q s A) Ψ + αΨ + β⋃︀Ψ⋃︀2 Ψ . (13.9.6)
2 ı m ı
Dabei ist (1⇑m∗ ) der reziproke Massetensor mit den Hauptachsenwerten 1⇑m ab , 1⇑m ab
und 1⇑m c (Anisotropien in der ab-Ebene wollen wir hier vernachlässigen). Da die Kopp-
lung zwischen den supraleitenden Schichten schwach ist, gilt m c ≫ m ab .
Aufgrund der anisotropen Masse erhalten wir eine anisotrope Ginzburg-Landau Kohärenz-
länge [vergleiche (13.3.77)]
⟨ ⟨
⧸︂ ⧸︂
ξ ab (T) = ⧸︂
⟩ ħ2
, ξ c (T) = ⧸︂
⟩ ħ2
. (13.9.7)
2m ab ⋃︀α(T)⋃︀ 2m c ⋃︀α(T)⋃︀
⌈︂
Wir sehen, dass ξ ab,c ∝ 1⇑m ab,c . Da m c ≫ m ab erhalten wir deshalb ξ ab ≫ ξ c . Mit der
⌋︂
Beziehung B cth = Φ 0 ⇑ 8π ξλ L [vergleiche (13.3.82)] und der Tatsache, dass B cth bzw. die
⌈︂
Kondensationsenergie nicht anisotrop ist, folgt sofort, dass die Anisotropie der London-
schen Eindringtiefe gerade invers zu derjenigen der Kohärenzlänge ist, d. h. λ L,ab ∝ 1⇑m c ,
222
W. E. Lawrence, S. Doniach, in Proc. 12th Int. Conf. Low Temp. Phys., ed. E. Kanda, Tokyo, Keikagu
(1971), pp. 361.
223
Für Kuprate mit CuO2 -Mehrfachlagen in der Einheitszelle werden diese Mehrfachlagen als eine
einzelne supraleitende Schicht betrachtet.
914 13 Supraleitung
𝒄
𝝃𝒄 𝝀
𝒂𝒃
𝒂
Abb. 13.64: Querschnitt durch eine Fluss-
linie in einem anisotropen Supraleiter.
Die Flussline verläuft parallel zur b-Achse, 𝝃𝒂𝒃
die senkrecht auf der Papierebene steht. 𝝀𝒄
⌈︂
λ L,c ∝ 1⇑m ab und λ L,ab ≪ λ L,c . Dieses Ergebnis wird sofort evident, wenn wir uns klar
machen, dass λ L,c das Abschirmverhalten von Supraströmen beschreibt, die parallel zur c-
Achse fließen. Da die Kopplung in c-Achsenrichtung schwach ist, sind diese Abschirmströ-
226
me klein und deshalb die zugehörige Abschirmlänge groß. Abb. 13.64 zeigt als Beispiel den
Querschnitt durch eine Flusslinie, die parallel zur b-Achse verläuft. Für einen isotropen Su-
praleiter würden sich für den Flusslinienkern und die Abschirmströme kreisförmige Profile
ergeben. Für einen anisotropen Supraleiter ergeben sich dagegen elliptische Profile.
Das untere und obere kritische Feld ist proportional zu 1⇑λ 2L bzw. 1⇑ξ 2 , wodurch sich auch
für diese Größen Anisotropien ergeben. Da für Felder parallel zur c-Achse die Abschirm-
ströme nur innerhalb der ab-Ebene, für Felder parallel zur ab-Ebene dagegen sowohl
in ab- als auch in c-Richtung fließen, erwarten wir B c2,∥c ∝ 1⇑ξ 2ab und B c2,∥ab ∝ 1⇑ξ ab ξ c
sowie B c1,∥c ∝ 1⇑λ 2L,ab und B c1,∥ab ∝ 1⇑λ L,ab λ L,c . Die genauen Ausdrücke für die kritischen
Felder lauten
Φ0
B c1,∥c = ln(κ ab + 0.08) (13.9.8)
4πλ 2L,ab
Φ0 ⌋︂
B c1,∥ab = ln( κ ab κ c + 0.08) (13.9.9)
4πλ L,ab λ L,c
Φ0 Φ0
B c2,∥c = , B c2,∥ab = (13.9.10)
2πξ 2ab 2πξ ab ξ c
Φ0 Φ0
B cth = ⌋︂ = ⌋︂ . (13.9.11)
8πξ ab λ L,ab 8πξ c λ L,c
Diese Abhängigkeiten können wir einfach zusammenfassen, indem wir einen dimensions-
losen Anisotropieparameter γ einführen:
Für YBa2 Cu3 O7−δ wird γ ≃ 6 − 7, für Bi-2212 ein sehr hoher Wert weit oberhalb von 100
gefunden.
Die Kohärenzlängen können durch Messung der oberen kritischen Felder ermittelt werden.
Dabei tritt allerdings das Problem auf, dass die kritischen Felder bei tiefen Temperaturen
teilweise weit oberhalb von 100 T liegen und deshalb experimentell nicht zugänglich sind.
Es wird deshalb meist nur in der Nähe von Tc gemessen und der ξ(T = 0) Wert durch Ex-
trapolation ermittelt. Für YBa2 Cu3 O7 erhält man auf diese Weise B c2,∥c = 160 ± 25 T und
13.9 Kuprat-Supraleiter 915
900 45
für B c2,∥ab sehr hohe Werte um etwa 1000 T. Daraus ergibt sich ξ ab ≃ 1.4 ± 0.2 nm und ξ c ≃
0.2 ± 0.05 nm. Für die Londonsche Eindringtiefe wird λ L,ab ≃ 140 ± 10 nm und λ L,c ≃ 900 ±
70 nm gemessen. Für Felder parallel zur c-Achse ergibt sich daraus κ c ≃ 100. Die Kuprat-
Supraleiter sind demnach extreme Typ-II Supraleiter. Abb. 13.65 zeigt das untere und obere
kritische Feld von YBa2 Cu3 O7 für Felder parallel und senkrecht zur c-Achse.
Die für Kuprat-Supraleiter ermittelten kleinen Kohärenzlängen werden verständlich, wenn
wir den Ausdruck ξ BCS (0) = ħv F ⇑π∆(0) für die BCS-Kohärenzlänge betrachten. Die Fer-
mi-Geschwindigkeit v F ≃ 2 × 105 m/s ist aufgrund der geringen Ladungsträgerkonzentrati-
on (bei optimaler Dotierung etwa 0.16 Löcher pro Einheitszelle) und der effektiven Masse
von etwa 4m e klein, die Energielücke aufgrund der hohen Sprungtemperaturen groß. Für
YBa2 Cu3 O7 ist ∆ ab (0) ≃ 30 meV, so dass sich ξBCS,ab ≃ 1.3 nm in guter Übereinstimmung
mit dem aus B c2,∥c ermittelten Wert der Ginzburg-Landau Kohärenzlänge ergibt. Der große
Wert der Londonschen Eindringtiefe lässt sich wegen λ 2L ∝ 1⇑n s mit der geringen Ladungs-
trägerdichte verstehen. Für YBa2 Cu3 O7 ergibt p = 0.16/CuO2 eine Ladungsträgerdichte n ≃
1.8 × 1027 m−3 , woraus sich aus (13.3.6) unter Verwendung der freien Elektronenmasse λ L ≃
125 nm ergibt. Auch dieser Wert stimmt erstaunlich gut mit dem für B ∥ c gemessenen Wert
überein. In Tabelle 13.4 sind einige Daten zu dem Kuprat-Supraleiter YBa2 Cu3 O7 zusam-
mengefasst und mit den für Al und Nb3 Sn erhaltenen Werten verglichen.
Wir weisen abschließend darauf hin, dass die sehr kleinen Kohärenzlängen von Kuprat-Su-
praleitern zu einem Kohärenzvolumen ξ 2ab ξ c führen, das wesentlich kleiner ist als bei klas-
sischen Supraleitern. Während sich bei klassischen Supraleitern typischerweise 106 bis 107
Cooper-Paare innerhalb des Kohärenzvolumens befinden, sind es bei Kuprat-Supraleitern
nur noch etwa 10. Im Zusammenspiel mit den höheren Betriebstemperaturen führt dies
zu einem wesentlich stärkeren Einfluss von thermischen Fluktuationen. Im Rahmen der
Ginzburg-Landau Theorie kann die mittlere Fluktuationsamplitude des Ordnungsparame-
ters zu ∐︀⋃︀Ψ⋃︀2 ̃︀ ≃ k B T⇑⋃︀α⋃︀ξ 2ab ξ c angegeben werden. Sie wird also durch das Verhältnis von ther-
mischer Energie zur Kondensationsenergie des Kohärenzvolumens bestimmt. Thermische
Fluktuationen führen z. B. zu einer Verrundung des resistiven Übergangs in den supralei-
tenden Zustand oder des Sprungs in der spezifischen Wärme bei Tc . Sie resultieren im Zu-
sammenspiel mit der großen Anisotropie insgesamt in einem sehr komplexen Verhalten des
Mischzustands der Kuprat-Supraleitern, was wir hier nicht diskutieren wollen.
916 13 Supraleitung
13.9.3.2 Ordnungsparameter
Wir haben im vorangegangenen Abschnitt gesehen, dass die supraleitenden Eigenschaften
von Kuprat-Supraleitern gut im Rahmen einer anisotropen GLAG-Theorie beschrieben wer-
den können, ähnlich wie wir dies auch für andere anisotrope Supraleiter wie z. B. TaS2 tun
können. Es stellt sich die Frage, ob Kuprat-Supraleiter darüber hinausgehende Eigenschaf-
ten besitzen, die nicht mit denjenigen von anisotropen metallischen Supraleitern kompatibel
sind. Wir wollen im Folgenden zeigen, dass ein wesentlicher Unterschied hinsichtlich der
Symmetrie der Paarwellenfunktion besteht (vergleiche Abschnitt 13.5.1.3).
Konventionelle und unkonventionelle Paarung: Wir haben bereits gesehen, dass das
Paarpotenzial [vergleiche (13.5.29)]
nung unkonventionelle Paarung benutzen wir für Fälle, bei denen ∆ k eine niedrigere Sym-
metrie als die Kristallstruktur aufweist.
Betrachten wir die ursprüngliche Definition der Wechselwirkung [vergleiche (13.5.9)]
1 ı(k−k′ )⋅r
Vk,k′ = ∫ V (r)e dV , (13.9.14)
Ω
wobei r = r1 − r2 , so erkennen wir sofort, dass Vk,k′ im Allgemeinen von der Richtung k − k′
abhängt und deshalb [vergleiche (13.5.72)]
tanh(E k′ ⇑2k B T)
∆ k = − ∑ Vk,k′ ∆ k′ (13.9.15)
k′ 2E k′
eine Funktion der Richtung von k ist. Der Grad der Symmetrie von Vk,k′ wird sich somit in
der Symmetrie von ∆ k widerspiegeln.224 Wir müssen deshalb nach solchen Funktionen ∆ k
suchen, die nach der Gruppentheorie mit der Symmetrie von Vk,k′ kompatibel sind. Da wir
bereits wissen, dass in den Kuprat-Supraleitern eine Spin-Singulett-Paarung (S = 0) vorliegt,
müssen wir nach geraden Funktionen ∆(k) = ∆(−k) suchen. Für Systeme mit tetragonaler
Symmetrie wäre eine mögliche Lösung ein d-Wellen-Ordnungsparameter
∆m
∆k = (cos k y a − cos k x a) = ∆ m cos 2φ . (13.9.16)
2
Hierbei ist ∆ m der Maximalwert von ∆ k und φ der Winkel relativ zur k x bzw. Γ-X-Richtung
(vergleiche hierzu Abb. 13.62). Abb. 13.66 zeigt die k-Abhängigkeit eines s- und d-Wellen-
Ordnungsparameters mit den zugehörigen Zustandsdichten für die Quasiteilchenanregun-
gen. Wir sehen, dass der d-Wellen-Ordnungsparameter nicht mehr die volle Symmetrie ei-
nes tetragonalen Kristallgitters besitzt, da er nur noch eine zweizählige Drehachse hat. Für
einen Kuprat-Supraleiter mit tetragonaler Kristallstruktur (vierzählige Drehachse) wäre dies
also ein unkonventioneller Ordnungsparameter. Da für den d-Wellen-Ordnungsparameter
Knotenlinien mit verschwindender Amplitude der Paarwellenfunktion existieren, besitzt die
Zustandsdichte für die Quasiteilchenanregungen keine Lücke. Dies hat Auswirkungen auf
zahlreiche Messgrößen wie die Londonsche Eindringtiefe oder die spezifische Wärme, für
die bei tiefen Temperaturen anstelle einer exponentiellen Temperaturabhängigkeit Potenz-
gesetze erhalten werden.
Bevor wir auf die experimentelle Untersuchung von ∆ k in Kuprat-Supraleitern eingehen,
wollen wir ein anschauliches Argument dafür geben, wieso andere Symmetrien als die s-Wel-
lensymmetrie bevorzugt sein könnten. Falls zum Beispiel die Wechselwirkung einen stark
repulsiven Charakter bei kleinen und einen attraktiven bei großen Abständen hat, so sollte
die optimale radiale Abhängigkeit der Paarwellenfunktion eine kleine Amplitude für kurze
Teilchenabstände r haben. Dies wird automatisch von einer d-Wellensymmetrie erfüllt, für
welche die Wahrscheinlichkeitsamplitude für r → 0 mit r 2 gegen null geht. Falls die Wech-
selwirkung dagegen für r → 0 attraktiv ist, ist eine s-Wellensymmetrie optimal, für welche
die Wahrscheinlichkeitsamplitude für r → 0 endlich bleibt.
224
J. F. Annett, N. Goldenfeld, S. R. Renn, in Physical Properties of High Temperature Superconduc-
tors II, D. M. Ginsberg (Ed.), World Scientific, Singapore (1990), p. 571.
918 13 Supraleitung
𝑳=𝟎 2
𝒌𝒚
𝑺=𝟎 + 𝑳=𝟐 𝑳=𝟎
𝚫
𝑺=𝟎 𝑺=𝟎
+
+ 𝒌𝒙
Ds / Dn(EF)
1
𝑳=𝟐
𝑺=𝟎
𝒌𝒚
–
Abb. 13.66: s- und d-Wellen-Ord-
nungsparameter mit den zugehörigen 𝝋
Zustandsdichten für die Quasiteil- +
+ 𝒌𝒙
chenanregungen. Es wurde der Ein- 0
fachheit halber eine sphärisch symme- 0 1 2
trische Fermi-Fläche angenommen. – Ek / k
229
225
M. Sigrist, T. M. Rice, Paramagnetic Effect in High Tc Superconductors – A Hint for d-Wave Super-
conductivity, J. Phys. Soc. Jpn. 61, 4283 (1992).
226
M. Sigrist, T. M. Rice, Unusual paramagnetic phenomena in granular high-temperature supercon-
ductors – A consequence of d-wave pairing?, Rev. Mod. Phys. 67, 503 (1995).
13.9 Kuprat-Supraleiter 919
(a)
1.0
Is / Ic
0.5
0.0
-2 -1 0 1 2
/ 0
(b)
1.0
Is / Ic
0.5
0.0
-2 -1 0 1 2
/ 0
232
Hierbei ist Φ ext der in die SQUID-Schleife durch ein äußeres Magnetfeld eingekoppelte Fluss
und I c die Summe der kritischen Ströme der beiden Josephson-Kontakte. Für das π-dc-
SQUID mit einem 0- und einem π-Kontakt erwarten wir dagegen
Φ ext + Φ 0 ⇑2
I s (Φ ext ) = I c ⋁︀cos (π )⋁︀ , (13.9.18)
Φ0
wobei wir die zusätzliche π-Phasenschiebung durch den zusätzlichen Fluss Φ 0 ⇑2 berück-
sichtigt haben. Für die beiden SQUID-Konfigurationen sollten sich somit die in Abb. 13.67
gezeigten, gerade um ein halbes Flussquant gegeneinander verschobenen I s (Φ ext )-
Abhängigkeiten ergeben. Dies wurde experimentell von D. J. Van Harlingen und Mit-
arbeitern in der Tat gefunden und damit ein klarer Beleg dafür erbracht, dass die Kuprat-
Supraleiter einen d-Wellen-Ordnungsparameter besitzten.227 , 228
Betrachten wir das π-dc-SQUID, so erkennen wir sofort, dass für Φ ext =0 die Supraströme
über die beiden Josephson-Kontakte endlich sein müssen. Wären sie null, so würde sich
die Phase entlang der geschlossenen SQUID-Schleife um genau π ändern, was aber nicht
zulässig ist. Die Ströme müssen also endlich sein und genau so fließen, dass sich eine gesam-
227
D. A. Wollman, D. J. Van Harlingen, W. C. Lee, D. M. Ginsberg, A. J. Leggett, Experimental deter-
mination of the superconducting pairing state in YBCO from the phase coherence of YBCO-Pb dc
SQUIDs, Phys. Rev. Lett. 71, 2134 (1993).
228
D. J. Van Harlingen, Phase-sensitive tests of the symmetry of the pairing state in the high-temperature
superconductors – Evidence for d x 2 −y 2 symmetry, Rev. Mod. Phys. 67, 515 (1995).
920 13 Supraleitung
50
𝑴
40 1
15
30 𝝋
| (meV)
15 𝑿
𝚪
Abb. 13.68: Abhängigkeit der Amplitude
des Ordnungsparameters in Bi-2212 vom 20
1
Winkel φ relativ zur Γ-X-Richtung gemes-
sen mit winkelaufgelöster Photoelektronen- 10
Spektroskopie (nach H. Ding et al., Phys.
Rev. B 54, R9678 (1995)). Das Inset zeigt
die gemessene Fermi-Fläche (Symbole) in 0
0 15 30 45 60 75 90
einem Teil der 1. Brillouin-Zone (Symbole),
die Linie stellt einen Tight-Binding-Fit dar. (°)
234
te Phasenänderung von 0 ergibt. Dies wird dadurch erreicht, dass die Ströme in den beiden
Kontakten in entgegengesetzte Richtung fließen. Insgesamt ergibt sich daraus ein Ringstrom,
der einem Fluss von Φ 0 ⇑2 entspricht. Kühlen wir also ein π-dc-SQUID im Nullfeld ab, so
entsteht unterhalb von Tc ein spontaner Ringstrom, der einem Fluss von Φ 0 ⇑2 entspricht.
Dieser Fluss wurde von C. C. Tsui und Mitarbeitern tatsächlich nachgewiesen.229 Eine weite-
re Konsequenz des Vorzeichenwechsels des d-Wellen-Ordnungsparameters sind gebundene
Andreev-Zustände bei der Fermi-Energie, die mit Hilfe von Tunnelspektroskopie nachge-
wiesen werden können.230
Die Winkelabhängigkeit der Amplitude von ∆(k) kann mit winkelaufgelöster Photoelek-
tronen-Spektroskopie bestimmt werden.231 Das Ergebnis ist in Abb. 13.68 gezeigt. Die
gemessene Abhängigkeit stimmt gut mit der nach (13.9.16) erwarteten Winkelabhängig-
keit ⋃︀∆(φ)⋃︀ = ∆ m ⋃︀cos 2φ⋃︀ überein, die in Abb. 13.68 als durchgezogene Linie eingezeichnet
ist. Weitere Belege für die d-Wellensymmetrie des Ordnungsparameters liefern Messungen
der Londonschen Eindringtiefe bei T ≪ Tc . Während man für einen s-Wellen-Ord-
nungsparameter λ L (T) − λ L (0) ∝ exp(−∆⇑k B T) misst, erhält man für einen d-Wellen-
Ordnungsparameter λ L (T) − λ L (0) ∝ T.232 , 233 Dies resultiert aus den niederenergetischen
Quasiteilchenanregungen aufgrund der in bestimmte k-Richtungen verschwindenden
Amplitude des d-Wellen-Ordnungsparameters.
229
C. C. Tsui, J. R. Kirtley, C. C. Chi, Lock See Yu-Jahnes, A. Gupta, T. Shaw, J. Z. Sun, M. B. Ketchen,
Pairing Symmetry and Flux Quantization in a Tricrystal Superconducting Ring of YBa2 Cu3 O7−δ ,
Phys. Rev. Lett. 73, 593 (1994).
230
L. Alff, S. Kleefisch, U. Schoop, M. Zittartz, A. Marx, R. Gross, Andreev Bound States in High Tem-
perature Superconductors, Eur. Phys. J. B 5, 423–438 (1998); see also Phys. Rev. B 58, 11197 (1998).
231
H. Ding et al., Angle-resolved photoemission spectroscopy study of the superconducting gap anisotropy
in Bi2 Sr2 CaCu2 O8+x , Phys. Rev. B 54, R9678 (1995)
232
W. Hardy et al., Precision measurements of the temperature dependence of λ in YBa2 Cu3 O6.95 : Strong
evidence for nodes in the gap function, Phys. Rev. Lett. 70, 3999 (1993).
233
O. M. Froehlich, H. Schulze, R. Gross, A. Beck, L. Alff, Precision Measurement of the In-plane Pe-
netration Depth λ ab in YBCO Using Grain Boundary Josephson Junctions, Phys. Rev. B 50, R13894
(1994); see also Euro. Phys. Lett. 36, 467 (1996).
Literatur 921
Literatur
A. A. Abrikosov, On the Magnetic Properties of Superconductors of the Second Group, Zh.
Eksperim. Teor. Fiz. 32, 1142-1152 (1957); Sov. Phys. JETP 5, 1174 (1957).
A. A. Abrikosov, Fundamentals of the Theory of Metals, North-Holland, Amsterdam (1988)
A. A. Abrikosov, L. P. Gor’kov, I. E. Dzyaloshinskii, in Quantum Field Theoretical Models in
Statistical Physics, Pergamon Press, London (1965).
N. E. Alekseevskii, Yu. P. Gaidukov, Sov. Phys. JETP 2, 762 (1956).
L. Alff, S. Kleefisch, U. Schoop, M. Zittartz, A. Marx, R. Gross, Andreev Bound States in High
Temperature Superconductors, Eur. Phys. J. B 5, 423–438 (1998); see also Phys. Rev. B 58,
11197 (1998).
P. W. Anderson, The Josephson Effect and Quantum Coherence Measurements in Supercon-
ductors and Superfluids, in C. J. Gorter (ed.), Prog. Low Temp. Phys. 5, 5 (1967).
P. W. Anderson, J. M. Rowell, Probable Observation of the Josephson Superconducting Tunnel-
ing Effect, Phys. Rev. Lett. 10, 230–232 (1963).
J. F. Annett, N. Goldenfeld, S. R. Renn, in Physical Properties of High Temperature Supercon-
ductors II, D. M. Ginsberg (Ed.), World Scientific, Singapore (1990), p. 571.
J. Bardeen, Wave Functions for Superconducting Electrons, Phys. Rev. 80, 567 (1950).
J. Bardeen, L. N. Cooper, J. R. Schrieffer, Microscopic Theory of Superconductivity, Phys.
Rev. 106, 162–164 (1957).
J. Bardeen, L. N. Cooper, J. R. Schrieffer, Theory of Superconductivity, Phys. Rev. 108, 1175
(1957).
J. Bardeen, D. Pines, Electron-Phonon Interaction in Metals, Phys. Rev. 99, 1140 (1955).
J. Bardeen, M. J. Stephen, Theory of the Motion of Vortices in Superconductors, Phys. Rev. 140,
A1197 (1965).
S. E. Barrett et al., 63 Cu Knight shifts in the superconducting state of YBa2 Cu3 O7−δ (Tc = 90 K),
Phys. Rev. B 41, 6283 (1990).
C. P. Bean, J. D. Livingston, Surface Barrier in Type-II Superconductors, Phys. Rev. Lett. 12,
14 (1964).
J. G. Bednorz, K. A. Müller, Possible High Tc Superconductivity in the Ba-La-Cu-O System,
Z. Phys. B 64, 189 (1986).
N. E. Bickers, D. J. Scalapino, S. R. White, Conserving Approximations for Strongly Correla-
ted Electron Systems: Bethe-Salpeter Equation and Dynamics for the Two-Dimensional
Hubbard Model, Phys. Rev. Lett. 62, 961 (1989).
G. Blatter, M. V. Feigel’man, V. B. Geshkenbein, A. I. Larkin, V. M. Vinokur, Vortices in high-
temperature superconductors, Rev. Mod. Phys. 66, 1125–1388 (1994).
922 13 Supraleitung
Lange Zeit wurde geglaubt, dass alle möglichen Ordnungszustände und alle möglichen
Phasenübergänge durch gebrochene Symmetrien klassifiziert werden können. Nach der
Entdeckung des ganzzahligen (1980) und fraktionalen (1982) Quanten-Hall-Zustands und
der Entwicklung von chiralen Spin-Zuständen im Zusammenhang mit der Erklärung der
Hochtemperatur-Supraleitung wurde aber klar, dass diese Quantenzustände nicht durch
eine spontan gebrochene Symmetrie klassifiziert werden können. Ihre fundamentalen phy-
sikalischen Eigenschaften wie die quantisierte Hall-Leitfähigkeit werden vielmehr durch die
topologische Struktur des zugrunde liegenden quantenmechanischen Zustands bestimmt.
Das heißt, sie werden durch eine globale Größe beschrieben, die wir als topologische
Invariante bezeichnen und die nicht von den Details des jeweiligen Systems abhängt. Die
neuartige Ordnung nennen wir deshalb topologische Ordnung. Um uns dies anhand eines
Beispiels klarzumachen, betrachten wir einen Torus und ein Krug mit Henkel. Obwohl
beide sehr unterschiedlich ausschauen, besitzen sie die gleiche Topologie, da sie durch eine
kontinuierliche Umformung ineinander überführt werden können. Ein Krug ohne Henkel
hätte dagegen eine andere Topologie. Wir bezeichnen heute allgemein solche Zustands-
formen der kondensierter Materie, die durch eine topologische Ordnung charakterisiert
werden, die also nicht in das allgemeine Paradigma der Symmetriebrechung passen, als
topologischen Quantenmaterialien.
Bis heute wurden mehrere topologische Phasen gefunden. Neben den Spin-Ketten mit ganz-
zahligem Spin zählen hierzu insbesondere die topologischen Isolatoren, deren Entdeckung
das Feld der topologischen Quantenmaterialien stark belebt hat. Lange Zeit dachte man,
dass alle Bandisolatoren (vergleiche Abschnitt 8.4.3) prinzipiell äquivalent sind. Eine topo-
logische Bandtheorie sagt nun aber eine Vielzahl unterschiedlicher Klassen von Bandiso-
latoren voraus. Die Existenz einer nichttrivialen topologischen Ordnung in einem Isolator
führt zu charakteristischen physikalischen Eigenschaften. Die wohl bemerkenswerteste Kon-
sequenz ist die Existenz von Oberflächenzuständen, die keine Energielücke besitzen. Diese
führen dazu, dass topologische Isolatoren in ihrem Inneren zwar elektrisch isolierend, an
14.1 Geschichte und Grundlegende Aspekte 931
Die Erforschung topologischer Phasen ist zwar immer noch überwiegend grundlagenori-
entiert, es zeichnen sich aber auch Anwendungsmöglichkeiten in der Spintronik, der Su-
praleitung oder der Quanteninformationsverarbeitung ab.
David Thouless wurde am 21. September 1934 in Bearsden, Schottland geboren. Nach dem
Studium an der Cambridge University promovierte er 1958 an der Cornell University bei
Hans Bethe. Nach Aufenthalten an der UC Berkeley und der Cambridge University wurde
er 1965 Professor an der University of Birmingham. Nach einer weiteren Station an der Yale
University wurde er 1980 Professor an der University of Washington in Seattle. Er übertrug
zusammen mit Michael Kosterlitz grundlegende Konzepte der Topologie auf die Beschrei-
bung von Phasenübergängen. Später entwickelte er auch eine Theorie zur Erklärung des
Quanten-Hall-Effekts.
Duncan Haldane wurde am 14. September 1951 in London, England geboren. Er studier-
te an der Cambridge University, wo er 1978 bei Philip Anderson promovierte. Er arbeite
anschließend am Institut Laue-Langevin in Grenoble, der University of Southern Califor-
nia in Los Angeles, den Bell Laboratories in Murray Hill, der UC San Diego und seit 1990
an der Princeton University in New Jersey. Er verwendete Konzepte der Topologie zur Be-
schreibung von Materiephasen und Phasenübergängen. In den 1980er-Jahren erklärte er
die magnetischen Eigenschaften von Spin-Ketten.
Michael Kosterlitz wurde am 22. Juni 1943 in Aberdeen, Schottland geboren. Er studierte
an der Cambridge University und promovierte 1969 an der Oxford University. Kurz da-
nach beschäftigte er sich zusammen mit David Thouless an der University of Birmingham
mit grundlegenden Aspekten zu topologischen Quantenphasen. Im Jahr 1982 wurde er
Professor an der Brown University in Providence, Rhode Island.
ihrer Oberfläche aber elektrisch leitend sind. Außerdem gibt es Materialien, in denen Elek-
tronen mit entgegengesetzter Bewegungsrichtung eine entgegengesetzte Spin-Richtung be-
sitzen. Bewegen sich also z.B. gleich viele Elektronen in Vorwärts- und Rückwärtsrichtun-
932 14 Topologische Quantenmaterie
1
C. L. Kane, E. J. Mele, Z2 Topological Order and the Quantum Spin Hall Effect, Phys. Rev. Lett. 95,
146802 (2005); siehe auch Phys. Rev. Lett. 95, 226801 (2005).
2
L. Fu, C. L. Kane, E. J. Mele, Topological Insulators in Three Dimensions, Phys. Rev. Lett. 98, 106803
(2007).
3
M. König, S. Wiedmann, C. Brüne, A. Roth, H. Buhmann, L. W. Molenkamp, X.-L. Qi, S.-C. Zhang,
Quantum Spin Hall Insulator State in HgTe Quantum Wells, Science 318, 766-770 (2007).
4
B. A. Bernevig, T. L. Hughes, Topological Insulators and Topological Superconductors, Princeton
University Press (2013).
5
M. Franz, L. Molenkamp (Hg.), Topological Insulators, in Contemporary Concepts of Condensed
Matter Series, Vol. 6, Elsevier, Amsterdam (2013).
6
M. Z. Hasan, C. L. Kane, Topological Insulators, Rev. Mod. Phys. 82, 3045-3067 (2010).
14.2 Topologie und Bandstruktur 933
Das Integral läuft über die gesamte geschlossene Fläche A und G ist deren Gaußsche Krüm-
mung. Für eine Kugel mit Radius R, für die G = 1⇑R 2 , erhalten wir χ = 2, für den Torus
χ = 0 und den Doppeltorus χ = −2 (siehe Abb. 14.1). Zwei Flächen besitzen die gleiche Euler-
Poincaré-Charakteristik,7 wenn sie stetig ineinander umgeformt werden können. Für solche
mit unterschiedlichen Charakteristiken ist dies nicht möglich.8
α geändert hat. Wir erhalten also eine so genannte Holonomie, die den Vektor vor und nach
dem Transport unterscheidet und zwar nur aufgrund der Krümmung der Kugel. Würden
wir nämlich den umfahrenen Sektor der Kugel auf eine ebene Unterlage abflachen (siehe
Abb. 14.2, rechts), so würde der Normalenvektor ⧹︂ n immer aus der Papierebene heraus und
damit wegen dR × ⧹︂ n = 0 auch R immer in die gleiche Richtung zeigen. Der Winkel α beim
Paralleltransport auf der Kugeloberfläche ist gerade durch den von Γ umschlossenen halben
Raumwinkel Ω gegeben. Das Konzept des Paralleltransports kann auf beliebige Oberflächen
verallgemeinert werden.
𝜶
𝒏ෝ ෝ
𝒏 ෝ
𝒏 ෝ
𝒏
𝑹 𝑹
𝑹 𝑹
ෝ
𝒏 ෝ
𝒏
𝜶
Abb. 14.2: Paralleltransport ei- ෝ
𝒏 ෝ
𝒏
𝑹 𝚪 𝑹 𝑹 𝚪 𝑹
nes Vektors auf einer Kugel-
oberfläche. Rechts haben
wir den Kugelsektor auf eine
ebene Unterlage abgeflacht.
Wir müssen uns nun fragen, welche Rolle die Topologie bei der Klassifizierung von Pha-
senzuständen kondensierter Materie spielt. Die Antwort lautet: Es sind die Symmetrieei-
genschaften der elektronischen Bandstruktur im reziproken Raum, welche die topologische
Äquivalenz oder eben Nicht-Äquivalenz verschiedener Phasen festlegen. Es hat sich heraus-
gestellt, dass die Gesamtheit aller Valenzbänder eines Materials eine topologische Eigen-
schaft besitzt, die wir wiederum mit einer geeigneten topologischen Invarianten klassifi-
zieren können. Bei topologischen Isolatoren übernimmt die Rolle des Lochs bei unserem
geometrischen Beispiel (Torus, Krug) die Bandlücke, durch die das Material zum Isolator
wird. Wollen wir z.B. verschiedene isolierende Phasen hinsichtlich ihrer topologischen Ei-
genschaften klassifizieren, müssen wir untersuchen, ob wir ihre Valenzbänder kontinuier-
lich ineinander transformieren können, ohne dabei die Energielücke zu schließen.9 Falls das
möglich ist, würden alle isolierende Phasen die gleichen topologischen Eigenschaften be-
sitzen. Es hat sich aber gezeigt, dass dies nicht der Fall ist. Wir bezeichnen nun Isolatoren,
deren Valenzbänder nicht-triviale topologische Eigenschaften besitzen, als topologische Iso-
latoren. Solche mit trivialer Topologie sind die bekannten Bandisolatoren. Wir werden später
sehen, dass wir zur Klassifizierung von topologischen Phasen wie zur Klassifizierung geo-
metrischer Objekte eine geeignete topologische Kennzahl verwenden können.
9
Hierzu benutzen wir das Prinzip der adiabatischen Kontinuität. Zwei Isolatoren sind äquivalent,
wenn wir sie durch eine langsame Änderung des Hamilton-Operators adiabatisch ineinander
transformieren können. Dieser Prozess ist möglich, falls wir eine endliche Energielücke vorliegen
haben, welche die Zeitskala dafür angibt, wie langsam wir die adiabatische Transformation machen
müssen.
14.3 Berry-Phase und Chern-Zahl 935
Die Bandstruktur von Festkörpern haben wir bereits ausführlich in Kapitel 8 diskutiert. Für
kristalline Festkörper können wir aufgrund der Translationssymmetrie Einteilchenzustän-
de mit dem Kristallimpuls k bezeichnen und sie durch Bloch-Wellen Ψk (r) = e ık⋅r u k (r) mit
einer gitterperiodischen Funktion u k (r) beschreiben. Ein wesentlicher Aspekt der topolo-
gischen Bandtheorie ist es nun, topologisch verschiedene Hamilton-Operatoren ℋ mit Hil-
fe von topologischen Invarianten zu klassifizieren und damit unterschiedliche topologische
Phasen herauszupräparieren.
Entartung vorliegt, so dass sich die Energieniveaus nicht schneiden. Da dann maximal eine
zeitabhängige Phase aufgesammelt werden kann, können wir schreiben:
′ ′
⋃︀ψ(t)̃︀ = e− ħ ∫t0 ε m (t )d t e ıγ m (t) ⋃︀m(︀R(t 0 )⌋︀̃︀ .
ı t
(14.3.1)
Setzen wir dies in die Schrödiger-Gleichung ein, können wir die Phasendifferenz des Sys-
tems im Anfangs- und Endpunkt des Pfades bestimmen. Diese setzt sich zum einen aus der
wohlbekannten dynamischen Phase
t
1
φ m (t) = − ∫ ε m (t ′ ) dt ′ , (14.3.2)
ħ
t 0 ,Γ
die von einem Zustand mit Energie ε m (t) bei seiner Bewegung entlang dem Pfad Γ im be-
trachteten Parameterraum aufgesammelt wird, und zum anderen aus einer geometrischen
Phase
t
d
γ m (t) = ı ∫ ∐︀m(︀R(t ′ )⌋︀⋃︀ ⋃︀m(︀R(t ′ )⌋︀̃︀ ⋅ dt ′
dt
t 0 ,Γ
R(t) R(t)
durch. Für den geschlossenen Weg muss e−ı χ(t 0 ) = e−ı χ(t 0 +T) und damit χ(t 0 ) = χ(t 0 + T) +
2πn gelten, wobei n eine ganze Zahl ist. Mit (14.3.3) folgt dann sofort
Wir erkennen, dass sich die Berry-Phase für einen geschlossenen Pfad nicht wegeichen lässt.
Es ist ferner klar, dass das Berry-Potenzial Am von der Eichung abhängt und somit keine
14.3 Berry-Phase und Chern-Zahl 937
physikalische Observable ist. Sein Integral über einen geschlossenen Pfad, die Berry-Phase
γ m , ist aber eichinvariant bis auf Vielfache von 2π. Deshalb ist e ıγ m absolut eichinvariant und
besitzt Bezug zu physikalischen Observablen. Da für einen geschlossenen Pfad R(T) = R(0)
gilt, hängt die Berry-Phase im Gegensatz zur dynamischen Phase nicht von der Umlaufzeit
T ab, sondern nur von der Geometrie des Parameterraums und des darin gewählten Pfades.
Deshalb bezeichnen wir sie als geometrische Phase.
Das Linienintegral (14.3.3) können wir mit dem Stokesschen Theorem in ein Oberflächen-
integral über den Berry-Fluss oder die Berry-Krümmung (siehe hierzu Abb. 14.3)
𝑹𝒛
𝑭𝒎 𝑹
14.3.2 Chern-Zahl
Falls die Oberfläche S in (14.3.8) eine geschlossene Mannigfaltigkeit darstellt, verschwindet
der Randterm. Da der Randterm aber bis auf ganzzahlige Vielfache von 2π unbestimmt ist,
erhalten wir das Chern-Theorem
150
1
𝒞m = ∫ Fm (R) ⋅ n̂ d R .
2
(14.3.9)
2π
S
Es entspricht dem für die Klassifizierung von geometrischen Körpern verwendeten Gauß-
Bonnet-Theorem (14.2.1) und besagt, dass das Integral des Berry-Flusses (der Berry-
Krümmung) über eine geschlossene Mannigfaltigkeit in Einheiten von 2π quantisiert ist.
Die damit verbundene ganze Zahl 𝒞m ist die Chern-Zahl, die für das Verständnis von
Quantisierungseffekten eine wichtige Rolle spielt.
938 14 Topologische Quantenmaterie
𝒌𝒛
Berry-Fluss
Monopol
𝒌𝒚
Wir können den Ausdruck (14.3.9) in Analogie zur Elektrodynamik so interpretieren, dass
Fm (R) (die Krümmung einer Zusammenhangsform) einer „magnetischen Flussdichte“ ent-
spricht und Am (R) (die Zusammenhangsform selbst) seinem Vektorpotenzial. Die Chern-
Zahl 𝒞m entspricht dann dem gesamten Fluss von Fm (R) durch die Oberfläche S. Diesen
können wir uns durch einen magnetischen Monopol im Zentrum des von S umschlosse-
nen Körpers erzeugt denken (siehe Abb. 14.4). Die Berry-Phase und die Chern-Zahl sind
im Allgemeinen sehr nützlich zur Klassifizierung von geschlossenen Mannigfaltigkeiten im
Parameterraum.
Wir können nun das Chern-Theorem (14.3.9) dazu verwenden, um die topologischen Ei-
genschaften von Festkörpern zu klassifizieren. Hierzu benutzen wir die Tatsache, dass der
reziproke Raum aufgrund der periodischen Struktur von Festkörpern geschlossen ist. Wie
in Abb. 14.5 veranschaulicht ist, besitzt die 1D-Brillouin-Zone dieselbe Topologie wie eine
geschlossene Linie und die 2D-Brillouin-Zone dieselbe Topologie wie ein zweidimensiona-
ler Torus.11 Aufgrund der Gitterperiodizität sind die Anfangs- und Endpunkte der roten und
blauen Vektoren äquivalent, da sie sich um einen reziproken Gittervektor unterscheiden. Um
der Gitterperiodizität Rechnung zu tragen, müssten wir deshalb die Spitzen der Vektoren an
ihre Fußpunkte zurückbiegen. Dies ist bei der geschlossenen Linie und beim Torus erfüllt.
Der Integration über die Brillouin-Zone (BZ) entspricht also formal die Integration über ei-
ne geschlossene Mannigfaltigkeit und wir erhalten in Analogie zu (14.3.9) die topologische
Invariante (Chern-Zahl)
1
𝒞m = ∫ Fm (k) ⋅ n̂ d k ,
2
(14.3.10)
2π
BZ
die durch das Integral der Berry-Krümmung über die Brillouin-Zone gegeben ist. Summie-
ren wir 𝒞m über alle Valenzbänder auf, erhalten wir die Gesamt-Chern-Zahl
N
1 N
𝒞 = ∑ 𝒞m = ∑ ∫ Fm (k) ⋅ n̂ d k .
2
(14.3.11)
m=1 2π m=1
BZ
Wir erkennen sofort die Analogie zwischen Gleichung (14.2.1) und (14.3.10). Genauso wie
das Integral der Gaußschen Krümmung eine quantisierte topologische Invariante (Euler-
Poincaré-Charakteristik) zur Klassifizierung geometrischer Körper ist, trifft dies auch für
11
In d-Dimensionen besitzt die Brillouin-Zone die Topologie eines d-dimensionalen Torus T d , der
kurz d-Torus genannt wird.
14.3 Berry-Phase und Chern-Zahl 939
(a) 𝜺 (b) 𝝅 𝒌𝒚
+
𝒂
2D
Brillouin-
Zone
𝝅 𝝅 𝝅
− 1D + 𝒌𝒙 −
𝒂 𝒂 𝒂 𝝅 𝝅
⇔
Brillouin- − + 𝒌𝒙
𝒂 𝒂
Zone
⇔
das Integral der Berry-Krümmung (Chern-Zahl) zu, die wir zur Klassifizierung
151
der Topo-
logie der elektronischen Bandstruktur verwenden können. Das Beispiel zeigt, dass wir das
von der Mathematik entwickelte, zugegebenermaßen für Physiker vielleicht etwas gewöh-
nungsbedürftige Konzept der topologischen Invarianten zur eindeutigen Klassifizierung von
topologischer Materie benutzen können.
Wir verwenden jetzt die bisherige, allgemeine Betrachtung, um die Größen Berry-Potenzial,
Berry-Phase und Chern-Zahl für Bloch-Elektronen in der Brillouin-Zone zu diskutieren.
Wir gehen dabei von Bloch-Wellen ⋃︀m(r)̃︀ = e ık⋅r u m,k (r) mit einer gitterperiodischen Funk-
tion u m,k (r) = e−ık⋅r ⋃︀m(r)̃︀ aus (m ist der Bandindex). Die Brillouin-Zone kann als Parame-
terraum für den Hamilton-Operator ℋ(k) und die Funktionen ⋃︀u m (k)̃︀ als Basisfunktionen
betrachtet werden. Damit erhalten wir das Berry-Potenzial
mit der Berry-Krümmung Fm (k) = ∇k × Am (k). Falls die Fläche S geschlossen ist, ergibt
das Integral in (14.3.13) nach dem Chern-Theorem (14.3.10) 𝒞m ⋅ 2π. Nach der obigen Dis-
kussion liegt eine geschlossene Fläche genau dann vor, wenn wir über die gesamte Brillouin-
Zone integrieren. Wir können dann topologische Phasen hinsichtlich ihrer Gesamt-Chern-
Zahl 𝒞 unterscheiden, da diese als topologische Invariante unterschiedliche Topologien der
Bandstruktur beschreibt. Wir werden unten sehen, dass Phasen mit 𝒞 ≠ 0 durch lückenlose
Oberflächenzustände charakterisiert sind.
940 14 Topologische Quantenmaterie
⎛ sin θ cos(ωt) ⎞
B(t) = B 0 ⎜ sin θ sin(ωt) ⎟ . (14.3.14)
⎝ cos θ ⎠
Da das Spin- 12 -System dem Feld adiabatisch folgt, erhalten wir einen zeitunabhängigen
Wechselwirkungsterm µ B B0 ⋅ σ, wobei µ B das Bohrsche Magneton und σ der Vektor der
Paulischen Spin-Matrizen ist. Wir erhalten die normalisierten Eigenzustände (φ = ωt)
mit den zugehörigen Eigenenergien E± = ±µ B B 0 . Sie stellen Punkte auf der Oberfläche der so
genannten Bloch-Kugel dar. Berechnen wir die θ- und φ-Komponente des Berry-Potenzials
in Kugelkoordinaten (B 0 , θ, φ = ωt), so erhalten wir
Integrieren wir dies entlang einem geschlossenen Pfad Γ (B 0 = const, θ = const) im Para-
meterraum auf (siehe hierzu Abb. 14.6), ergibt sich
γ± (Γ) = ∮ A φ,± B 0 sin θdφ = W(Γ) π(1 ∓ cos θ) = W(Γ) 12 Ω(Γ) . (14.3.18)
Hierbei ist W(Γ) die Windungszahl des Pfades Γ und die Größe π(1 ∓ cos θ) entspricht
gerade dem halben Raumwinkel Ω(Γ), der durch den Pfad Γ umschlossen wird. Die bei
𝚪
𝑩
𝜽
𝝋 y
einen endlichen Wert hat. Wie wir anhand von Abb. 14.4 bereits veranschaulicht haben,
können wir uns diesen Fluss durch einen magnetischen Monopol im Zentrum der Kugel
erzeugt denken, der die Ladung ∓ 12 besitzt. Da die betrachtete Kugel den Radius B 0 hat,
entspricht FB,± bis auf einen Faktor 12 der Krümmung der Kugel, weshalb der Berry-Fluss
auch als Berry-Krümmung bezeichnet wird.
𝒓
𝑭
𝑹 Box Abb. 14.7: Zum Aharonov-Bohm-Effekt: Ein magnetischer
Fluss Φ ist in einem Schlauch eingeschlossen und in seiner
𝚪 Nachbarschaft befindet sich eine Box mit Teilchen der Ladung
Fluss-Schlauch q. Die Box wird adiabatisch entlang dem Pfad Γ um den Fluss-
Schlauch bewegt.
12
Wir benutzen in diesem Abschnitt a für das Vektorpotenzial, um Verwechslungen mit dem Berry-
155
Potenzial A zu vermeiden.
942 14 Topologische Quantenmaterie
gegeben sind. Das Integral verläuft dabei entlang einem Pfad innerhalb der Box. Da wir im-
mer eine Eichtransformation finden können, für die a in der Box verschwindet, sind die
Eigenenergien ε m unabhängig vom Vektorpotenzial.
Wir sehen, dass der Hamilton-Operator über das Vektorpotenzial von der Position R der Box
abhängt. Das bedeutet, dass der Parameterraum in unserem Beispiel der Ortsraum ohne den
Bereich des Fluss-Schlauches ist. Wir transportieren jetzt die Box adiabatisch entlang einem
geschlossenen Pfad Γ um den Schlauch herum. Mit dem Berry-Potenzial
q
A(R) = ı∐︀m(R)⋃︀∇R ⋃︀m(R)̃︀ = a(R) (14.3.22)
ħ
erhalten wir die Berry-Phase
q q
γ m (Γ) = ∮ A(R) ⋅ dℓ = ∮ a(R) ⋅ dℓ = ∫ B ⋅ n̂d r .
2
(14.3.23)
ħ ħ
Γ Γ F
Hierbei ist n̂ der Normalenvektor auf F. Die Berry-Krümmung F(R) = ∇R × A = ħ B ist pro-
q
Elektronengasen erklären. Haldane sagte 1983 vorher, dass Ketten aus ganz- und halbzah-
ligen Spins sich qualitativ unterschiedlich verhalten. Wir nennen heute Phasen, die nicht
anhand einer gebrochenen Symmetrie sondern anhand ihrer Topologie klassifiziert werden
können, topologische Phasen. Zu ihrer Charakterisierung verwenden wir eine topologische
Invariante wie die Chern-Zahl. Diese kann nur ganzzahlige Werte annehmen und ist durch
ein Integral über die Berry-Krümmung gegeben. Bei den Quanten-Hall-Phasen, die sich
durch eine von Null verschiedene Chern-Zahl auszeichnen, ist die Chern-Zahl direkt pro-
portional zur Hall-Leitfähigkeit.
14.4.1 Kosterlitz-Thouless-Übergang
Wir diskutieren zuerst den Kosterlitz-Thouless (KT) Phasenübergang, da er für die Entwick-
lung des Gebiets der topologischen Phasenübergänge historisch von großer Bedeutung ist.13
Nach dem Mermin-Wagner-Theorem (vergleiche hierzu auch Abschnitt 12.10.1.2) erwartet
man, dass es in ein- (1D) und zweidimensionalen (2D) Systemen für T > 0 keine langreich-
weitigen Ordnungszustände (z.B. in Form von Ferromagnetismus oder Antiferromagnetis-
mus) geben kann, solange diese isotrop sind (eine kontinuierliche Symmetrie besitzen). Dies
liegt an dem geringen Energieaufwand für die Anregung von langreichweitigen Fluktuatio-
nen, welche die Ordnung zerstören.14 Kosterlitz und Thouless zeigten nun aber, dass das
2D-XY-Modell einen topologischen Phasenübergang zeigt. Diesen wollen wir im Folgenden
näher erläutern.
Das XY-Modell wird durch den Hamilton-Operator
ℋXY = −J ex ∑ cos(θ i − θ j ) (14.4.1)
∐︀i j̃︀
definiert. Hierbei bezeichnet J ex die Kopplungskonstante, ∐︀i j̃︀ die Summation über nächste
Nachbarn und die Winkel 0 ≤ θ i, j ≤ 2π entweder die Richtung von XY-Spins oder die Phase
⌋︂
einer Supraflüssigkeit, die wir mit dem komplexen Ordnungsparameter ψ = ρ s e ı θ (ρ s =
Dichte, θ = Phase) beschreiben können. Wir erwarteten, dass thermische Fluktuationen für
dieses 2D-System einen Ordnungszustand verhindern. Um die Ursache dafür zu verstehen,
betrachten wir den Kontinuumsgrenzfall von (14.4.1):15
J ex
ℋXY = ∫ (︀∇θ(r)⌋︀ d r .
2 2
(14.4.2)
2
13
J.M. Kosterlitz, D.J. Thouless, Ordering, metastability and phase transitions in two-dimensional sys-
tems, J. Phys. C 6: Solid State Phys., 1181 (1973).
14
Bei T = 0 minimiert der ferromagnetische Zustand die Energie des Systems. Da alle Spin-
Richtungen gleichberechtigt sind, können wir aber alle Spins um einen bestimmten Winkel drehen
und das System hat noch immer die minimale Energie. Dies impliziert, dass wir mit minimalem
Energieaufwand Anregungen – so genannte Goldstone-Moden – erzeugen können.
15
Dieser Grenzfall wird auch als Gaußsche Spin-Wellen-Theorie bezeichnet. Wir nehmen an, dass
die Phase/Spin-Richtung sich zwischen benachbarten Plätzen nicht stark ändert. Wir können dann
cos(θ i − θ j ) ≃ 1 − 12 (θ i − θ j )2 benutzen. Die Summe über NN entspricht dem diskreten Laplace-
Operator, den wir durch partielle Ableitungen (θ i − θ j ) ≃ ∂ x θdr für zwei Plätze, die in x-Richtung
um eine Gitterkonstante voneinander entfernt sind, ausdrücken. Wir können also cos(θ i − θ j )
durch 1 − 12 (∇θ)2 d2 r ausdrücken. Den konstanten Term können wir in der Energie weglassen.
944 14 Topologische Quantenmaterie
(a) (c)
169
Vereinfachen wir weiter, indem wir −∞ ≤ θ ≤ ∞ annehmen, können wir die Spin-Spin-
Korrelationsfunktion
kB T
a 2π Jex
∐︀e ı(θ(r)−θ(0))
̃︀ ∼ ( ) (14.4.3)
r
ableiten, wobei a ein unterer Abschneideradius ist. Wir sehen, dass die Spin-Spin-
Korrelationsfunktion für r → ∞ gegen Null geht, wir also keine langreichweitige Ordnung
erhalten.16 Dies hätten wir auch nach dem Mermin-Wagner-Theorem erwartet.
Wir haben allerdings bei der Argumentation, die zu (14.4.3) führt, einen entscheidenden
Fehler gemacht. Wir haben nämlich in der verwendeten Kontinuumsnäherung die peri-
odische Natur von θ ignoriert. Kosterlitz und Thouless haben darauf hingewiesen, dass
dies gleichbedeutend damit ist, dass wir Wirbel vernachlässigen. Einen Wirbel, wie er in
Abb. 14.8(a) gezeigt ist, können wir durch eine Zirkulation oder Vortizität
1
V= ∮ ∇θ(r) ⋅ dℓ (14.4.4)
2π
Γ
charakterisieren, wobei Γ eine Konturlinie ist, die den Wirbelkern umschließt. Die Zirkula-
tion V misst die Zahl der vollen Drehungen der Spin-Richtung entlang des Pfades. Wirbel
mit entgegengesetzter Drehrichtung haben ein unterschiedliches Vorzeichen der Zirkulati-
on. Für die in Abb. 14.8(a) und (b) gezeigten rotationssymmetrischen Wirbel mit V = ±1
ist nach (14.4.4) ⋃︀∇θ(r)⋃︀ = 1⇑r und wir erhalten mit (14.4.2) die Energie für die Erzeugung
eines einzelnen Wirbels
L
J ex 1 2 2 L
εV = ∫ ( ) d r = πJ ex ln ( ) . (14.4.5)
2 r a
a
16
Im Unterschied zum 3D-Fall, für den man ein exponentielles Abfallen mit einer endlichen Korre-
lationslänge ξ erhält, erhalten wir für das 2D-XY-Modell ein Potenzgesetz.
14.4 Topologische Phasen und Phasenübergänge 945
Hierbei ist L die Größe des Systems und a ein unterer Abschneideradius, den wir als Radius
des Wirbelkerns auffassen können. Wir sehen, dass für große Systeme ε V sehr groß wird und
deshalb einzelne Wirbel nicht thermisch erzeugt werden können. Dies stimmt aber nicht für
die Erzeugung von Wirbel-Antiwirbel-Paaren (siehe Abb. 14.8c). Für ein Paar mit Position
R1 = 0 und R2 = d beträgt die Erzeugungsenergie für den physikalisch sinnvollen Fall a ≪
d≪L
L
J ex 1 1 2r ⋅ (r − d) d
E Vp = ∫ ( 2+ − 2 ) d2 r = 2πJ ex ln ( ) . (14.4.6)
2 r ⋃︀r − d⋃︀2 r ⋃︀r − d⋃︀2 2a
a
Das heißt, für ein Paar mit Abstand d ≪ L ist die Paarerzeugungsenergie wesentlich kleiner
als die Energie für die Erzeugung eines einzelnen Wirbels. Da Paare leicht thermisch er-
zeugt werden, stellt die Tieftemperaturphase ein Gas von Wirbelpaaren dar. Kosterlitz und
Thouless stellten nun fest, dass bei einer bestimmten Temperatur TKT diese Paare aufbre-
chen und wir einen Phasenübergang zwischen einer Phase mit gebundenen Paaren und ei-
ner mit aufgebrochenen Paaren erhalten. Sie benutzen eine sehr einfache Betrachtung, um
die Phasenübergangstemperatur TKT abzuschätzen. Sie nahmen an, dass die freie Energie
eines einzelnen Wirbels
L L2
F = ε V − T S = πJ ex ln ( ) − T k B ln ( 2 ) (14.4.7)
a a
beträgt, da es L 2 ⇑a 2 mögliche Positionen für einen Wirbel mit Fläche a 2 gibt und damit
die Entropie zu S = k B ln (L 2 ⇑a 2 ) abgeschätzt werden kann. Die Übergangstemperatur TKT
ergibt sich aus dem Gleichgewicht der beiden Beiträge in (14.4.7) zu
17
Wir können die Wirbel-Antiwirbelpaare auch als Paare von positiven und negativen Ladungen be-
trachten. Der KT-Phasenübergang entspricht dann einem Übergang von einer isolierenden Tief-
temperaturphase, in der keine freien Ladungen vorliegen, in eine Hochtemperaturphase, die einem
leitenden Plasma von frei beweglichen positiven und negativen Ladungen entspricht. Die Ladun-
gen können als die topologischen Defekte betrachtet werden. Weder die Paare noch die freien La-
dungen sind in den beiden Phasen langreichweitig geordnet.
946 14 Topologische Quantenmaterie
14.4.2.1 Klassifizierungsschema
Wenn wir ein Schema entwerfen müssen, nach dem wir topologische Phasen klassifizieren
können, so ist sicherlich eine Einteilung nach ihrer Raum-Zeit-Dimension und den erhalte-
nen Symmetrien (Zeitumkehrinvarianz, Ladungskonjugation, chirale Symmetrie) sinnvoll.
Heute stehen vor allem zwei- und dreidimensionale, zeitumkehrinvariante Systeme im Fo-
kus, da sie bereits in der Natur gefunden wurden. Prinzipiell muss es aber für jede diskrete
Symmetrie eine topologisch isolierende Phase mit physikalischen Eigenschaften geben, die
sich grundlegend von den dazu äquivalenten, topologisch trivialen Phasen unterscheiden.
Für topologische Isolatoren (TI) und Supraleiter (TS) hat sich ein zehnfaches Klassifizie-
rungsschema herausgebildet, das auf den 10 Altland-Zirnbauer (AZ) Symmetrieklassen
beruht.18 Diese unterscheiden sich durch die Anwesenheit oder Abwesenheit von Zeitum-
kehrinvarianz (𝒯 ), Ladungskonjugation bzw. Teilchen-Loch-Symmetrie (𝒞) und chiraler
Symmetrie (𝒮). Die Zahl 10 ergibt sich dabei aus der Zahl der Fälle, wie ein Einteilchen-
Hamiltonian ℋ(k) durch die Operatoren 𝒯 , 𝒞 und 𝒮 transformiert werden kann.19
Die verschiedenen topologischen Phasen innerhalb einer AZ-Symmetrieklasse können
wir durch ganzzahlige oder binäre topologische Invarianten unterscheiden. Das Klassifizie-
rungssystem kann sowohl für TI als auch TS benutzt werden, da in beiden Materialsystemen
eine Energielücke existiert.
Historisch gesehen kann der in Abschnitt 10.5.3 diskutierte Quanten-Hall (QH) Zustand
als der zuerst entdeckte TI betrachtet werden. Der QH-Zustand gehört zu einer AZ-
18
A. Altland und M.R. Zirnbauer, Nonstandard symmetry classes in mesoscopic normal-
superconducting hybrid structures, Phys. Rev. B 55, 1142 (1997).
19
M.R. Zirnbauer, Riemannian symmetric superspaces and their origin in random-matrix theory, J.
Math. Phys. 37, 4986 (1996).
14.4 Topologische Phasen und Phasenübergänge 947
Symmetrieklasse, für die in der Dimension d = 2 die topologischen Invarianten durch die
ganzen Zahlen Z gegeben sind. Wir werden sehen, dass die gemessene QH-Leitfähigkeit
direkt durch diese Zahlen (Chern-Zahlen) gegeben ist. Für die gleiche AZ-Symmetrieklasse
gibt es in der Dimension d = 3 nur die triviale topologische Invariante Null, weshalb es
keinen QHE in drei Dimensionen gibt. Im QH-Zustand wird die Zeitumkehrsymmetrie
durch das von außen angelegte Magnetfeld gebrochen. Lange Zeit glaubte man deshalb, dass
Zeitumkehrsymmetriebrechung und Zweidimensionalität grundlegende Voraussetzungen
für topologische Isolatoren sind. Dies änderte sich, als 2005 TI zuerst für zweidimensio-
nale und kurz darauf für dreidimensionale Systeme vorhergesagt wurden, in denen die
Zeitumkehrsymmetrie nicht gebrochen ist. TI mit Spin-Bahn-Kopplung gehören zu einer
AZ-Symmetrieklasse, für die es für d = 2 und d = 3 genaue zwei topologische Phasen – eine
triviale und eine nichttriviale – gibt. Wir sprechen von einer Z2 -Klassifizierung. Supralei-
ter gehören zu verschiedenen AZ-Symmetrieklassen je nach Dimension und Symmetrie
der Paarwellenfunktion. Interessanterweise gibt es heute noch Symmetrieklassen, für die
man noch keine Realisierung in einem konkreten Materialsystem gefunden hat. Neue
Entdeckungen sind hier zu erwarten.
Das oben diskutierte Klassifizierungsschema gilt nur für nichtwechselwirkende Systeme. Bei
dieser Vereinfachung können wir die Bandstruktur berechnen und die Bänder mit nicht-
wechselwirkenden Elektronen unter Berücksichtigung des Pauli-Prinzips auffüllen. Dies er-
laubt dann die Berechnung einer topologischen Invarianten. Für Systeme mit Wechselwir-
kungen fehlt ein entsprechendes Klassifizierungsschema. Dies liegt daran, dass in wechsel-
wirkenden Vielteilchensystemen sehr komplexe Phasen entstehen können.
Zusammenfassend können wir hinsichtlich der Klassifizierung topologischer Phasen folgen-
des festhalten:
∎ Topologische Phasen werden durch bestimmte Symmetrien geschützt und lassen sich
den zehn Altland-Zirnbauer Symmetrieklassen zuordnen.
∎ Topologische Phasen können durch ganzzahlige topologische Invarianten wie z.B. die
Chern-Zahl klassifiziert werden.
∎ Verschiedene topologische Invarianten gehören zu unterschiedlichen Äquivalenzklas-
sen.
(a) 𝜺
𝑪=𝟎
Energielücke
𝝅 𝝅
− + 𝒌𝒙
𝒂 𝒂
Abb. 14.9: Zur Entstehung von lückenlosen (b) 𝜺
𝑪=𝟏
Oberflächenzuständen in der Bandstruk-
tur an der Grenzfläche eines (a) Isolators
mit trivialer Topologie (𝒞 = 0, entspricht
Kugel) und eines (b) topologischen Iso-
lators (𝒞 = 1, entspricht Torus). Die bei-
den Phasen mit unterschiedlicher Chern-
Zahl sind durch lückenlose Oberflächen- 𝝅 𝝅
zustände verbunden (rote Linie in (b)). − + 𝒌𝒙
𝒂 𝒂
156
auf 𝒞 = 0 (entspricht Kugel) ändern. Da die beiden Bandstrukturen topologisch aber nicht
äquivalent sind, können wir keine adiabatische Transformation zwischen den beiden Band-
strukturen finden, welche die zugrundeliegende Symmetrie nicht bricht und die Bandlücke
im Volumen nicht schließt. Der einzige Ausweg ist, dass sich an der Grenzfläche die Energie-
lücke schließen muss. Daher muss es an der Oberfläche metallisch leitende Zustände geben
(siehe Abb. 14.9). Der allgemeine Zusammenhang zwischen einer nichtverschwindenden
topologischen Invarianten eines Materials und lückenlosen Oberflächenzuständen trifft für
alle topologischen Phasen zu. Wir können also festhalten:
Anschaulich entspricht das eben beschriebene Problem demjenigen, wenn wir einen zu ei-
ner Brezel verschlungenen Draht mit einem völlig unverknoteten geraden Drahtstück ver-
binden wollen. Aufgrund der unterschiedlichen Topologie gelingt uns das nicht, es sei denn
wir schneiden die Brezel auf. Das Gleiche passiert nun an der Grenzfläche zwischen einem
TI und einem gewöhnlichen Isolator. Die verknotete Komponente ist hier die elektronische
Wellenfunktion im k-Raum. Da die beiden Isolatoren topologisch nicht äquivalent sind (die
topologische Invariante ändert sich an der Grenzfläche), müssen sich an der Grenzfläche me-
tallisch leitende Zustände ausbilden, was anschaulich gleichbedeutend mit dem Aufschnei-
den der Brezel ist. Übertragen auf das bereits oben verwendete Beispiel von Torus (er symbo-
lisiert den TI) und Kugel (normaler Isolator) bedeutet dies, dass wir die beiden Formen nur
dann miteinander verbinden können, wenn wir die Öffnung im Torus irgendwie schließen,
was bei einem TI dem Schließen der Bandlücke entspricht. Auf eine mathematische Formu-
lierung dieser Zusammenhänge wollen wir hier verzichten, da dies einige Zeit in Anspruch
nehmen würde.
14.5 Zweidimensionale Topologische Isolatoren 949
(a) (b)
1D 1D
20
D. J. Thouless, M. Kohmoto, M. P. Nightingale, M. den Nijs, Quantized Hall Conductance in a Two-
dimensional Periodic Potential, Phys. Rev. Lett. 49 405-408 (1982).
950 14 Topologische Quantenmaterie
Sie zeigten, dass die Hall-Leitfähigkeit σx y quantisiert ist und proportional zu einer topo-
logischen Invarianten, der Chern-Zahl ist. Um uns dies klar zu machen, betrachten wir
den in Abb. 14.11 gezeigten Zylinder mit Radius R und erhöhen adiabatisch den Fluss Φ
durch den Zylinder von Φ = 0 auf Φ = Φ ̃ 0 = h⇑e. Die Flussänderung erzeugt gemäß Fara-
dayschem Induktionsgesetz eine elektrische Spannung U y = −dΦ⇑dt bzw. ein elektrisches
Feld E y = −(1⇑2πR)dΦ⇑dt um den Zylinder. Die Spannung U y erzeugt wiederum einen 156
Hall-Strom I x = σx y U y entlang dem Zylinder. Haben wir den Fluss von 0 auf h⇑e erhöht,
so haben wir insgesamt die Ladung Q = 2πR ∫ J x dt = 2πR ∫ σx y E y dt = σx y h⇑e transpor-
tiert. Wenn wir Φ = Φ ̃ 0 erreicht haben, können wir aber das Vektorpotenzial durch eine
Eichtransformation eliminieren und erhalten wieder den gleichen Ausgangszustand wie für
Φ = 0. Von TKNN wurde gezeigt, dass die bei dem Vorgang entlang dem Zylinder erzeug-
te Polarisation ∆P nur modulo e definiert ist. Deshalb kann sich die Polarisation nur um
∆P = ne ändern (dies wird auch als Thouless Ladungspumpe bezeichnet). Das heißt, dass
wir durch die gesamte Flussänderung eine Ladung Q = ne, also ein ganzzahliges Vielfaches
der Elementarladung transportiert haben. Daraus ergibt sich sofort
e2
σx y = 𝒞 ⋅ . (14.5.1)
h
Die Chern-Zahl 𝒞, die das System charakterisiert, können wir durch Aufsummierung über
alle besetzten Subbänder (Landau-Niveaus) erhalten, die wir mit der azimuthalen Wellen-
̃ 0 )⇑R indizieren können:
zahl k m, y = (m + Φ⇑Φ
̃0
Φ
N
1
𝒞= ∑ ∫ dΦ ∫ dk x Fm )︀k x , k m, y (Φ)⌈︀ . (14.5.2)
m=1 2π
0
Wechseln wir von der Integrationsvariablen Φ zu k m, y , können wir zeigen, dass die Summe
über die Integrale in ein einzelnes Integral über die 2D-Brillouin-Zone, also in ein Integral
über eine geschlossene Fläche übergeht und somit der Chern-Zahl (14.3.11) entspricht.
𝟏
𝐞𝒊𝟐𝝅
Abb. 14.12: Zur Veranschaulichung der Unterdrückung
der Rückstreuung in einem Quanten-Spin-Hall-
Randkanal. Die Streuung an einer nichtmagnetischen
Störstelle kann in zwei unterschiedliche Richtungen er-
folgen. Bei Streuung im Uhrzeigersinn (blaue Kurve) ro-
tiert der Spin um den Winkel π, bei Streuung gegen den
𝟏
𝐞−𝒊𝟐𝝅
Uhrzeigersinn (rote Kurve) um −π. Der mit der relativen
Spin-Drehung von 2π verbundene Phasenfaktor von −1
führt zu einer destruktiven Interferenz der beiden Pfade.
nur nach links und die Spin-↓ Elektronen nur nach rechts laufen lassen und am gegenüber-
liegenden Rand genau umgekehrt (siehe Abb. 14.10b, Mitte). In diesem Fall erhalten wir an
beiden Rändern keinen elektrischen Strom sondern einen reinen Spin-Strom, da die bei-
den Spin-Spezies in entgegengesetzte Richtungen laufen. Da der Spin-Strom die Rolle des
elektrischen Stroms übernimmt, bezeichnen wir ein System mit solchen Randkanälen als
Spin-Quanten-Hall (SQH) System.
Wir müssen jetzt noch klären, warum erstens sich in entgegengesetzte Richtung bewegende
Elektronen entgegengesetzten Spin besitzen und warum zweitens in den Randkanälen
keine Rückstreuung stattfindet. Die Antwort auf die erste Frage gibt die Spin-Bahn-
Wechselwirkung, die wir im Detail in Abschnitt 12.5.4 diskutiert haben. Sie führt zu einer
Kopplung zwischen der Spin-Richtung und der orbitalen Bewegung der Elektronen und ist
besonders stark in Materialien ausgeprägt, die aus schweren Elementen aufgebaut sind.
Die Antwort auf die zweite Frage gibt die Zeitumkehrinvarianz. Um uns klarzumachen,
warum die Rückstreuung durch nichtmagnetische Streuer verboten ist, obwohl in den Rand-
kanälen eines SQH-Systems sich die Elektronen in beide Richtungen bewegen, betrachten
wir den in Abb. 14.12 skizzierten Prozess, bei dem ein Elektron an einer Verunreinigung
zurückgestreut wird. Das Elektron kann bei der Streuung entweder links- oder rechtsherum
laufen. Der Spin rotiert dabei um den Winkel ±π. Der Unterschied der Spin-Drehung für bei-
de Pfade, die über die Zeitumkehrsymmetrie miteinander verknüpft sind, beträgt also gera-
de 2π. Eine volle 2π-Drehung des Spins erhalten wir durch eine zweimalige Anwendung des
Zeitumkehroperators 𝒯 , die aber ein zusätzliches Minuszeichen liefert (𝒯 ist ein antiunitär-
er Operator, 𝒯 2 = −1, vergleiche Angang E). Das heißt, die Wellenfunktion eines Spin-1⇑2-
Teilchens erhält bei einer 2π-Rotation des Spins ein Minuszeichen. Das bedeutet wiederum,
dass die beiden Rückstreupfade destruktiv interferieren und somit die Rückstreuung verbo-
ten ist. Wir können deshalb sagen, dass die Robustheit der SQH-Randkanäle durch die Zeit-
umkehrsymmetrie gewährleistet wird oder dass der damit verbundene topologische Zustand
durch die Zeitumkehrsymmetrie symmetriegeschützt ist. Das eben vorgestellte Bild gilt nur
für einzelne Paare von SQH-Randkanälen. Würden wir die oberen und unteren Randkanäle
in Abb. 14.10 in einem einzigen eindimensionalen Leiter zusammenbringen, so könnte ein
Elektron von einem vorwärts- in einen rückwärtslaufenden Kanal gestreut werden, ohne den
Spin zu ändern. Es würde dann keine destruktive Interferenz auftreten und wir hätten durch
952 14 Topologische Quantenmaterie
die endliche Rückstreuung eine endliche Dissipation vorliegen. Damit der SQH-Zustand
robust ist, muss er aus einer ungeraden Zahl von vorwärts- und rückwärtslaufenden Mo-
den bestehen. Dieser gerade–ungerade Effekt wird durch die Z2 -Topologie charakterisiert.
Da wir also den SQH-Zustand mit einer topologischen Invariante charakterisieren können,
können wir ihn als topologische Phase bezeichnen.
14.5.3 Quanten-Hall-Effekte
Wir haben in Abschnitt 9.7.1 und 9.7.3 gesehen, dass wir aufgrund der Spin-Bahn-Kopplung
zusätzlich zum normalen Hall-Effekt, der auf der Ablenkung von sich bewegenden Ladungs-
trägern durch die Lorentz-Kraft basiert, einen anomalen Hall-Effekt und einen Spin-Hall-
Effekt erhalten. In zweidimensionalen Systemen können wir die jeweilige Quantenversi-
14.6 Dreidimensionale Topologische Isolatoren 953
Abb. 14.14: (a) Quanten-Hall-Effekt, (b) anomaler Quanten-Hall-Effekt und (c) Spin-Quanten-Hall-
Effekt. In allen 3 Fällen fließen die Ladungsträger durch verlustfreie Randkanäle in isolierenden Syste-
men. In (a) fließen beide Spin-Spezies in dieselbe, in (c) in entgegengesetzte Richtungen. In (b) über-
wiegt eine Spin-Spezies. Die Zahl der Randkanäle und die Kopplung zwischen orbitaler Bewegung und
Spin-Richtung hängt von dem jeweiligen System ab.
25
𝜺
𝒌𝒚
𝜺𝐅
𝒌𝒙
Abb. 14.15: Die Oberfläche eines dreidimensionalen to-
pologischen Isolators erlaubt die Bewegung der Elektro- Dirac-Punkt
nen in einer beliebigen Richtung parallel zur Oberfläche. 𝒌𝒙 𝒌𝒚
Die Spin-Richtung ist aber aufgrund der Spin-Bahn-
Wechselwirkung immer an die Bewegungsrichtung
der Elektronen gekoppelt. Die zweidimensionale Di-
spersionsrelation ist durch einen Dirac-Kegel gegeben.
Rechts ist ein Schnitt durch den Kegel bei der Fermi-
Energie ε F gezeigt. Die Pfeile geben die Spin-Richtung an.
Existenz von topologischen Oberflächenzuständen in diesem System gefunden.25 Bis heu- 162
te wurden topologisch geschützte Oberflächenzustände auch in reinem Antimon, Bi2 Te3 ,
Bi2 Se3 und Sb2 Te3 nachgewiesen. Von verschiedenen weiteren Materialsystemen wird an-
genommen, dass sie sich wie ein 3D TI verhalten.
25
D. Hsieh et al., A Topological Dirac Insulator in a Quantum Spin Hall Phase, Nature 452, 970 (2008).
26
M. Sato, Y. Ando, Topological Superconductors: A Review, Rep. Prog. Phys. 80, 076501 (2017).
14.8 Zukunftsperspektiven 955
14.8 Zukunftsperspektiven
Topologische Quantenmaterialien bieten faszinierende Möglichkeiten zur Konstruktion
exotischer Quantenzustände und für die Realisierung exotischer Quasiteilchen. Für zwei-
dimensionale SQH-Isolatoren erwarten wir zum Beispiel gebrochen-ganzzahlige Ladungen
an den Probenrändern. Für eine Punktladung über der Oberfläche eines dreidimensionalen
TI wird vorhergesagt, dass sie nicht nur eine Bildladung sondern auch das Bild eines ma-
gnetischen Monopols an der Oberfläche erzeugt. In topologischen magnetischen Isolatoren
erwarten wir die Existenz von so genannten Axionen, die in der Teilchenphysik postu-
liert wurden, um einige Rätsel des Standardmodells der Teilchenphysik zu lösen. Wenn
ein Supraleiter in Kontakt mit der Oberfläche eines TI gebracht wird, verhalten sich die
Flussschläuche im Supraleiter wie Majorana-Fermionen. Das Austauschen oder Verflechten
dieser Flussschläuche führt zu einer nicht-abelschen Teilchenstatistik. Schließlich denkt
man bereits an Anwendungen von topologischer Quantenmaterie. Magnetische Bildmo-
nopole könnten zur Datenspeicherung oder Majorana-Fermionen für einen topologischen
Quantenrechner benutzt werden.27
Literatur
A. Altland und M.R. Zirnbauer, Nonstandard symmetry classes in mesoscopic normal-
superconducting hybrid structures, Phys. Rev. B 55, 1142 (1997).
B. A. Bernevig, T. L. Hughes, Topological Insulators and Topological Superconductors, Prince-
ton University Press (2013).
M. V. Berry, Quantal Phase Factors Accompanying Adiabatic Changes, Proc. R. Soc. Lond. A
392, 45 (1984).
M. Franz, L. Molenkamp (Hg.), Topological Insulators, in Contemporary Concepts of Con-
densed Matter Series, Vol. 6, Elsevier, Amsterdam (2013).
L. Fu, C. L. Kane, E. J. Mele, Topological Insulators in Three Dimensions, Phys. Rev. Lett. 98,
106803 (2007).
M. Z. Hasan, C. L. Kane, Topological Insulators, Rev. Mod. Phys. 82, 3045-3067 (2010).
D. Hsieh et al., A Topological Dirac Insulator in a Quantum Spin Hall Phase, Nature 452, 970
(2008).
C. L. Kane, E. J. Mele, Z2 Topological Order and the Quantum Spin Hall Effect, Phys. Rev. Lett.
95, 146802 (2005); siehe auch Phys. Rev. Lett. 95, 226801 (2005).
M. König, S. Wiedmann, C. Brüne, A. Roth, H. Buhmann, L. W. Molenkamp, X.-L. Qi, S.-
C. Zhang, Quantum Spin Hall Insulator State in HgTe Quantum Wells, Science 318, 766-
770 (2007).
27
C. Nayak, S. H. Simon, A. Stern, M. Freedman, S. Das Sarma, Non-Abelian Anyons and Topological
Quantum Computation, Rev. Mod. Phys. 80, 1083-1159 (2008).
956 14 Topologische Quantenmaterie
J.M. Kosterlitz, D.J. Thouless, Ordering, metastability and phase transitions in two-
dimensional systems, J. Phys. C 6: Solid State Phys., 1181 (1973).
K. von Klitzing, G. Dorda, M. Pepper, New Method for High-Accuracy Determination of the
Fine-Structure Constant Based on Quantized Hall Resistance, Phys. Rev. Lett. 45, 494–
497 (1980).
K. von Klitzing, G. Dorda, M. Pepper, High-magnetic-field transport in a dilute two-dimen-
sional electron gas, Phys. Rev. B 28, 4886–4888 (1983).
M. Sato, Y. Ando, Topological Superconductors: A Review, Rep. Prog. Phys. 80, 076501 (2017).
D. J. Thouless, M. Kohmoto, M. P. Nightingale, M. den Nijs, Quantized Hall Conductance in
a Two-dimensional Periodic Potential, Phys. Rev. Lett. 49 405-408 (1982).
M.R. Zirnbauer, Riemannian symmetric superspaces and their origin in random-matrix theo-
ry, J. Math. Phys. 37, 4986 (1996).
Cui-Zu Chang et al., Experimental observation of the quantum anomalous Hall effect in a
magnetic topological insulator, Science 340, 167–170 (2013).
A Quantentheorie des harmonischen
Kristallgitters
p2 1
ℋ= + mω 2 x 2 . (A.1.1)
2m 2
Man definiert die Erzeugungs- und Vernichtungsoperatoren
{︂ }︂
mω 1
a =
†
x−ı p (A.1.2)
2ħ 2ħmω
{︂ }︂
mω 1
a= x+ı p. (A.1.3)
2ħ 2ħmω
(︀a, a† ⌋︀ = 1 . (A.1.4)
ℋ = ħω (a† a + 12 ) (A.1.5)
E n = ħω (n + 12 ) . (A.1.6)
Hierbei ist ⋃︀ñ︀ der n-te angeregte Zustand, der sich aus dem Grundzustand ⋃︀0̃︀ durch
1
⋃︀ñ︀ = ⌋︂ (a† )n ⋃︀0̃︀ (A.1.7)
n!
ergibt.
958 A Quantentheorie des Gitters
Für einen harmonischen Oszillator ist die zeitgemittelte kinetische und potenzielle Energie
gleich, das heißt, es gilt 12 ∐︀E tot ̃︀ t = ∐︀E kin ̃︀ t = ∐︀E pot ̃︀ t . Mit ∐︀E tot ̃︀ t = (n + 12 )ħω und 12 ∐︀E pot ̃︀ t ∝
∐︀x 2 ̃︀ folgt für die mittlere quadratische Auslenkung
∐︀x 2 ̃︀ ∝ n . (A.1.8)
Wir sehen also, dass der harmonische Oszillator der Frequenz ω in verschiedenen, diskreten
Anregungszuständen vorliegen kann. Die Energien dieser Zustände sind ħω(n + 12 ), wo-
bei die Quantenzahl n = 0, 1, 2, 3, . . . die Anregungszustände durchnummeriert. Je größer n,
desto größer auch die mittlere quadratische Auslenkung.
A.2.1.1 Phonon-Koordinaten
Die Transformation von Teilchenkoordinaten x s in Phonon-Koordinaten X q ist für gitter-
periodische Probleme üblich. Wir schreiben x s als Fourier-Reihe
1
x s = ⌋︂ ∑ X q e ı qs a (A.2.5)
N q
mit der entsprechenden inversen Transformation
1
X q = ⌋︂ ∑ x s e−ı qs a . (A.2.6)
N s
In (A.2.5) summieren wir über alle gemäß den geltenden Randbedingungen erlaubten Wel-
lenzahlen q (vergleiche Abschnitt 5.3.1):
2π p
q= , p = 0, ±1, ±2, . . . , ± ( 12 N − 1) , ± 12 N . (A.2.7)
a N
Wir benötigen jetzt noch die Transformation vom Teilchenimpuls p s zum Impuls Pq , der
zur Phonon-Koordinate kanonisch konjugiert ist. Die Transformation lautet:
1
p s = ⌋︂ ∑ Pq e−ı qs a (A.2.8)
N q
mit der entsprechenden inversen Transformation1
1
Pq = ⌋︂ ∑ x s e ı qs a . (A.2.9)
N s
Wir können leicht zeigen, dass die Wahl von Pq und X q richtig ist, indem wir den Kommu-
tator berechnen. Mit Hilfe von (︀x s , p s ′ ⌋︀ = ıħδ(s, s′ ) lässt sich leicht zeigen, dass
(︀X q , Pq′ ⌋︀ = ıħδ(q, q′ ) . (A.2.10)
Das heißt, X q und Pq sind wirklich konjugierte Variablen.
Wir können nun die Transformationen (A.2.5) und (A.2.6) sowie (A.2.8) und (A.2.9) im
Hamilton-Operator (A.2.4) benutzen und erhalten
1 −ı(q+q ′ )s a
∑ ps = ∑ ∑ ∑ Pq Pq′ e
2
s N s q q′
1
Hinweis: Das Ergebnis entspricht nicht ganz dem, das wir durch eine naive Substitution von p
durch q sowie P durch Q in (A.2.5) und (A.2.6) erhalten würden, da q und −q in (A.2.5) und
(A.2.8) gerade vertauscht sind.
960 A Quantentheorie des Gitters
1 1
ℋ = ∑{ Pq P−q + Mω 2q X q X−q . (A.2.16)
q 2M 2
Die Bewegungsgleichung des Operators X q erhalten wir, indem wir die Standardvorschrift
der Quantenmechanik verwenden, zu
P−q
ıħ Ẋ q = (︀X q , ℋ⌋︀ = ıħ , (A.2.17)
M
wobei ℋ durch (A.2.14) gegeben ist. Mit dem Kommutator
1
ıħ Ẍ q = (︀ Ẋ q , ℋ⌋︀ = (︀P−q , ℋ⌋︀ = ıħω 2q X q (A.2.18)
M
folgt daraus
Ẍ q + ω 2q X q = 0 . (A.2.19)
Dies ist die Bewegungsgleichung eines harmonischen Oszillators der Frequenz ω q . Die Ener-
gieeigenwerte sind
E q = ħω q (n q + 12 ) , n q = 0, 1, 2, 3, . . . . (A.2.20)
E = ∑ ħω q (n q + 12 ) . (A.2.21)
q
Diese Ergebnis erhalten wir, da wir es mit einem System unabhängiger harmonischer Oszil-
latoren zu tun haben. Für dieses gilt ℋ = ∑ i ℋ i mit (︀ℋ i , ℋ j ⌋︀ = 0 für i ≠ j. Wir wissen aus der
Quantenmechanik, dass für ein solches System der Eigenzustand von ℋ gleich dem Produkt
A.2 Quantisierung von Gitterschwingungen 961
der Eigenzustände der ℋ i ist. Mit ℋ i ⋃︀ϕ i ̃︀ = E i ⋃︀ϕ i ̃︀ und ⋃︀Ψ̃︀ = ∏ i ⋃︀ϕ i ̃︀ folgt dann ℋ⋃︀Ψ̃︀ = E⋃︀Ψ̃︀
mit E = ∑ i E i .
Unser Ergebnis zeigt die Quantisierung der Energien der elastischen Schwingungen einer
eindimensionalen Kette von Atomen. Das Ergebnis kann auf den dreidimensionalen Fall
eines Gitters mit einer Basis aus r ′ Atomen erweitert werden. Wir müssen dann nicht nur
über alle Wellenvektoren q aufsummieren, sondern auch über alle r = 3r ′ Dispersionszweige
und erhalten
E = ∑ ħω qr (n qr + 12 ) . (A.2.22)
qr
1 ⎨⎝⌈︂ 1 ⎬
⎠
a q = ⌋︂ ⎝ Mω q X q + ı ⌈︂ P−q ⎠ . (A.2.25)
⎝
2ħ ⎪ ⎠
Mω q ⎮
Die dazu inversen Beziehungen lauten
⟨
⧸︂ ħ
X q = ⧸︂
⟩ (a q + a−q
†
) (A.2.26)
2Mω q
⟨
⧸︂ ħMω q
Pq = ı ⧸︂
⟩ (a †q − a−q ) . (A.2.27)
2
Damit lässt sich der Ortsoperator x s schreiben als
⟨
⧸︂
x s = ∑ ⧸︂
⟩ ħ
(a q e ı qas + a †q e−ı qas ) . (A.2.28)
q 2N Mω q
Diese Gleichung stellt die Beziehung zwischen der Auslenkung der Atome und den Phonon-
Erzeugungs- und Vernichtungsoperatoren her.
Setzen wir (A.2.24) und (A.2.25) in (A.2.23) ein, so können wir zeigen, dass die Form
(A.2.23) des Hamilton-Operators zu derjenigen aus Gleichung (A.2.16) identisch ist.
2 †
Dabei benutzen wir die Eigenschaften X−q = X q und Pq† = P−q , die aus (A.2.6), (A.2.8) und (A.2.9)
folgen, wenn wir die Tatsache ausnutzen, dass x s und p s hermitesche Operatoren sind, d. h. x s = x s†
und p s = p†s .
B Quantenstatistik
Wir wollen hier Systeme aus Teilchen betrachten, deren Wechselwirkung vernachlässigbar
ist, d. h. wir beschäftigen uns mit idealen Teilchengasen. Wir wollen diese Systeme vollstän-
dig aus quantenmechanischer Sicht behandeln. Dies wird uns erlauben, Probleme zu behan-
deln, bei denen es um Gase bei sehr niedrigen Temperaturen oder sehr hohen Drücken geht.
Es wird uns dadurch möglich sein, nicht-klassische Gase wie Photonen oder Leitungselek-
tronen in Metallen zu behandeln.
Wir werden in Abschnitt B.1 zunächst diskutieren, wie sich die statistische Beschreibung
eines Gases aus nicht-wechselwirkenden Teilchens ändert, wenn wir von einem klassischen
Gas unterscheidbarer Teilchen zu einem quantenmechanischen System ununterscheidbarer
Teilchen übergehen. In Abschnitt B.2 werden wir dann die quantenmechanischen Vertei-
lungsfunktionen für Bosonen und Fermionen ableiten. Mit Hilfe dieser Verteilungsfunktio-
nen können wir die Besetzungswahrscheinlichkeit eines Quantenzustandes angeben.
{s 1 , s 2 , . . . , s N } (B.1.1)
964 B Quantenstatistik
B.1.2.1 Bosonen
Für Bosonen führt die Vertauschung von zwei Teilchen nicht zu einem neuen Zustand des
Gases (Gesamtsystems). Die Teilchen müssen deshalb beim Abzählen der verschiedenen Zu-
stände des Gases als echt ununterscheidbar betrachtet werden. Wichtig ist, dass es keine
Beschränkung hinsichtlich der Teilchenzahl in irgendeinem Einteilchenzustand s gibt. Wir
sagen, dass die Teilchen der Bose-Einstein-Statistik gehorchen.
B.1 Identische Teilchen 965
B.1.2.2 Fermionen
Für Fermionen tritt beim Austausch von zwei Teilchen eine Vorzeichenänderung auf. Dies
hat eine weitreichende Konsequenz. Befinden sich nämlich zwei Teilchen i und j im gleichen
Einteilchenquantenzustand s i = s j = s, so führt die Vertauschung offensichtlich zu
Ψ(. . . , q i , . . . , q j , . . .) = Ψ(. . . , q j , . . . , q i , . . .) .
Da aber die fundamentale Symmetrieforderung (B.1.4) erfüllt werden muss, folgt sofort, dass
Ψ = 0, wenn die Teilchen i und j den gleichen Einteilchenzustand besitzen. Für Fermio-
nen kann also kein Zustand des Gesamtsystems existieren, in dem zwei oder mehr Teilchen
den gleichen Einteilchenzustand besetzen. Diese Tatsache ist uns als das Paulische Auschlie-
ßungsprinzip bereits bekannt. Beim Abzählen der Zustände des Gases muss man also stets
die Einschränkung berücksichtigen, dass nie mehr als ein Teilchen einen bestimmten Ein-
teilchenzustand besetzen kann. Wir sagen, dass die Teilchen der Fermi-Dirac-Statistik ge-
horchen.
B.1.2.3 Beispiel
Wir wollen ein ganz einfaches Beispiel benutzen, um die gerade diskutierten Begriffe und
ihre Konsequenzen zu verdeutlichen. Wir betrachten hierzu ein Gas, dass nur aus zwei Teil-
chen X und Y besteht, die einen von drei möglichen Quantenzuständen 1, 2, 3 einnehmen
können. Wir wollen jetzt alle möglichen Zustände des Gases aufzählen. Dies entspricht der
Beantwortung der Frage, auf wie viele verschiedene Arten wir zwei Teilchen auf drei Einteil-
chenzustände verteilen können. Das Ergebnis ist in Abb. B.1 gezeigt.
Im klassischen Fall (Maxwell-Boltzmann-Statistik) werden die Teilchen als unterscheidbar
angesehen und jede Anzahl von Teilchen kann jeden Zustand besetzen. Es gibt also 32 =
9 mögliche Zustände für das gesamte Gas.
Im quantenmechanischen Fall müssen wir die Teilchen als ununterscheidbar betrachten.
Die Ununterscheidbarkeit impliziert X = Y. Für Bosonen (Bose-Einstein-Statistik) kann je-
de Anzahl von Teilchen jeden Zustand besetzen. Die Ununterscheidbarkeit impliziert, dass
die drei Zustände des klassischen Falls, die sich nur durch Vertauschung von X und Y erge-
ben, jetzt wegfallen. Es gibt jetzt nur noch drei Arten, die Teilchen in den gleichen Zustand
und drei Arten, sie in verschiedene Zustände zu platzieren. Wir erhalten also insgesamt 6
verschiedene Zustände.
Für Fermionen (Fermi-Dirac-Statistik) darf nur noch ein Teilchen einen bestimmten Ein-
teilchenzustand besetzen. Im Vergleich zu den Bosonen fallen deshalb die drei Zustände
mit zwei Teilchen im gleichen Zustand weg. Es gibt dann insgesamt nur noch drei mögliche
Zustände für das Gas.
Definieren wir α als
p1
α= ,
p2
wobei p 1 (p 2 ) die Wahrscheinlichkeit dafür ist, dass sich beide Teilchen (nicht) im gleichen
Zustand befinden, so erhalten wir
α MB = 0.5 Maxwell-Boltzmann-Statistik
α BE = 1 Bose-Einstein-Statistik (B.1.5)
α FD = 0 Fermi-Dirac-Statistik .
Wir sehen, dass für Bosonen eine größere Tendenz vorhanden ist, sich im gleichen Quanten-
zustand anzusammeln als für klassische Teilchen. Andererseits gibt es für Fermionen eine
größere Tendenz dafür, sich in verschiedenen Zuständen anzusammeln als im klassischen
Fall.
wobei die Summe über alle möglichen Zustände k geht. Die Gesamtzahl N der Teilchen ist
N = ∑ nk . (B.2.2)
k
B.2 Die quantenmechanischen Verteilungsfunktionen 967
Um die thermodynamischen Funktionen des Gases (z. B. seine Entropie) zu berechnen, müs-
sen wir seine Zustandssumme bestimmen. Es gilt
Hierbei läuft die Summe über alle möglichen Gesamtzustände K des Gases, das heißt, über
alle möglichen Kombinationen der Zahlen n 1 , n 2 , n 3 , . . ..
Da der Boltzmann-Faktor exp(︀−β(n 1 є 1 + n 2 є 2 + . . .)⌋︀ die relative Wahrscheinlicheit dafür
darstellt, das Gas in einem bestimmten Zustand zu finden, bei dem sich n 1 Teilchen im Zu-
stand 1, n 2 Teilchen im Zustand 2 usw. befinden, können wir die mittlere Teilchenzahl im
Zustand k durch
∑ n k e−β(n 1 є 1 +n 2 є 2 +...)
∐︀n k ̃︀ =
K
(B.2.4)
∑ e−β(n 1 є 1 +n 2 є 2 +...)
K
1. Maxwell-Boltzmann-Statistik:
Hier kann jeder Einteilchenzustand k mit einer beliebigen Teilchenzahl besetzt werden,
d. h. wir müssen über alle Werte
n k = 0, 1, 2, 3, . . . für jedes k (B.2.6)
unter der Nebenbedingung
∑ nk = N (B.2.7)
k
aufsummieren. Dabei müssen wir berücksichtigen, dass die Teilchen in diesem klassi-
schen Fall unterscheidbar sind. Wir müssen also jede Permutation von zwei Teilchen in
verschiedenen Zuständen als neuen Zustand des gesamten Gases betrachten, obwohl das
Zahlentupel {n 1 , n 2 , n 3 , . . .} gleich bleibt. Es ist also hier nicht ausreichend anzugeben,
wie viele Teilchen welchen Zustand besetzen, sondern welches Teilchen sich in welchem
Zustand befindet. Dies ist sehr einfach anhand unseres Beispiels in Abb. B.1 einzusehen.
Da wir die Teilchen X und Y unterscheiden können, ist z. B. der Gesamtzustand, in dem
X den Zustand 1 und Y den Zustand 2 besetzt, von dem Gesamtzustand, in dem X den
Zustand 2 und Y den Zustand 1 besetzt, zu unterscheiden. Wären die Teilchen unun-
terscheidbar, so wären die beiden Gesamtzustände identisch, da wir nur sagen könnten,
dass Zustand 1 und 2 jeweils von einem Teilchen besetzt werden.
968 B Quantenstatistik
2. Bose-Einstein-Statistik:
Hier müssen die Teilchen als ununterscheidbar betrachtet werden. Das heißt, hier ist die
Angabe der Zahlen {n 1 , n 2 , n 3 , . . .} ausreichend, um den Gesamtzustand des Gases zu
kennzeichnen. Deshalb ist nur die Summation über alle möglichen Teilchenzahlen des
Einteilchenzustandes notwendig, das heiß, wir müssen über alle möglichen Werte
∑ nk = N (B.2.9)
k
aufsummieren.
Ein einfacher Spezialfall ist der, dass wir keine Einschränkung hinsichtlich der Gesamt-
zahl N der Teilchen haben. Dies ist z. B. der Fall, wenn wir Photonen in einem Behälter
des Volumens V betrachten, die von dessen Wänden absorbiert und wieder emittiert
werden können. Die Photonenzahl kann deshalb schwanken und man erhält den Spezi-
alfall der Photonen-Statistik.
3. Fermi-Dirac-Statistik:
Hier müssen die Teilchen wiederum als ununterscheidbar betrachtet werden, so dass
auch hier die Angabe der Zahlen {n 1 , n 2 , n 3 , . . .} ausreichend ist, um den Gesamtzustand
des Gases zu kennzeichnen. Es ist daher nur notwendig, über alle möglichen Teilchen-
zahlen der Einteilchenzustände aufzusummieren. Allerdings muss hier außer der Ne-
benbedingung (B.2.9) für die Gesamtzahl der Teilchen als weitere Nebenbedingung das
Pauli-Prinzip berücksichtigt werden. Aufgrund dieses Prinzips gibt es nur zwei mögliche
Werte für die Besetzungszahlen:
Unsere bisherige Betrachtung zeigt bereits, dass es einen tiefgreifenden Unterschied zwi-
schen der Bose-Einstein-Statistik und der Fermi-Dirac-Statistik gibt, der sich insbesondere
bei tiefen Temperaturen zeigen wird, da sich hier das Gas als Ganzes in seinem Zustand
niedrigster Energie befindet. Wir nehmen im Folgenden an, dass der energetisch niedrigste
Einteilchenzustand der Zustand є 1 ist. Im Fall der Bose-Einstein-Statistik erhalten wir dann
den energetisch tiefsten Zustand einfach dadurch, dass wir alle N Teilchen in diesen Zu-
stand bringen. Die Gesamtenergie ist dann Nє 1 . Im Fall der Fermi-Dirac-Statistik ist dies
aber nicht möglich, da wir jeden Zustand nur mit einem Teilchen besetzen dürfen. Den
niedrigsten Zustand des Gesamtsystems erhalten wir folglich dadurch, dass wir die mögli-
chen Einteilchenzustände vom energetisch niedrigsten Zustand an nach ansteigender Ener-
gie besetzen. Die Gesamtenergie des Gases wird folglich sehr viel größer als Nє 1 sein. Das
Paulische Ausschließungsprinzip hat also weitreichende Folgen für das Gesamtsystem.
Wir wollen nun noch die mittlere Besetzungszahl ∐︀n k ̃︀ eines bestimmten Zustands k be-
trachten. Ausgehend von (B.2.4) können wir die Summe ∑K über alle möglichen Gesamt-
zustände K für ununterscheidbare Teilchen durch eine Summe ∑n 1 ,n 2 ,... über alle Zahlen-
B.2 Die quantenmechanischen Verteilungsfunktionen 969
Hierbei lassen die Summen ∑(k) im Zähler und Nenner den Zustand k außer Betracht.
B.2.2 Photonen-Statistik
Die Photonen-Statistik stellt den Spezialfall der Bose-Einstein-Statistik mit unbestimmter
Teilchenzahl dar. Die Besetzungszahlen n 1 , n 2 , . . . können hier alle Werte n k = 0, 1, 2, 3, . . .
ohne jegliche Einschränkung annehmen. Die Summen ∑(k) im Zähler und Nenner von
(B.2.12) sind deswegen identisch und kürzen sich heraus. Deswegen bleibt einfach
∑ n k e−βn k є k
∐︀n k ̃︀ =
nk
(B.2.13)
∑ e−βn k є k
nk
− β1 ∂
∂є k ∑ e−βn k є k
1 ∂
∐︀n k ̃︀ = =− ln (∑ e−βn k є k ) .
nk
(B.2.14)
∑ e−βn k є k β ∂є k nk
nk
Die letzte Summe ist eine unendliche geometrische Reihe, da N beliebig ist. Diese kann auf-
summiert werden zu
∞
−βn є −βє −2βє k 1
∑ e k k =1+e k +e + e−3βє k + . . . = . (B.2.15)
n k =0 1 − e−βє k
1 ∂ e−βє k
∐︀n k ̃︀ = ln (1 − e−βє k ) = (B.2.16)
β ∂є k 1 − e−βє k
und wir erhalten mit β = 1⇑k B T die Plancksche Verteilung
1
∐︀n k ̃︀ = Plancksche Verteilung . (B.2.17)
eє k ⇑k B T − 1
970 B Quantenstatistik
e1 e2 e3 e4 Reservoir
EK = ∑ nk єk (B.2.18)
k
gegeben, wobei n k die Anzahl der Teilchen im Zustand k ist. Für Fermionen kann der Zu-
stand des Systems entweder leer (n k = 0) oder genau mit einem Teilchen besetzt sein (n k =
1). Die große Zustandssumme enthält deshalb genau zwei Terme
wobei wir die absolute Aktivität λ = exp(βµ) benutzt haben. Der erste Term resultiert aus
n k = 0, der zweite aus n k = 1. Der zweite Term ist gerade der Gibbs-Faktor des Zustands k
mit Energie є k bei Einfachbesetzung.
Der thermische Mittelwert der Besetzung des Zustandes ist das Verhältnis des Terms in der
großen Zustandssumme mit n k = 1 zur Summe der Terme mit n k = 0 und n k = 1:
λ e−βє k λ e−βє k 1
∐︀n k ̃︀ = = = . (B.2.20)
̃
Z 1 + λ e−βє k 1
e βє k +1
λ
Für die mittlere Fermionenbesetzung benutzen wir im Folgenden die übliche Bezeichnung
f (є k ) = ∐︀n k ̃︀. Mit 1⇑λ = exp(−βµ) und β = 1⇑k B T erhalten wir die Fermi-Dirac-Verteilung
1
f (є k ) = Fermi-Dirac-Verteilung . (B.2.21)
e(є k −µ)⇑k B T +1
1
Ist der einzelne Zustand z. B. ein bestimmter Zustand eines Wasserstoffatoms, so wird das Reservoir
aus den weiteren Zuständen dieses Atoms und denjenigen von allen anderen Atomen gebildet.
B.2 Die quantenmechanischen Verteilungsfunktionen 971
1.0
10
5
0.8
2
0.6
/ kBT = 1
f (k)
Die Verteilung ist in Abb. B.3 dargestellt. Sie gibt die mittlere Anzahl von Fermionen in einem
einzelnen Zustand der Energie є k an. Der Wert von f liegt stets zwischen null und eins, was
die Einschränkungen des Paulischen Ausschließungsprinzips wiederspiegelt. Ist k B T sehr
klein gegenüber dem chemischen Potenzial µ, so handelt es sich in guter Näherung um eine
Stufenfunktion. Alle Zustände mit є k ≤ µ sind besetzt, alle Zustände є k ≥ µ sind leer. Für
є k = µ ist die Besetzungswahrscheinlichkeit immer 1⇑2.
Im Bereich der Festkörperphysik nennt man das chemische Potenzial oft Fermi-Niveau. Das
chemische Potenzial hängt gewöhnlich von der Temperatur ab. Der Wert von µ für T → 0
wird Fermi-Energie є F bezeichnet:
Das chemische Potenzial wird durch die Gesamtteilchenzahl N des betrachteten Gesamtsys-
tems festgelegt. Es muss nämlich gelten
∑∐︀n k ̃︀ = ∑ f (є k ) = N . (B.2.23)
k k
Ist die Teilchendichte in einem System hoch, so müssen aufgrund des Pauli-Prinzips die Ein-
teilchenzustände є k bis zu hohen Energie besetzt werden, um alle Teilchen unterzubringen.
Dies führt zu großen Werten des chemischen Potenzials. Um genaue Aussagen über die Grö-
ße des chemischen Potenzials machen zu können, müssen wir noch wissen, wie viele Ein-
teilchenzustände es pro Energieintervall gibt, das heißt, wir müssen die Zustandsdichte des
Systems kennen. Für Metalle (Elektronengas) beträgt µ typischerweise einige eV, was Tem-
peraturen von mehreren 10 000 K entspricht.2 Wir weisen an dieser Stelle auch darauf hin,
dass die Wahl des Nullpunktes der Energie є k natürlich willkürlich ist. Die spezielle Wahl,
die wir bei einem bestimmten Problem treffen, wirkt sich aufgrund der Bedingung (B.2.23)
auf den Wert des chemischen Potenzials aus. Der Wert der Differenz є k − µ ist unabhängig
von der Wahl des Nullpunktes von є k .
2
1 eV entspricht 11 590 K, bzw. 1 K entspricht 8.625 × 10−5 eV.
972 B Quantenstatistik
Die obere Grenze für n k bei der Summation sollte eigentlich die Gesamtzahl der Teilchen im
kombinierten Komplex System plus Reservoir bilden. Wir dürfen allerdings ein sehr großes
Reservoir zulassen, wodurch die Summation von null bis Unendlich eine sehr gute Näherung
ist.
Die Reihe in (B.2.24) kann in geschlossener Form aufsummiert werden. Mit x ≡ λ exp(−βє k )
erhalten wir
∞
̃ = ∑ x nk =
Z
1
=
1
, (B.2.25)
n k =0 1 − x 1 − λ e−βє k
falls λ exp(−βє k ) < 1. In allen realistischen Fällen wird λ exp(−βє k ) dieser Anforderung ge-
nügen, da sonst die Anzahl der Bosonen im System nicht begrenzt wäre.
Wir müssen jetzt das Scharmittel der Teilchenzahl in den Zuständen berechnen. Nach der
Definition des Mittelwertes erhalten wir unter Benutzung von (B.2.25)
∞ ∞
∑ nk x nk x ddx ∑ x n k
n k =0 n k =0 x ddx (1 − x)−1
∐︀n k ̃︀ = ∞ = ∞ = . (B.2.26)
(1 − x)−1
∑ x nk ∑ x nk
n k =0 n k =0
1
n(є k ) = Bose-Einstein-Verteilung . (B.2.28)
e(є k −µ)⇑k B T −1
B.2 Die quantenmechanischen Verteilungsfunktionen 973
Bose-Einstein
3
f (k ) n(k )
wobei wir n(є k ) statt ∐︀n k ̃︀ geschrieben haben. Gleichung (B.2.28) definiert die Bose-Ein-
stein-Verteilungsfunktion. Sie ist in Abb. B.4 zusammen mit der Fermi-Dirac Verteilungs-
funktion grafisch dargestellt. Wir sehen, dass für den Grenzfall є − µ ≫ k B T die beiden Ver-
teilungsfunktionen näherungsweise gleich sind. Diesen Bereich nennt man den klassischen
Grenzfall, auf den wir weiter unten noch zu sprechen kommen.3
Die Größe n(є) bezeichnet man auch als die Besetzung eines Zustandes. Für Bosonen ist n(є)
aber nicht dasselbe wie die Wahrscheinlichkeit dafür, dass ein Zustand besetzt ist. Für Fer-
mionen sind dagegen die Besetzung und die Wahrscheinlichkeit dasselbe, da nur 0 oder
1 Teilchen einen Zustand besetzen können.
Die Bose-Einstein-Verteilung unterscheidet sich mathematisch von der Fermi-Dirac Vertei-
lungsfunktion nur dadurch, dass im Nenner eine −1 statt eine +1 steht. Dieser kleine Unter-
schied hat aber physikalische sehr bedeutsame Folgen, wie wir in den folgenden Abschnitten
noch diskutieren werden.
3
Wir weisen an dieser Stelle auch darauf hin, dass die Wahl des Nullpunktes der Energie є k immer
willkürlich ist. Die spezielle Wahl, die man bei einem bestimmten Problem trifft, wirkt sich auf den
Wert des chemischen Potenzials aus. Der Wert der Differenz є k − µ ist unabhängig von der Wahl
des Nullpunktes von є k .
974 B Quantenstatistik
zu bestimmen.
Wir wollen jetzt die Größe von µ⇑k B T für einige Grenzfälle diskutieren. Wir betrachten zu-
nächst ein hinreichend verdünntes Gas bei fester Temperatur. Die Beziehung (B.2.30) kann
wegen der kleinen Teilchenzahl N nur dann erfüllt werden, wenn jeder Term in der Summe
über alle Zustände genügend klein ist. Das heißt, es muss ∐︀n k ̃︀ ≪ 1 oder e(є k −µ)⇑k B T ≫ 1 für
alle k sein. Dies ist der Fall, wenn (є k − µ) ≫ k B T.
In ähnlicher Weise können wir den Fall sehr hoher Temperaturen bei fester Teilchenzahl
diskutieren. In diesem Fall ist β = 1⇑k B T ausreichend klein. In der Summe in (B.2.30) sind
dann Glieder, für die (є k − µ)⇑k B T ≪ 1 gilt, groß. Daraus folgt, dass für große T eine wach-
sende Zahl von Summanden auch mit großen Werten von є k zur Summe beitragen kann.
Damit die Summe N nicht überschreitet, muss (є k − µ) genügend groß werden, so dass je-
der Term in der Summe ausreichend klein ist. Das heißt, es ist wiederum notwendig, dass
e(є k −µ)⇑k B T ≫ 1 oder ∐︀n k ̃︀ ≪ 1 ist.
Wir können also insgesamt folgern, dass bei genügend niedriger Konzentration oder genü-
gend hoher Temperatur (є k − µ)⇑k B T so groß werden muss, dass für alle k
gilt. Gleichwertig damit ist, dass die Besetzungszahlen genügend klein werden müssen, so
dass für alle k
∐︀n k ̃︀ ≪ 1 (B.2.32)
gilt. Wir werden den Grenzfall niedriger Konzentration oder hoher Temperatur, für den die
Bedingungen (B.2.31) und (B.2.32) erfüllt sind, den klassischen Grenzfall nennen.
Wir wollen kurz eine anschauliche Begründung für die Anwendbarkeit der klassischen Be-
schreibung im Fall verdünnter Gase oder sehr hoher Temperaturen geben. Unter diesen
Bedingungen sind nur wenige Einzelzustände besetzt und diese fast ausnahmslos nur mit
einem Teilchen. Bei der Berechnung der Besetzungswahrscheinlichkeiten spielt dann die
Ununterscheidbarkeit der Teilchen und das Pauli-Prinzip keine Rolle mehr. Erstere, da eine
Umbesetzung der Teilchen ja fast immer bedeutet, dass die Teilchen in einen vorher nicht
besetzten Zustand gelangen und letzteres, da ja ein Zustand fast ausschließlich nur mit einem
Teilchen besetzt ist.
Im klassischen Grenzfall folgt wegen (B.2.31), dass sich sowohl für die Fermi-Dirac- als auch
die Bose-Einstein-Statistik auf
reduziert. Wegen (B.2.30) wird das chemische Potenzial durch die Bedingung
−(є −µ)⇑k B T
∑∐︀n k ̃︀ = ∑ e k = e µ⇑k B T ∑ e−є k ⇑k B T = N
k k k
−1
−є k ⇑k B T
oder e µ⇑k B T
= N (∑ e ) (B.2.34)
k
e−є k ⇑k B T
∐︀n k ̃︀ = N . (B.2.35)
∑ k e−є k ⇑k B T
Wir sehen also, dass im klassischen Grenzfall (genügend kleine Teilchendichte, große Tem-
peratur) sich die quantenmechanischen Verteilungen auf die Maxwell-Boltzmann-Vertei-
lung reduzieren. In Abb. B.4 wurde bereits gezeigt, dass die quantenmechanische und die
klassische Verteilungsfunktion bei großen Werten von (є k − µ)⇑k B T, also e(є k −µ)⇑k B T ≫ 1,
übereinstimmen.
Zum Vergleich sind in Abb. B.5 nochmals die Fermi-Dirac- und die Bose-Einstein-Ver-
teilung zusammen mit der Maxwell-Boltzmann-Verteilung für eine Temperatur von T =
2000 K und verschiedene Werte des chemischen Potenzials dargestellt. Wir weisen nochmals
darauf hin, dass die Verteilungen keine Wahrscheinlichkeiten darstellen, deren Integral je-
weils eins ergeben müsste, sondern Besetzungszahlen, deren Integral die Teilchenzahl ergibt.
Für die Bose-Einstein-Verteilung muss, damit die Teilchenzahl beschränkt bleibt, µ ≤ 0 sein.
Für die Fermi-Dirac-Verteilung ist dagegen µ ≥ 0.
3
Abb. B.5: Bose-Einstein-, Fermi-
Bose-Einstein Dirac- und Maxwell-Boltzmann-
µ=0 Verteilungen in Abhängigkeit von
2 Maxwell-Boltzmann der Energie. Für die Bose-Einstein-
Verteilung wurde µ = 0, für die Fermi-
f (k ) n(k )
angewendet, wobei die Funktion H(E) für E → −∞ verschwindet und für E → +∞ nicht
schneller als mit einer Potenz von E divergiert. Bekannte Beispiele sind H(E) = D(E) oder
H(E) = E D(E), für die das Integral (C.1.1) die Teilchenzahl oder die Gesamtenergie liefert.
Definiert man
E
K(E) = ∫ dE ′ H(E ′ ) , (C.1.2)
−∞
so dass
dK(E)
H(E) = , (C.1.3)
dE
so kann man (C.1.1) partiell integrieren und erhält
∞ ∞
∂f
∫ dE H(E) f (E) = ∫ dE K(E) (− ). (C.1.4)
∂E
−∞ −∞
Dabei nutzt man aus, dass der integrierte Ausdruck bei ∞ verschwindet, da die Fermi-
Funktion schneller gegen Null konvergiert als K divergiert, und bei −∞, da hier die Fermi-
Funktion eins ist während K verschwindet.
Da f ≃ 0, wenn E nur einige k B T größer als µ ist und f ≃ 1, wenn E nur einige k B T kleiner
als µ ist, wird seine Ableitung bezüglich E nur innerhalb einiger k B T um µ von null ver-
schieden sein. Wir können deshalb (C.1.4) auswerten, indem wir K(E) in eine Taylor-Reihe
um E = µ entwickeln:
∞
(E − µ)n d n K(E)
K(E) = K(µ) + ∑ ⌊︀ }︀ ⌊︀ }︀ . (C.1.5)
n=1 n! dE n E=µ
Substituieren wir (C.1.5) in (C.1.4), so ergibt der führende Term gerade K(µ), da
∞
∂f
∫ dE (− )=1. (C.1.6)
∂E
−∞
978 C Sommerfeld-Entwicklung
Da ferner ∂E eine gerade Funktion in (E − µ) ist, tragen nur Terme mit geradem n in (C.1.5)
∂f
zu (C.1.4) bei. Wir erhalten dann, wenn wir K mit Hilfe von (C.1.2) durch die ursprüngliche
Funktion H ausdrücken:
∞ µ
∂ℒ
pj ≡ , j = 1, 2, . . . , n . (D.1.1)
∂ ẋ j
Beim Übergang von der klassischen Physik zur Quantenmechanik wird der kanonische Im-
puls (im Gegensatz zum kinetischen Impuls) durch den Impulsoperator ersetzt:
ħ ∂
p j → ⧹︂
pj ≡ . (D.1.2)
ı ∂x j
Der verallgemeinerte oder kanonische Impuls ist derjenige, welcher der kanonischen Ver-
tauschungsrelation (︀x, p x ⌋︀ = ıħ gehorchen muss.
D.2 Lagrange-Funktion
Wir betrachten ein punktförmiges Teilchen mit Masse m und Ladung q, das sich im elektro-
magnetischen Feld bewegt. Die generalisierten Koordinaten entsprechen den kartesischen
Koordinaten in 3 Raumdimensionen. Das elektrische Feld E und das Magnetfeld B werden
über das Skalarpotenzial ϕ und das Vektorpotenzial A bestimmt:
∂A(r, t)
E(r, t) = − − ∇ϕ(r, t) (D.2.1)
∂t
B(r, t) = ∇ × A(r, t) . (D.2.2)
980 D Geladenes Teilchen in elektromagnetischem Feld
Die Euler-Lagrange-Gleichung
d
∇ṙ ℒ − ∇r ℒ = 0 . (D.2.6)
dt
führt auf die Bewegungsgleichung
∂A(r, t)
mr̈ = qṙ × (∇ × A(r, t)) − q − q∇ϕ(r, t)
∂t
= qE(r, t) + q (ṙ × B(r, t)) , (D.2.7)
auf deren rechter Seite die Lorentz-Kraft steht. Dieses Ergebnis bestätigt, dass der Ansatz
(D.2.5) für die Lagrange-Funktion richtig ist. Der verallgemeinerte Impuls ist gegeben durch
∂ℒ
p≡ = mṙ + qA(r, t) = pkin + pf . (D.2.8)
∂ṙ
Er setzt sich aus einem kinematischen Impuls pkin = mṙ = mv und einem Feldimpuls pf =
qA(r, t) zusammen und die kinetische Energie ist gegeben durch
1 2 1 1 2
mṙ = (mṙ)2 = (p − qA(r, t)) . (D.2.9)
2 2m 2m
Während uns der kinematische Impuls vertraut ist, ist der Ursprung des Feldimpules weni-
ger evident. Wir können uns den Feldimpuls verständlich machen, wenn wir den Impuls in
einem elektromagnetischen Feld betrachten, der mit einem sich im Magnetfeld bewegenden
geladenen Teilchen verknüpft ist. Er ist durch das Volumenintegral des Poynting-Vektors
S = (E × B)⇑µ 0 gegeben:
1
pf = ∫ S dV = є 0 ∫ E × B dV . (D.2.10)
c2
Für kleine Geschwindigkeiten v⇑c ≪ 1 können wir annehmen, dass B nur aus äußeren Quel-
len resultiert, wogegen E durch die Ladung des Teilchens verursacht wird. Für eine Punkt-
ladung am Ort r′ gilt
q
E = −∇ϕ , ∇2 ϕ = − δ(r − r′ ) (D.2.11)
є0
D.3 Hamilton-Funktion 981
und damit
pf = −є 0 ∫ dV ∇ϕ × ∇ × A
Da ∇ × (∇ϕ) = 0 und wir immer eine Eichung wählen können, für die ∇ ⋅ A = 0, ergibt sich
q
pf = −є 0 ∫ dV A∇2 ϕ = є 0 ∫ dV A δ(r − r′ ) = qA . (D.2.13)
є0
D.3 Hamilton-Funktion
Die Hamilton-Funktion ℋ(p, r, t) ist definiert durch
1 2
ℋ(p, r, t) = (p − qA(r, t)) + qϕ(r, t) . (D.3.3)
2m
Gehen wir von der klassischen Physik zur Quantenmechanik über, müssen wir den kanoni-
schen Impuls durch den Impulsoperator ersetzten und erhalten den Hamilton-Operator
2
⧹︂ r, t) = 1 ( ħ ∇ − qA(r, t)) + qϕ(r, t) .
ℋ(p, (D.3.4)
2m ı
Sie können deshalb in zwei Kategorien, nämlich unitäre und anti-unitäre Transformationen
unterteilt werden. Ein Beispiel für eine unitäre Transformation ist der Paritätsoperator 𝒫
(Raumspiegelung). Er kehrt das Vorzeichen von Ortsoperator x und Impulsoperator p um.
Der kanonische Kommutator (︀x, p⌋︀ = ıħ bleibt deshalb nur dann erhalten, wenn 𝒫 −1 𝒫 =
𝒫𝒫 −1 = ℐ. Ein Beispiel für eine anti-unitäre Transformation ist der Zeitumkehr-Operator 𝒯 .
Er lässt den Ortsoperator unverändert, invertiert aber die Impulsrichtung. Der Kommutator
bleibt deshalb nur dann unverändert, wenn 𝒯 −1 𝒯 = 𝒯 𝒯 −1 = −ℐ.
E.2 Zeitumkehrtransformation
Die Zeitumkehrtransformation führt einen Zustand ⋃︀Ψ̃︀ in einen Zustand ⋃︀Ψ′ ̃︀ über, der sich
mit der entgegengesetzten Zeitrichtung entwickelt. Im Vergleich zu ⋃︀Ψ̃︀ sind für diesen neu-
en Zustand ⋃︀Ψ′ ̃︀ die Vorzeichen aller linearen Impulse und Drehimpulse umgekehrt, alle
anderen Größen bleiben dagegen unverändert. Formal können wir die Zeitumkehr als phy-
sikalische Transformation
𝒯 ∶ t → −t (E.2.1)
einführen, welche die Zeit umkehrt. Viele grundlegenden physikalischen Gesetze sind sym-
metrisch bezüglich einer Umkehrung der Zeitrichtung. Wir bezeichnen sie dann als zeitum-
kehrinvariant. Zeitumkehrinvariante Prozesse laufen vollkommen gleich ab, wenn wir sie
auf der Zeitachse vorwärts oder rückwärts ablaufen lassen. Unsere tägliche Erfahrung zeigt
aber auch, dass viele makroskopische Phänomene nicht zeitumkehrinvariant sind: Lassen
wir z.B. zwei Gase interdiffundieren, so trennen sich diese bei Zeitumkehr nicht mehr. Hei-
ßer Kaffee kühlt sich ab und wird bei Zeitumkehr nicht mehr warm. Bei mikroskopischen
Prozessen sieht dies anders aus: Wenn wir alle Reibungseffekte ausschließen, sind die Gesetze
der klassischen Mechanik symmetrisch gegenüber Zeitumkehr. Das Gleiche gilt für die Be-
wegung von geladenen Teilchen im Magnetfeld. Bei Zeitumkehr ändern sowohl B als auch
v ihr Vorzeichen, so dass die Lorentz-Kraft FL = q(v × B) invariant ist. Das Magnetfeld B
wird nämlich durch einen elektrischen Strom J erzeugt, der bei Zeitumkehr sein Vorzeichen
ändert.1
Für die mathematische Darstellung des Zeitumkehr-Operators 𝒯 für Spin-1⇑2 Teilchen ge-
hen wir von dem Fall aus, dass wir wie in der nichtrelativistischen Physik mit einem Zwei-
erspinor arbeiten können:
Ψ1 (r, t) Ψ (r, t)
⋃︀Ψ(r, t)̃︀ = ( )=( ↑ ). (E.2.2)
Ψ2 (r, t) Ψ↓ (r, t)
1
Nichtsdestotrotz können wir in Festkörpern die Zeitumkehr als lokal gebrochen betrachten, wenn
wir ein äußeres Magnetfeld vorgeben. Dies ist z.B. für magneto-optische Effekte relevant.
E.3 Parität 985
Ψ↓⋆ (r, t)
⋃︀𝒯 Ψ(r, t)̃︀ = ( ). (E.2.3)
−Ψ↑⋆ (r, t)
Es werden also erstens die konjugiert-komplexen Wellenfunktionen gebildet (⋃︀Ψ̃︀ ↔ ⋃︀Ψ⋆ ̃︀),
zweitens die Spin-Komponenten vertauscht (↑↔↓) und drittens die Phasenfaktoren +1 bzw.
−1 addiert. Letzteres entspricht der üblichen Winkelhalbierung beim Übergang von Vekto-
○ ○
ren zu Spinoren: e ı0 ⇑2 = +1 und e ı360 ⇑2 = −1.
Für ein Elektron mit Spin s = 1⇑2 können wir die Darstellung
0 −ı 01
𝒯 = ıσ y 𝒦 = ı ( )𝒦 = ( )𝒦 (E.2.4)
ı 0 −1 0
verwenden, wobei σ y die Paulische Spin-Matrix und 𝒦 der Operator der komplexen Konju-
gation ist. Der Operator σ y sorgt für die Umkehr der Spin-Richtung, der Operator 𝒦 für die
Impulsumkehr. Zweimaliges Anwenden von 𝒯 ergibt
𝒯 2 = −1 , (E.2.5)
das heißt, der Zeitumkehr-Operator 𝒯 ist anti-unitär.
Falls der Hamilton-Operator eines Systems zeitumkehrinvariant ist, d.h. 𝒯 ℋ𝒯 −1 = ℋ, sollte
der Erwartungswert der Energie für den ursprünglichen Zustand ⋃︀Ψ̃︀ und den zeitumgekehr-
ten Zustand ⋃︀𝒯 Ψ̃︀ identisch sein. In der Tat gilt
E = ∐︀𝒯 Ψ⋃︀𝒯 ℋ𝒯 −1 ⋃︀𝒯 Ψ̃︀ = ∐︀Ψ⋃︀𝒯 ⋆ 𝒯 ℋ𝒯 −1 𝒯 ⋃︀Ψ̃︀ = ∐︀Ψ⋃︀ℋ⋃︀Ψ̃︀ , (E.2.6)
wobei wir die Eigenschaft 𝒯 ⋆ = 𝒯 −1 eines anti-unitären Operators benutzt haben.
Mit Hilfe des Zeitumkehroperators lässt sich auch leicht das Kramers-Theorem ableiten. Es
besagt, dass bei Vorliegen eines zeitumkehrinvarianten Hamilton-Operators Spin-1⇑2 Teil-
chen (z.B. Elektronen) zweifach entartete Energieeigenzustände besitzen. Wir haben be-
reits gezeigt, dass die Zustände ⋃︀Ψ̃︀ und ⋃︀𝒯 Ψ̃︀ die gleichen Eigenenergien besitzen. Da für
Spin-1⇑2 Teilchen nun aber 𝒯 2 = −1 gilt, folgt ∐︀Ψ⋃︀𝒯 Ψ̃︀ = ∐︀Ψ⋃︀𝒯 𝒯 −1 𝒯 Ψ̃︀ = −∐︀Ψ⋃︀𝒯 Ψ̃︀ = 0.
Das heißt, die beiden Zustände ⋃︀Ψ̃︀ und ⋃︀𝒯 Ψ̃︀ sind orthogonal. Das bedeutet, dass der zu-
gehörige Energieeigenzustand mindesten zweifach entartet sein muss. Mit ⋃︀Ψ̃︀ = ⋃︀Ψ↑ ̃︀ und
⋃︀𝒯 Ψ̃︀ = ⋃︀Ψ↓⋆ ̃︀ erhalten wir
E↑ (k) = E↓ (−k) . (E.2.7)
Abb. E.1a zeigt, dass zeitumgekehrte Spin-1⇑2-Zustände mit entgegengesetztem Impuls und
Spin die gleiche Energie haben. Man bezeichnet dies als Kramers-Entartung.
E.3 Parität
Die Paritätstransformation (räumliche Spiegelung) führt einen Zustand ⋃︀Ψ̃︀ in einen Zu-
stand ⋃︀Ψ′ ̃︀ über, der nach Auswahl eines Punktes als Koordinatenursprung durch einen Vor-
986 E Symmetrietransformationen
(a) 𝐸 (b) 𝐸
𝐸F 𝐸F
0 𝑘 0 𝑘
Abb. E.1: (a) Allgemeine Dispersionsrelation für Bandelektronen ohne Vorliegen einer Inversionssym-
metrie. Die zeitumgekehrten Zustände mit entgegengesetztem Impuls und Spin haben die gleiche Ener-
gie (Kramers-Entartung). (b) Dispersionsrelation bei Vorliegen einer Inversionssymmetrie. Zusätzlich
zur Kramers-Entartung liegt jetzt eine Entartung von Zuständen mit entgegengesetztem Impuls1unab-
hängig von der Spin-Richtung vor.
Wie bereits in Abschnitt 1.1.2.1 diskutiert wurde, kann diese Transformation aus einer Spie-
gelung an einer Ebene und einer anschließenden 180○ -Drehung um die senkrecht auf dieser
Ebene stehenden Achse zusammengesetzt werden. Bleibt eine physikalische Größe des Sys-
tems bezüglich der Paritätstransformation unverändert, so nennen wir das System hinsicht-
lich dieser Größe spiegelsymmetrisch, es hat eine gerade oder positive Parität. Wechselt eine
physikalische Größe bei gleichbleibendem Betrag dagegen ihr Vorzeichen, so hat das System
hinsichtlich dieser Größe eine ungerade oder negative Parität. In allen anderen Fällen liegt
keine bestimmte Parität vor und wir nennen solche Systeme unsymmetrisch in Bezug auf
den für die Transformation benutzten Koordinatenursprung.
Für einen Hamilton-Operator, der unter der Paritätstransformation invariant bleibt,2 d.h.
𝒫ℋ𝒫 −1 = ℋ, erwarten wir die gleichen Energieeigenwerte für die Zustände ⋃︀Ψ̃︀ und ⋃︀𝒫 Ψ̃︀,
was wir leicht analog zu (E.2.6) zeigen können. Dies trifft z.B. für den Hamilton-Operator
von Kristallelektronen bei vorliegender Inversionssymmetrie zu. In diesem Fall haben die
Bloch-Wellen Ψn,k ∝ e ık⋅r und 𝒫 Ψn,k ∝ e−ık⋅r (n ist der Bandindex) die gleichen Energieei-
genwerte, das heißt, es gilt
Liegt ferner Zeitumkehrinvarianz vor, so gilt zusammen mit der Kramers-Entartung (siehe
Abb. E.1b)
2
Dies ist insbesondere bei Vorliegen eines Zentralpotenzials V (r) = V (−r) oder bei Festkörpern
mit einem Inversionszentrum der Fall.
E.4 Ladungskonjugation 987
E.4 Ladungskonjugation
Die Ladungskonjugation 𝒞 ersetzt in quantenmechanischen Zuständen jedes Teilchen durch
sein Antiteilchen. Sie spiegelt also das Vorzeichen der Teilchenladung (elektrische Ladung,
Baryonenzahl, Leptonenzahl und die Flavour-Quantenzahl)3 und lässt Energie, Impuls,
Masse und Spin eines Teilchens unverändert. Die elektromagnetische und die starke Wech-
selwirkung sind invariant unter der Ladungskonjugation, die schwache Wechselwirkung
dagegen nicht.
Die Anwendung des 𝒞-Operators verwandelt ein Teilchen mit Zustand ⋃︀Ψ̃︀ in sein Anti-
Teilchen ⋃︀Ψ̃︀:
und damit
𝒞𝒞 † = 1 . (E.4.3)
Der 𝒞-Operator ist also unitär. Wenden wir ihn zweimal an, so erhalten wir
Es gilt also 𝒞 2 = 1 und 𝒞 = 𝒞 −1 . Insgesamt gilt damit 𝒞 = 𝒞 † , der 𝒞-Operator ist also hermi-
tesch und repräsentiert deshalb eine physikalische Observable.
Für die Eigenwerte des 𝒞-Operators gilt
Es sind deshalb nur die Eigenwerte η C = ±1 möglich, weshalb man auch von der 𝒞-Parität ei-
nes Teilchens spricht. Dies ist gleichbedeutend damit, dass 𝒞⋃︀Ψ̃︀ und ⋃︀Ψ̃︀ die gleichen Quan-
tenladungen besitzen müssen. Es können deshalb nur neutrale Teilchen Eigenzustände des
𝒞-Operators sein (z.B. das Photon, gebundene Teilchen-Antiteilchen-Zustände wie das neu-
trale Pion π 0 oder das Positronium).
3
Nukleonen, also neben dem Neutron auch das Proton, haben die Baryonenzahl +1, ihre Antiteil-
chen −1. Damit ist das Neutron nicht identisch mit dem Antineutron, auch wenn beide keine elek-
trische Ladung tragen. Das neutrale π-Meson sowie das Photon sind vollkommen ladungsneutral
und damit ihre eigenen Antiteilchen.
F Dipolnäherung
Wir diskutieren den Übergang eines Atoms von einem Ausgangszustand ⋃︀ĩ︀ in einen End-
zustand ⋃︀k̃︀ unter der Wirkung eines elektromagnetischen Feldes. Wie die quantenmecha-
nische Behandlung (zeitabhängige Störungsrechnung) zeigt, ist die Wahrscheinlichkeit für
einen solchen Übergang vom Zustand E i in den Zustand E k in niedrigster Ordnung dem
Absolutquadrat des Matrixelementes M i k des Wechselwirkungsoperators ℋr proportional:
2
M i k = ⋂︀∐︀i⋃︀ ℋr ⋃︀k̃︀⋂︀ . (F.1.1)
Das Matrixelement1 ist dabei, wie in der Formel angedeutet, bezüglich des Anfangszustan-
des ⋃︀ĩ︀ und des Endzustandes ⋃︀k̃︀ des elektronischen Übergangs zu bilden und schreibt sich
in der wellenmechanischen Darstellung als
Die Wechselwirkung der Elektronen mit einem äußeren Feld ist durch
e
ℋr = Â ⋅ p̂ (F.1.3)
m
gegeben.
Es ist zweckmäßig, für das Vektorpotenzial A im Falle des elektromagnetischen Strahlungs-
felds einen Fourier-Ansatz der Form
Für sichtbares Licht ist k ∼ 105 cm−1 . Da die Wellenfunktionen eine typische Ausdehnung
von wenigen Å aufweisen, ist in den Bereichen, in denen die Wellenfunktion nicht ver-
1
Wir können die Erwartungswerte M i k für alle Übergänge eines Atoms in einer Matrix anordnen,
deren von null verschiedene Elemente gerade alle möglichen Übergänge und ihre Amplituden an-
geben. Deshalb bezeichnen wir die M i k als Matrixelemente.
990 F Dipolnäherung
schwindet, kr ∼ 10−3 . Wir dürfen daher alle höheren Glieder in der Entwicklung (F.1.5) in
guter Näherung vernachlässigen. Die dominante Komponente der von Atomen emittierten
Strahlung hat Dipolcharakter.
Das Matrixelement (F.1.1) schreibt sich in der Dipolnäherung e ık⋅r ≃ 1 als
wobei p̂ e l = −er̂ der Operator des elektrischen Dipolmoments ist. Die zweite Proportionali-
tät kann mit Hilfe der Vertauschungsrelation2
1 2 iħ
)︀r̂, Ĥ 0 ⌈︀ = ]︀r̂, p̂ {︀ = p̂ (F.1.7)
2m e me
über
me me
∐︀i⋃︀ p̂ ⋃︀k̃︀ = ∐︀i⋃︀ r̂ Ĥ 0 − Ĥ 0 r̂ ⋃︀k̃︀ = (E k − E i ) ∐︀i⋃︀ r̂ ⋃︀k̃︀ ∝ ∐︀i⋃︀ r̂ ⋃︀k̃︀ (F.1.8)
iħ iħ
abgeleitet werden. Geht man in der Entwicklung obiger Exponentialfunktion einen Schritt
weiter, so kommt man zu den magnetischen Dipolen und elektrischen Quadrupolen. Sie
werden aber nur dann von Bedeutung, wenn die elektrischen Dipolelemente null sind.
2
Es gilt:
1 1 1
(︀r̂, p̂2 ⌋︀ = (r̂ p̂2 − p̂2 r̂) = (r̂ p̂2 − p̂(︀p̂ r̂⌋︀) .
2m e 2m e 2m e
Mit (︀r̂, p̂⌋︀ = r̂ p̂ − p̂ r̂ = iħ können wir umformen zu
1 1 1
(︀r̂, p̂2 ⌋︀ = (r̂ p̂2 − p̂(r̂ p̂ − iħ)) = (r̂ p̂2 − (p̂ r̂)p̂ + iħp̂)
2m e 2m e 2m e
und unter nochmaliger Benutzung der Identität (︀r̂, p̂⌋︀ = r̂ p̂ − p̂ r̂ = iħ zu
1 1
(︀r̂, p̂2 ⌋︀ = (r̂ p̂2 + (iħ − r̂ p̂)p̂ + iħp̂) ,
2m e 2m e
woraus sich
1 1 iħp̂
(︀r̂, p̂2 ⌋︀ = (r̂ p̂2 + 2iħp̂ − r̂ p̂2 ) =
2m e 2m e me
ergibt.
G Thermodynamische Eigenschaften
von Festkörpern
Wir wollen in diesem Anhang kurz einige wichtige Fakten zur Beschreibung der thermody-
namischen Eigenschaften von Festkörpern zusammenfassen. Bezüglich einer weiterführen-
den Diskussion wird auf die Fachliteratur verwiesen.1 , 2 , 3 , 4
System und sie nimmt im Gleichgewicht ein Minimum ein. Adiabatisch-isochore Prozes-
se werden durch ein Minimum der inneren Energie beschrieben. Sind, wie bei chemischen
Reaktionen meist der Fall, dagegen der Druck p, die Temperatur T und die Teilchenzahl N
die freien Parameter, so liefert die Enthalpie H die korrekte Beschreibung. Adiabatisch-iso-
bare Prozesse werden durch ein Minimum der Enthalpie beschrieben. Die gebräuchlichsten
thermodynamischen Potenziale, ausgedrückt jeweils als Funktion ihrer natürlichen Varia-
blen, sind die innere Energie 𝒰 = 𝒰(S, V , N), die freie Energie (auch Helmholtz-Potenzial
genannt) ℱ = ℱ(T, V , N), die Enthalpie ℋ = ℋ(S, p, N), die Gibbs-Energie5 (auch Freie
Enthalpie genannt) 𝒢 = 𝒢(T, p, N) und das großkanonisches Potenzial Ω = Ω(T, V , µ).
Die Schwierigkeit bei der Beschreibung von thermodynamischen Systemen liegt oft beim
Auffinden des geeigneten thermodynamischen Potenzials. Dabei ist es wichtig, zunächst
einen Satz von unabhängigen Variablen zu finden. Bekannte Sätze sind Druck p, Tempe-
ratur T und Teilchenzahl N oder Volumen V , Temperatur T und Teilchenzahl N. Bei der
Diskussion von elektrischen und magnetischen Eigenschaften kommen weitere Variablen
wie die Polarisation P oder die Magnetisierung M hinzu. Die thermodynamischen Poten-
ziale sind dadurch ausgezeichnet, dass bei einer differenziellen Variation gerade die Differen-
ziale der unabhängigen Variablen auftreten. Wir diskutieren im Folgenden einige einfache
Beispiele, wobei wir immer eine konstante Teilchenzahl N annehmen.
Hierbei ist δQ die reversibel zugeführte Wärmemenge und δWmech bzw. δWem die am Sys-
tem mechanisch bzw. elektromagnetisch geleistete Arbeit. Die elektromagnetisch geleistete
Arbeit kann zum Beispiel durch Polarisation eines dielektrischen Systems oder Magnetisie-
rung eines magnetischen Systems erfolgen. Wir können allgemein
δWem = ∑ F Z i ⋅ dZ i . (G.2.2)
i
δWII = ∑ F Z i ⋅ dZ i (G.2.4)
i
und damit
𝑷 ++ 𝑷 ++
+ +
+
+ + +
+
+
𝑽
Schema I Schema II
𝑰
magnetisierbares magnetisierbares
𝑩 Medium 𝑩 Medium
𝑰 𝑴 ++ 𝑰 𝑴 ++
+ +
+ +
+ +
Schema I Schema II
Abb. G.1: Beziehung zwischen elektrischer (oben) bzw. magnetischer Feldquelle (unten) und einem
polarisierbaren (oben) bzw. magnetisierbarem Medium (unten) in einem elektrischen (oben) bzw. ma-
gnetischen Arbeitsvorgang (unten). In (a) sind keine externen Quellen angeschlossen, so dass die elek-
trische bzw. magnetische Flussdichte konstant sein müssen. Die magnetische Feldquelle wird durch
einen Ring mit unendlich hoher Leitfähigkeit realisiert, damit die Flussdichte zeitlich nicht abklingt.
Diese Konfiguration entspricht einem Permanentmagneten. In (b) ist eine externe Spannungsquelle
(oben) bzw. eine Stromquelle (unten) angeschlossen, die das elektrische Feld (oben) bzw. das magneti-
sche Feld (unten) konstant halten. Die elektrische Konfiguration kann als Kugelkondensator aufgefasst
werden, dessen zweite Elektrode im Unendlichen auf Masse liegt.
G.2.1.1 Schema I
Wir betrachten zuerst die Arbeit, die geleistet werden muss, wenn wir einen elektrischen
Dipol mit Dipolmoment p (magnetischen Dipol mit magnetischem Moment m) aus dem
Unendlichen an eine bestimmte Position r1 zu bringen. Sie ist gegeben durch das Integral
über die Kraft Fel = −p ⋅ ∇Eext bzw. Fmag = −m ⋅ ∇Bext :
r1 r1 E1
WI = ∫ Fel ⋅ dr = − ∫ p ⋅ ∇Eext dr = − ∫ p ⋅ dEext (G.2.7)
∞ ∞ 0
r1 r1 B1
WI = ∫ Fmag ⋅ dr = − ∫ m ⋅ ∇Bext dr = − ∫ m ⋅ dBext . (G.2.8)
∞ ∞ 0
Hierbei geben die Integrationsgrenzen 0 und E1 (B1 ) die Werte des elektrischen (magneti-
schen) Feldes im Unendlichen und am Ort r1 an. Für δWem erhalten wir damit
Wir sehen, dass die verrichtete Arbeit negativ ist, wenn die Momente parallel zu den Feldern
ausgerichtet sind. Dies liegt daran, dass die Momente an den Ort r1 hingezogen werden.
Falls die Momente antiparallel zu den Feldern orientiert sind, liegt eine abstoßende Wech-
selwirkung vor. Die am System verrichtete Arbeit ist positiv, da wir ja gegen die abstoßende
Wechselwirkung Arbeit leisten müssen.
Wir können (G.2.9) und (G.2.10) leicht umschreiben und erhalten
Die geleistete Arbeit setzt sich aus der Änderung der Wechselwirkungsenergie −d(p ⋅ Eext )
(−d(m ⋅ Bext )) und der geleisteten Polarisierungsarbeit Eext ⋅ dp (Magnetisierungsarbeit
Bext ⋅ dm) zusammen.
G.2.1.2 Schema II
Wir wollen jetzt die Frage beantworten, welche Arbeit wir leisten müssen, um einen Fest-
körper im äußeren Feld null zu polarisieren (magnetisieren). Dies ist die Arbeit, die wir in
Schema II verrichten müssen. Bei diesem Prozess trägt die Arbeit, die wir am Dipol ver-
richten, ausschließlich zur inneren Energie bei. Im Gegensatz zum Schema I gibt es keine
996 G Thermodynamische Eigenschaften von Festkörpern
Wechselwirkungsenergie mit dem äußeren Feld, weil ja am Ende des Prozesses kein äußeres
Feld vorhanden ist. Um uns diesen fiktiven Prozess klar zu machen und die damit verbun-
dene Arbeit zu berechnen, betrachten wir folgenden reversiblen Prozess:
Wir müssen nun die mit Schritt 1 und Schritt 3 verbundene Arbeit berechnen. Die im
(1)
Schritt 1 verrichtete Arbeit WII entspricht der oben diskutieren Arbeit gemäß (G.2.7) und
(G.2.8). Für den Schritt 2 ist keine Arbeit notwendig. Im Schritt 3 leisten wir am Dipol
Arbeit, indem wir in aus dem elektrischen Feld E1 (magnetischen Feld B1 ) wieder in das
Feld null bringen. Diese Arbeit lässt sich aus (G.2.7) und (G.2.8) berechnen zu
0 0
(3)
WII = − ∫ p1 ⋅ dEext = −p1 ∫ dEext = p1 ⋅ E1 (G.2.13)
E1 E1
0 0
(3)
WII = − ∫ µ 0 m1 ⋅ dHext = −µ 0 m1 ∫ dHext = µ 0 m1 ⋅ H1 . (G.2.14)
H1 H1
Wir sehen, dass diese Arbeit positiv ist, wenn die Momente parallel zu den Feldern ausge-
richtet sind. Dies liegt daran, dass wir die Momente gegen die anziehende Wechselwirkung
ins Unendliche bringen müssen. Die am System verrichtete Arbeit ist folglich positiv. Wir
können nun die in Schritt 1 und 3 verrichteten Arbeiten summieren und erhalten die Ge-
samtarbeit in Schema II zu
E1
WII = − ∫ p ⋅ dEext + p1 ⋅ E1 (G.2.15)
0
B1
WII = − ∫ m ⋅ dBext + m1 ⋅ B1 . (G.2.16)
0
Wir können diese Ausdrücke umformen, indem wir die folgenden Identitäten
d(p ⋅ E) = p ⋅ dE + E ⋅ dp (G.2.17)
E1 p1
B1 B1 m1 m1
WII = −∫ m ⋅ dBext + ∫ m ⋅ dBext + ∫ Bext ⋅ dm = ∫ Bext ⋅ dm . (G.2.20)
0 0 0 0
Permanenter Dipol: Der Zusammenhang zwischen WI , WII und µ 0 m1 ⋅ B1 ist in Abb. G.2
anhand eines magnetischen Systems dargestellt. Wir können die Abbildung benutzen, um
0.8 𝑾𝐈𝐈
𝑾𝐈 + 𝒎1 ⋅ 𝑩1
0.4
3
W (bel. Einheiten)
𝒎1 ⋅ 𝑩1
0.0
1
-0.4
𝑩𝐞𝐱𝐭 = 𝟎
-0.8
𝑩𝟏
𝑾𝐈 = − න 𝒎 ⋅ d𝑩𝐞𝐱𝐭
2 𝟎
-1.2 𝑩𝐞𝐱𝐭 = 𝑩𝟏 Abb. G.2: Beziehungen zwischen den
Arbeiten WI und WII für ein magneti-
0 1 2 3 4 5 6 sierbares Medium. Die Zahlen deuten
r / r1 die drei Teilschritte im Schema II an.
998 G Thermodynamische Eigenschaften von Festkörpern
Die Arbeit, die wir benötigen, um das Medium im Nullfeld zu magnetisieren, ist dann
m1
WII = ∫ Bext ⋅ dm = 0 , (G.2.24)
mp
da m1 = m p . Wir sehen also, dass in diesem Fall keine innere Arbeit WII verrichtet wird, da
uns ja ein permanentes Moment vorgegeben wurde, das sich in der Schrittfolge 1 → 2 → 3
nicht ändert. Die Arbeit WI ist die reine Wechselwirkungsenergie des permanenten Mo-
ments mit dem äußeren Feld.
Paraelektrische und paramagnetische Systeme: Die Situation ist anders für ein para-
magnetisches Medium, d. h. ein magnetisch polarisierbares Medium mit Polarisierbarkeit α,
das kein permanentes Moment besitzt. Hier gilt
B1 B1
1
WI = − ∫ m ⋅ dBext = − ∫ αHext ⋅ dBext = − αB 2 (G.2.25)
2µ 0 1
0 0
m1 m1
1 1
WII = ∫ Bext ⋅ dm = ∫ µ 0 m ⋅ dm = µ 0 m 12 . (G.2.26)
α 2α
0 0
𝑚 (a) 𝑚 (b)
𝒎 𝑩ext 𝒎 𝑩ext
𝑚1 𝑚1
න 𝑩ext ⋅ d𝒎
න 𝒎 ⋅ d𝑩ex𝑡
0 0
0 𝐵1 𝐵ext 0 𝐵1 𝐵ext
Abb. G.3: Darstellung der magnetischen Arbeit anhand (a) einer linearen Magnetisierungskurve
m(Bext ) eines paramagnetischen Systems und (b) einer nichtlinearen Magnetisierungskurve eines Fer-
romagneten. Die rot hinterlegte Fläche stellt die Arbeit WII = ∫ Bext ⋅ dm dar, die für das Aufmagneti-
sieren des Materials benötigt wird. Das schraffierte Rechteck mit der Fläche B 1 m 1 gibt den Betrag der
Wechselwirkungsenergie −m1 ⋅ B1 des magnetischem Moments m1 mit dem äußeren Feld B1 an. Der
Betrag der Arbeit WI = − ∫ m ⋅ dBext entspricht der blauen Fläche. Diese erhalten wir, indem wir die
Summe der Magnetisierungsarbeit (rote Fläche) und der Wechselwirkungsenergie (negativer Wert der
schraffierte Fläche) bilden.
G.2 Innere Energie 999
Mit m 1 = αB 1 ⇑µ 0 folgt
1
WI = − µ 0 m 12 . (G.2.27)
2α
Die Arbeit WI können wir gemäß Abb. G.2 als Summe der Magnetisierungsarbeit WII =
1
µ m 2 und der Wechselwirkungsenergie −m 1 B 1 = − α1 µ 0 m 12 des induzierten magnetischen
2α 0 1
Moments mit dem Feld B 1 interpretieren. Der gleiche Sachverhalt ist nochmals in Abb. G.3
anhand einer Magnetisierungskurve eines paramagnetischen Systems mit einer linearen Ma-
gnetisierungskurve m(Bext ) und eines ferromagnetischen Systems mit einer nichtlinearen
m(Bext ) Abhängigkeit dargestellt.
̃II = ∫ H ⋅ δB dV .
δW (G.2.28)
V
Das Problem besteht nun darin, dass wir gerne einen Ausdruck für die Energie der Magneti-
sierungsverteilung M(r) einer ferromagnetischen Probe im von außen angelegten Feld Bext
hätten. Das lokale Magnetfeld, dass innerhalb der Probe vorherrscht ist aber
H = Hext + HN , (G.2.29)
B = µ 0 (H + M) = µ 0 (Hext + HN + M) (G.2.30)
gegeben. Wir weisen darauf hin, dass die Annahme einer vollkommen homogenen Magneti-
sierung selbst für gute Permanentmagnete unrealistisch ist. M(r) wird während des Magne-
tisierungsprozesses modifiziert und hängt von der Feldverteilung H(r) im Inneren des Mate-
rials ab. Die für ein Material konstitutive Beziehung ist M = M(H) und nicht M = M(Hext ).
Dies ist so, da wir ja nicht wollen, dass die ein Material charakterisierende Beziehung von
der Probenform abhängt.
Setzen wir H und B in (G.2.28) ein, so sehen wir, dass wir einen Beitrag ∫ Hext ⋅ δBext dV
̃II erhalten, der mit der Feldenergie im freien Raum verbunden ist und nichts mit der
zu δ W
1000 G Thermodynamische Eigenschaften von Festkörpern
Magnetisierungsarbeit zu tun hat. Ziehen wir diesen Beitrag ab, so erhalten wir
Mit den Beziehungen (G.2.29) und (G.2.30) ergibt sich H ⋅ δB = µ 0 (Hext + HN ) ⋅ (δHext +
δHN + δM) und damit
Das erste Integral auf der rechten Seite ergibt null7 und das zweite Integral entspricht dem
Beitrag δE m zur magnetostatischen Selbstenergie (vergleiche hierzu Abschnitt 12.1.5). Wir
erhalten also
Wir können nun noch zeigen, dass µ 0 ∫ HN ⋅ δM dV = −δE m . Hierzu benutzen wir
(12.1.27), woraus wir
1
−δE m = µ 0 ∫ δ(HN ⋅ M) dV
2
V
1
= µ 0 ∫ (HN ⋅ δM + M ⋅ δHN ) dV = µ 0 ∫ HN ⋅ δM dV (G.2.34)
2
V V
Da die Diskussion für ferroelektrische Materialien äquivalent ist, sehen wir, dass auch für
ferroelektrische und ferromagnetisches Materialien die Beziehungen (G.2.21) und (G.2.22)
gelten.
die Arbeit nach Schema I durch Verschieben eines elektrischen (magnetischen) Dipols im
Feld einer festen Ladung (magnetischen Dipols) verrichtet, so erhalten wir mit (G.2.9) und
(G.2.10)
Wird die Arbeit nach Schema II durch Polarisation (Magnetisierung) im elektrischen (ma-
gnetischen) Feld null verrichtet, so erhalten wir mit (G.2.21) und (G.2.22)
ℱ = 𝒰 − TS (G.3.1)
verknüpft. Im Spezialfall der reversiblen isothermen Expansion eines Gases entspricht die
Änderung der freien Energie gerade der vom Gas verrichteten Volumenarbeit. Für elektro-
magnetische Systeme ergeben sich mit (G.2.36) und (G.2.37) für das Differenzial die Aus-
drücke
ℱI ist somit das thermodynamische Potenzial für die unabhängigen Variablen T, V und
Eext (Bext ) für dielektrische (magnetische) Systeme. Isotherm-isochore Zustände für Eext =
1002 G Thermodynamische Eigenschaften von Festkörpern
const (Bext = const) werden durch ein Minimum der freien Energie beschrieben. Für die
Temperatur-, Volumen- und Feldabhängigkeit von ℱI erhalten wir:
∂ℱI ∂ℱI
−( ) = S−( ) =p
∂T V ,E ext (B ext ) ∂V T,E ext (B ext )
(G.3.4)
∂ℱI ∂ℱI
−( ) = p−( ) =m.
∂E ext V ,T ∂B ext V ,T
Für ℱII ist neben T und V die unabhängige Variable jetzt p bzw. m. Isotherm-isochore
Zustände (dT = dV = 0) für p = const (m = const) werden durch ein Minimum der freien
Energie beschrieben.
Die Änderung der freien Energie bei isotherm-isochoren Prozessen entspricht gerade der
vom System verrichteten elektromagnetischen Arbeit. Im Schema I ist diese Arbeit für p (m)
parallel zu Eext (Bext ) negativ. Dies liegt daran, dass die Wechselwirkungsenergie −p ⋅ Eext
(−m ⋅ Bext ) negativ ist. Im Schema II ist diese Arbeit dagegen positiv, da hier nur die innere
Selbstenergie zum System gezählt wird.
In den meisten Fällen ist man nur an der nach Schema II verrichteten Arbeit interessiert, da
diese nur die für das Polarisieren bzw. Magnetisieren eines Materials verrichtete Arbeit und
nicht die Wechselwirkungsenergie enthält. Das Differenzial dℱII der freien Energie enthält
dann neben −pdV den Ausdruck Eext ⋅ dp bzw. Bext ⋅ dm. Da in Experimenten neben der
Temperatur aber meist der Druck und die externen Felder Eext bzw. Bext die relevanten Va-
riablen sind, stellt üblicherweise nicht die freie Energie, sondern die im nächsten Abschnitt
diskutierte freie Enthalpie das interessierende thermodynamische Potenzial dar.
𝒢 = 𝒰 − T S + pV − ∑ F Z i ⋅ Z i (G.4.1)
i
G.4 Freie Enthalpie 1003
𝑚1 𝒎 𝑩ext
Δ𝐹∥
Δ𝐺∥
0
0 𝐵1 𝐵ext
Abb. G.4: Darstellung der Änderung der freien Energie ∆ℱII (rote Fläche) und des Betrags der freien
Enthalpie ⋃︀∆𝒢II ⋃︀ (blaue Fläche) bei reversibler Magnetisierung. Die Änderung der freien Enthalpie er-
halten wir zu ∆𝒢II = ∆ℱII − m 1 B 1 , das heißt, indem wir von der roten Fläche das schraffierte Rechteck
mit der Fläche m 1 B 1 abziehen. Da −m 1 B 1 gerade die Wechselwirkungsenergie zwischen m1 und B1
ist, unterscheiden sich ∆ℱII und ∆𝒢II also genau um die Wechselwirkungsenergie.
Mit den Beziehungen (G.2.36) und (G.2.37) erhalten wir daraus für Schema I8
d𝒢I = −SdT + Vd p − p ⋅ dEext (G.4.3)
ℱn = Vs fn + 1
B2 V
2µ 0 ext
. (G.5.1)
Hierbei ist fn die freie Energiedichte im Normalzustand bei Feld null und V = Vs + Va das
Gesamtvolumen, dass sich aus dem Probenvolumen Vs und dem Volumen Va außerhalb der
Probe zusammensetzt.
Im supraleitenden Zustand zeigt die Probe den Meißner-Effekt, so dass das Magnetfeld im
Inneren der Probe verschwindet. Für die freie Energie erhalten wir dann
ℱs = Vs fs + 1
B2 V
2µ 0 ext a
. (G.5.2)
Hierbei ist fs die freie Energiedichte im supraleitenden Zustand. Für die Differenz erhalten
wir
ℱn − ℱs = Vs (fn − fs ) + 1
B2 V
2µ 0 ext s
. (G.5.3)
Da fn − fs = 1
B2
2µ 0 cth
(vergleiche hierzu Abschnitt 13.2), erhalten wir für B ext = B cth
Wir können dieses Ergebnis vor dem Hintergrund der Diskussion in den vorangegangenen
Abschnitten einfach verstehen. Da für einen Supraleiter M = −Hext gilt, können wir (G.5.4)
mit m = Vs M wie folgt umschreiben:
Wir sehen also, dass die Änderung der freien Energie beim Übergang in den supraleiten-
den Zustand aus der Wechselwirkungsenergie des magnetischem Moments des Supraleiters
mit dem externen Feld resultiert. Da m antiparallel zu Bext steht, ist dieser Energiebeitrag
negativ. Er tritt auf, da wir die Arbeit nach Schema I berechnet haben (wir haben einen Su-
praleiter in das Feld einer Spule gebracht und ihn dort belassen), und wird natürlich von der
Magnetspule geliefert. Da wir beim Übergang vom supraleitenden zum normalleitenden Zu-
stand eine Flussänderung haben, resultiert eine Induktionsspannung in der Spule und das
Netzteil muss die Arbeit ∫ IVdt verrichten, um den Strom und damit das externe Feld kon-
stant zu halten. Wir sehen, dass sich die freie Energie gut für Situationen eignen würde, in
denen wir die Flussdichte B festhalten. Für den in Experimenten meist vorliegenden Fall ei-
nes vorgegebenen äußeren Magnetfeldes Bext gilt dies allerdings nicht. Um zu erreichen, dass
G.6 Spezifische Wärme 1005
und
𝒢s = Vs fs + 1
B2 V
2µ 0 ext a
+ 1 2
B V
µ 0 ext s
. (G.5.7)
Da fn − fs = 2µ1 0 B 2cth , folgt aus der Forderung 𝒢n = 𝒢s für das Phasengleichgewicht am Pha-
senübergang jetzt gerade B ext = B cth .
Das diskutierte Beispiel zeigt, dass es häufig einer subtilen Analyse bedarf, um das geeignete
thermodynamische Potenzial zur Beschreibung eines physikalischen Systems zu finden.
Halten wir den Druck p und das elektrische (magnetische) Feld konstant, so erhalten wir bei
isobar-reversibler Prozessführung mit δQ rev = TdS
∂S ∂2 𝒢
Cp = T ( ) = −T ( 2 ) (G.6.3)
∂T p,E ext (B ext ) ∂T p,E ext (B ext )
Literatur
H. B. Callen, Thermodynamics and an Introduction to Thermostatistics, John Wiley & Sons
(1985).
G. Carrington, Basic Thermodynamics, Oxford University Press, Oxford (1994).
C. Kittel, H. Krömer, Thermodynamik, R. Oldenbourg Verlag, München (2001).
F. Schwabl, Statistische Mechanik, Springer Verlag, Heidelberg (2000).
Christoph Strunk, Moderne Thermodynamik, Walter de Gruyter Verlag, Berlin (2015).
H Herleitungen zur Supraleitung
H.1 Madelung-Transformation
Die Darstellung einer quantenmechanischen Wellenfunktion als Amplitude ψ 0 (r, t) und
Phase θ(r, t) geht auf Erwin Madelung zurück.1 , 2 Er interpretierte die Schrödinger-Glei-
chung der linear unabhängigen Funktionen ψ und ψ ∗ als zwei hydrodynamische Gleichun-
gen, die eine „Wahrscheinlichkeitsflüsigkeit“ beschreiben. Das Einsetzen der Wellenfunk-
tion ψ = ψ 0 e ı θ in die Schrödinger-Gleichung wird deshalb als Madelung-Transformation
bezeichnet. Wendet man die Idee von Madelung auf das Konzept der makroskopischen Wel-
lenfunktion eines Supraleiters oder von Supraflüssigkeiten an, kann man für diese quanten-
hydrodynamische Gleichungen ableiten.
Wir gehen von einem geladenen Teilchen mit Ladung q und Masse m aus [vergleiche
(13.3.18)], das wir mit der Wellenfunktion Ψ(r, t) beschreiben. Die Schrödinger-Gleichung
lautet:
2
1 ħ ∂Ψ(r, t)
( ∇ − qA(r, t)) Ψ(r, t) + (︀qϕ(r, t) + µ(r, t)⌋︀Ψ(r, t) = ıħ .
2m ı ∂t
(H.1.1)
Hierbei ist qϕ(r, t) + µ(r, t) das elektrochemische Potenzial. Wir ersetzen nun die Wellen-
funktion Ψ(r, t) des Teilchens durch die makroskopische Wellenfunktion
ψ(r, t) = ψ 0 (r, t)e ı θ(r,t) (H.1.2)
des Supraleiters sowie q und m durch die Ladung q s und Masse m s der „supraleitenden“
Elektronen. Damit ergibt sich
2
1 ħ ∂ψ(r, t)
( ∇ − q s A(r, t)) ψ(r, t) +(︀q s ϕ(r, t) + µ(r, t)⌋︀ ψ(r, t) = ıħ .
2m s ı ∂t
)︁⌊︂⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ]︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂)︂ )︁⌊︂⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ]︂⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ )︂
II I
(H.1.3)
Unter Benutzung der Wirkung S(r, t) = ħθ(r, t) erhalten wir für die Teile I und II folgende
Ausdrücke:
∂ψ(r, t) ∂ψ 0 (r, t) ∂S(r, t) ı S(r,t)⇑ħ
I = ıħ = ⌊︀ıħ − ψ 0 (r, t) }︀ e (H.1.4)
∂t ∂t ∂t
1
E. Madelung, Eine anschauliche Deutung der Gleichung von Schrödinger, Naturwiss. 14, 1004 (1926).
2
E. Madelung, Quantentheorie in hydrodynamischer Form, Z. Phys. 40, 322 (1926).
1008 H Herleitungen zur Supraleitung
2
1 ħ
II = ( ∇ − q s A(r, t)) ψ(r, t)
2m s ı
⎨ ⎬
1 ⎝⎝ 2 2 ⎠
2 2⎠
= ⎝−ħ ∇ + ıħq s ∇ ⋅ A + ıħq s A ⋅ ∇ + q s A ⎠ ψ 0 (r, t)e ı S(r,t)⇑ħ (H.1.5)
2m s ⎝⎝)︁⌊︂⌊︂ ⌊︂ ]︂⌊︂ ⌊︂ ⌊︂ )︂ )︁⌊︂⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ]︂⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ )︂ )︁⌊︂⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ]︂⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ )︂ ⧸︀⎠⎠
⎪ 1 2 3 4 ⎮
Die Auswertung von II erfordert etwas Aufwand. Die mit 1 bis 4 markierten Beiträge ergeben
ħ 2 ∇2
1=− ψ 0 e ı S⇑ħ
2m s
1
= )︀−ħ 2 ∇2 ψ 0 + ψ 0 (∇S)2 − 2ıħ∇ψ 0 (∇S) − ıħψ 0 ∇2 S⌈︀ e ı S⇑ħ (H.1.6)
2m s
1
2= ıħq s ψ 0 (∇ ⋅ A)e ı S⇑ħ + term 3 (H.1.7)
2m s
1
3= (︀ıħq s A ⋅ (∇ψ 0 ) − q s ψ 0 A(∇S)⌋︀ e ı S⇑ħ (H.1.8)
2m s
1
2+3= (︀ıħq s ψ 0 (∇ ⋅ A) + 2ıħq s A ⋅ (∇ψ 0 ) − 2q s ψ 0 A(∇S)⌋︀ e ı S⇑ħ (H.1.9)
2m s
1
4= q s ψ 0 A2 e ı S⇑ħ (H.1.10)
2m s
Summieren wir die verschiedenen Beiträge auf, so ergibt sich für den Teil II
⎨ ⎬
⎝ ⎠
⎝ (∇S − q A)2 ħ 2 ∇2 ⎠
⎝ ı ⎠
II = ⎝ψ 0 − ψ0 − (2ħ∇ψ 0 + ħψ 0 ∇)(∇S − q s A)⎠ e ı S⇑ħ
s
⎝ s )︁⌊︂⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ]︂⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ )︂⎠
⎝ 2m s 2m s 2m ⎠
⎝ ⎠
⎪ = ψħ ∇⋅)︀ψ 20 (∇S−q s A)⌈︀
0 ⎮
(∇S − q s A)2 ħ 2 ∇2 ħ ψ2
= ⌊︀ψ 0 − ψ0 − ı ∇ ⋅ ( 0 (∇S − q s A))}︀ e ı S⇑ħ
2m s 2m s 2ψ 0 ms
(H.1.11)
Wir setzen jetzt die Ergebnisse (H.1.11) für II und (H.1.4) für I in (H.1.3) ein und spalten
nach Real- und Imaginärteil auf. Für den Realteil erhalten wir
(∇S − q s A)2 ħ 2 ∇2 ∂S
⌊︀ψ 0 ( + q s ϕ + µ) − ψ 0 }︀ e ı S⇑ħ = −ψ 0 e ı S⇑ħ (H.1.12)
2m s 2m s ∂t
was wir in
∂S (∇S − q s A)2 ħ 2 ∇2 ψ 0
+ +q s ϕ + µ = (H.1.13)
∂t 2m s 2m s ψ 0
)︁⌊︂⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ]︂⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ )︂
= 12 m s v s2 = 2n1 s Λ J s2
H.1 Madelung-Transformation 1009
umschreiben können. Der zweite Term auf der linken Seite stellt dabei die kinetische Ener-
gie dar und die Summe aus zweitem bis viertem Term ist die Hamilton-Funktion H. Unter
Benutzung des London-Koeffizienten Λ = m s ⇑n s q 2s erhalten wir schließlich
∂θ(r, t) 1 ħ 2 ∇2 ψ 0 (r, t)
ħ + ΛJ s2 (r, t) + q s ϕ(r, t) + µ(r, t) = . (H.1.14)
∂t 2n s 2m s ψ 0 (r, t)
Wenn wir Terme der Ordnung ∇2 vernachlässigen, was immer dann zulässig ist, wenn die
betrachteten elektromagnetischen Potenziale langsam variieren, erhalten wir
∂θ(r, t) 1
ħ = −( ΛJ2 (r, t) + q s ϕ(r, t) + µ(r, t)) . (H.1.15)
∂t 2n s s
Dieser Ausdruck stellt eine Energie-Phasen-Beziehung dar, da in der Klammer auf der rech-
ten Seite die Summe aus kinetischer und potenzieller Energie steht.
Der Term auf der rechten Seite von (H.1.14) ist proportional zur räumlichen Variation der
Amplitude ψ 0 der makroskopischen Wellenfunktion, d.h. zu räumlichen Variationen der
Dichte der supraleitenden Elektronen. Er enthält ħ und deutet auf den quantenmechani-
schen Ursprung des Ausdruckes hin. Im quasi-klassischen Grenzfall (ħ 2 → 0) erhalten wir
die klassische Hamilton-Jacobi-Gleichung
∂S(r, t)
= −H(r, t) . (H.1.16)
∂t
∂ψ 0 ı S⇑ħ ħ ψ2
ıħ e = −ı ∇ ⋅ ( 0 (∇S − q s A)) e ı S⇑ħ , (H.1.17)
∂t 2ψ 0 ms
umschreiben können. Da ⋃︀ψ 02 ⋃︀ = n s der Teilchendichte entspricht, erkennen wir sofort, dass
(H.1.18) die Form einer Kontinuitätsgleichung ∂n s ⇑∂t + ∇ ⋅ J ρ = 0 für die Teilchenstrom-
dichte J ρ hat. Multiplizieren wir J ρ mit q s , so erhalten wir die supraleitende Stromdichte
ħ qs
Js (r, t) = q s n s { ∇θ(r, t) − A(r, t) . (H.1.19)
ms ms
Dieser Ausdruck stellt eine Strom-Phasen-Beziehung dar. Die Energie-Phasen- und die
Strom-Phasen-Beziehung beinhalten die wesentliche Physik einer geladenen Supraflüssig-
keit.
1010 H Herleitungen zur Supraleitung
Hierbei umfasst Vext (r) die Beiträge der externen Felder und der Faktor 1⇑2 verhindert eine
Doppelzählung. Wir können nun die Feldoperatoren einsetzen. Dadurch geht die Summe
über alle N Teilchen in eine Summe über alle k über und eine Integration über den gesamten
Raum vervollständigt die Fourier-Transformation in den k-Raum:
2
⧹︂ † (r) (− ħ ∇2 + Vext (r)) Ψ
ℋBCS = ∫ Ψ ⧹︂σ (r)dr
σ
2m i
1 ′ ⧹︂ † ⧹︂ ⧹︂ † ′ ⧹︂ ′ ′
+ ∫ V (r − r )Ψ σ (r)Ψσ (r)Ψσ (r )Ψσ (r )drdr . (H.2.4)
2
Für die kinetische Energie erhalten wir
2 2 2
⧹︂ † (r) (− ħ ∇2 ) Ψ
⧹︂σ (r)dr = 1 ∑ ∑ ∫ ⧹︂ −ık′ ⋅r ħ k
𝒯 =∫ Ψ σ c †
′
k σ e ⧹︂
c kσ e ık⋅r dr
2m i V σ k,k′ 2m
(H.2.5)
ħ2 k 2 †
= ∑∑ ⧹︂
c ⧹︂
c kσ . (H.2.6)
σ k 2m kσ
Die anderen Terme können in ähnlicher Weise ausgewertet werden, so dass wir insgesamt
ℋBCS = ∑ є k ⧹︂†
c kσ ⧹︂
c kσ + ∑ Vq c k† 1 +q,σ1 c k† 2 −q,σ2 c k2 ,σ2 c k1 ,σ1 (H.2.7)
k,σ k 1 ,k 2 ,q,σ 1 ,σ 2
H.3 Grundzustandsenergie 1011
ℋBCS = ∑ є k ⧹︂†
c kσ ⧹︂
c kσ + ∑ Vk,k′ c k↑
† †
c−k↓ c−k′ ↓ c k′ ↑ . (H.2.9)
k,σ k,k′
Hierbei steht Vk,k′ für V (k − k′ ) = V (q) mit q = k − k′ . Die kinetische Energie wir häufig
auf das chemische Potenzial µ bezogen, so dass in (H.2.9)
ξk = єk − µ , (H.2.10)
verwendet wird.
H.3 Grundzustandsenergie
Wir schätzen ab, um wie viel die Gesamtenergie des Elektronensystems im supraleitenden
relativ zum normalleitenden Zustand für T = 0 abgesenkt ist. Wir gehen dabei von (13.5.65)
aus und nutzen aus, dass der Beitrag ∑k E k )︀α k† α k − β †k β k ⌈︀ der Bogoliubov-Quasiteilchen
keinen Beitrag sowohl bei T = 0 (keine Quasiteilchen angeregt) als auch im Normalzustand
liefert. Für den supraleitenden Zustand bei T = 0 erhalten wir
∐︀ℋBCS ̃︀ = ∑ (ξ k − E k + g k† ∆ k ) . (H.3.1)
k
⌈︂
Im Grenzfall ∆ k → 0 erhalten wir mit E k = ξ k2 + ∆2k ≃ ⋃︀ξ k ⋃︀ für den Normalzustand
Hierbei haben wir ausgenutzt, dass ⋃︀ξ k ⋃︀ = −ξ k für ⋃︀k⋃︀ ≤ k F (Teilchen-Loch-Symmetrie). Für
die Absenkung der Grundzustandsenergie im supraleitenden Zustand für T = 0 erhalten wir
∆E = ∐︀ℋBCS ̃︀ − ∐︀ℋn ̃︀
= ∑ (ξ k − E k + g k† ∆ k ) − 2ξ k + ∑ (ξ k − E k + g k† ∆ k ) . (H.3.3)
⋃︀k⋃︀<k F ⋃︀k⋃︀≥k F
Den letzten Term in der runden Klammer können wir umformen, indem wir g k† = u k v k⋆ und
∆k uk
v⋆
= ξ k + E k benutzen. Damit erhalten wir
k
∆ k u k v k⋆ 1 ξk ⋃︀∆ k ⋃︀2
g k† ∆ k = v k⋆ = (ξ k − E k ) ( − )=
2
v k⋆ 2 2 2E k 2E k
⋃︀∆ k ⋃︀2
= ⌈︂ (H.3.5)
2 ξ k2 + ⋃︀∆ k ⋃︀2
und durch Einsetzen in (H.3.4) schließlich
⎨ ⌉︂ ⋃︀∆ k ⋃︀2 ⎬
⎝ ⎠
∆E = 2 ∑ ⎝ ξ k − ξ k2 + ⋃︀∆ k ⋃︀2 + ⌈︂ ⎠. (H.3.6)
⎝ 2 + ⋃︀∆ ⋃︀2 ⎠
⋃︀k⋃︀>k F ⎪ 2 ξ k k ⎮
Um die Diskussion einfach zu halten, benutzen wir im Folgenden ⋃︀∆ k ⋃︀ = ∆. Wir können nun
unter Verwendung der Zustandsdichte für eine Spin-Richtung D(0)⇑2 = D(E F )⇑2 (bei der
Summation wird nicht über die Spin-Projektionen aufsummiert) die Summation in eine In-
tegration überführen. Mit der Substitution x = ξ k ⇑∆ erhalten wir
z
⌋︂ 1
∆E = D(E F )∆ ∫ dx ⌊︀x − 2
x 2 + 1 + ⌋︂ }︀ . (H.3.7)
0
2 x2 + 1
⌋︂ ist z = ħω
Hierbei D ⇑∆
⌋︂ die durch die−1 ⌋︂
Debye-Energie bestimmte obere Integrationsgrenze. Mit
−1 −1
∫ dx x + 1 = 2 (x x + 1 + sinh x) sowie ∫ dx(2 x + 1) = 2 sinh x erhalten wir
2 1 2 2 1
1 1 ⌋︂ 1
∆E = D(E F )∆2 ]︀ z 2 − (z z 2 + 1 − sinh−1 z) + sinh−1 z{︀ . (H.3.8)
2 2 2
⌈︂
Da z = ħω D ⇑∆ ≫ 1 können wir 1 + 1⇑z 2 ≃ 1 + 1⇑2z 2 verwenden und erhalten
1 1 1
∆E = D(E F )∆2 ]︀z 2 − z 2 (1 + 2 ){︀ = − D(E F )∆2 . (H.3.9)
2 2z 4
Wir erhalten also die Kondensationsenergie bei T = 0 zu
1
E Kond (0) = ∐︀ℋBCS ̃︀ − ∐︀ℋn ̃︀ = − D(E F )∆2 (0) . (H.3.10)
4
H.4 Josephson-Gleichungen
Um die Josephson-Gleichungen für einen Supraleiter/Isolator/Supraleiter (SIS) Kontakt her-
zuleiten, benutzen wir die zeitabhängige Schrödinger-Gleichung
∂ψ(r, t)
ıħ = Eψ(r, t) . (H.4.1)
∂t
H.4 Josephson-Gleichungen 1013
und beschreiben die beiden Supraleiter 1 und 2, welche die Elektroden eines Josephson-
Kontakts bilden, mit den makroskopischen Wellenfunktionen
Hierbei sind ⋃︀ψ 0,1 ⋃︀2 = n s1 und ⋃︀ψ 0,2 ⋃︀2 = n s2 die Dichten der gepaarten Elektronen in den bei-
den Supraleitern, die wir als zeitunabhängig annehmen. Aufgrund der endlichen Kopplung
zwischen den beiden Wellenfunktionen ändert sich die Wellenfunktion ψ 1 (r, t) mit einer
Rate, die proportional zur Kopplungsstärke K 12 zu Supraleiter 2 ist. Umgekehrt gilt das glei-
che für die Wellenfunktion ψ 2 (r, t). Falls die Kopplungsstärke der beiden Supraleiter klein
gegenüber den stationären Energieeigenwerten E 1 und E 2 der beiden Supraleiter ist, können
wir das gekoppelte System analog zu zwei schwach gekoppelten harmonischen Oszillatoren
beschreiben. Die gekoppelten Schrödinger-Gleichungen lauten
∂ψ 1 (r, t)
ıħ = E 1 ψ 1 (r, t) + K 12 ψ 2 (r, t) = e∆ϕψ 1 (r, t) + K 12 ψ 2 (r, t) (H.4.3)
∂t
∂ψ 2 (r, t)
ıħ = E 2 ψ 2 (r, t) + K 21 ψ 1 (r, t) = −e∆ϕψ 2 (r, t) + K 21 ψ 1 (r, t) . (H.4.4)
∂t
Hierbei haben wir angenommen, dass der Energieunterschied E 1 − E 2 = q s ∆ϕ = 2e∆ϕ
durch die Potenzialdifferenz ∆ϕ bestimmt wird und wir haben den Energienullpunkt
symmetrisch zwischen E 1 und E 2 gelegt. Setzen wir die Wellenfunktionen (H.4.2) ein
(dies entspricht wiederum einer Madelung-Transformation) und spalten nach Real- und
Imaginärteil auf, so erhalten wir für den Imaginärteil
}︂
∂θ 1 K n s2 e∆ϕ
=− cos φ − (H.4.5)
∂t ħ n s1 ħ
}︂
∂θ 2 K n s1 e∆ϕ
=− cos φ + . (H.4.6)
∂t ħ n s2 ħ
∂n s1 2K ⌋︂
=+ n s1 n s2 sin φ (H.4.7)
∂t ħ
∂n s2 2K ⌋︂
=− n s1 n s2 sin φ . (H.4.8)
∂t ħ
Aus (H.4.7) und (H.4.8) folgt ∂n∂ts1 = − ∂n∂ts2 . Diese Beziehung bedeutet nichts anderes als die
Erhaltung der Teilchendichte: Alle Teilchen, die aus Supraleiter 1 herausfließen, müssen in
Supraleiter 2 hineinfließen und umgekehrt. Multiplizieren wir ∂n∂ts1 bzw. ∂n∂ts2 mit der Ladung
q s = −2e der supraleitenden Elektronen und teilen durch die Kontaktfläche A, so erhalten
wir die von 1 nach 2 bzw. die von 2 nach 1 fließende (technische) Josephson-Stromdichte:
2e ∂n s1 2e ∂n s2
J s1→2 = , J s2→1 = . (H.4.9)
A ∂t A ∂t
1014 H Herleitungen zur Supraleitung
Setzen wir (H.4.7) und (H.4.8) ein, so erhalten wir die als Strom-Phasen-Beziehung bezeich-
nete erste Josephson-Gleichung zu
4eK ⌋︂
Js = n s1 n s2 sin φ = J c sin φ . (H.4.10)
ħA
Die Größe der kritischen Stromdichte J c hängt wie erwartet von der Kopplungsstärke K
und den Cooper-Paardichten der beiden Supraleiter ab. Für SIS-Kontakte aus zwei gleichen
Supraleitern gilt3
π∆(T) ∆(T)
J c (T) = tanh ( ), (H.4.11)
2eR n A kB T
wobei R n A das Produkt aus Normalwiderstand und Fläche des Josephson-Kontakts ist. Für
T → 0 erhalten wir I c R n = π∆(0)⇑2e, das heißt, das Produkt aus kritischem Strom und Nor-
malwiderstand wird durch die Energielücke des Supraleiters bestimmt.
Wir benutzen nun die Zeitableitung der eichinvarianten Phasendifferenz [vergleiche
(13.6.8)]
2
∂φ ∂θ 2 ∂θ 1 2e ∂
= − − ∫ A(r, t) ⋅ dl (H.4.12)
∂t ∂t ∂t ħ ∂t
1
und setzen die Zeitableitungen der Phasen entsprechend (H.4.5) und (H.4.6) ein. Wir schrei-
ben noch die Potenzialdifferenz ∆ϕ als Linienintegral des Potentialsgradienten und erhalten
damit für n s1 = n s2
2
∂φ 2e∆ϕ 2e ∂
= − ∫ A(r, t) ⋅ dl
∂t ħ ħ ∂t
1
2
2e ∂A
= ∫ (−∇ϕ − ) ⋅ dl . (H.4.13)
ħ ∂t
1
)︁⌊︂⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ]︂⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ ⌊︂ )︂
=U
Hierbei entspricht U dem Spannungsabfall über den Kontakt. Die deshalb als Spannung-
Phasen-Beziehung bezeichnete zweite Josephson-Gleichung lautet also
∂φ 2eU
= . (H.4.14)
∂t ħ
3
V. Ambegaokar, A. Baratoff, Tunneling Between Superconductors, Phys. Rev. Lett. 10, 486-489
(1963).
I SI-Einheiten
Das aus dem metrischen System weiterentwickelte Internationale Einheitensystem SI (Sys-
tème Internationale d’Unités) enthält als die 7 Basiseinheiten Meter (m), Kilogramm (kg),
Sekunde (s), Ampère (A), Kelvin (K), Candela (Cd) und Mol (mol). Hinzu kommen die beiden
ergänzenden Einheiten Radiant und Steradiant. Seit dem 01. 01. 1978 ist in der Bundesrepu-
blik Deutschland die Verwendung des SI-Einheitensystems im amtlichen und geschäftlichen
Verkehr gesetzlich vorgeschrieben.
Abgeleitete SI-Einheiten werden durch Multiplikation und Division aus den SI-Basis-
einheiten, immer mit dem Faktor 1 (kohärent), gebildet. Für viele abgeleitete SI-Einheiten
wurden besondere Namen und Einheitenzeichen festgelegt, z. B. Newton (N) für die Einheit
der Kraft und Volt (V) für die der elektrischen Spannung.
Das SI ist weltweit von der internationalen und nationalen Normung übernommen wor-
den (z. B. ISO 1000, DIN 1301). In den EU-Mitgliedstaaten ist es die Grundlage für die
Richtlinie über Einheiten im Messwesen (EU-Richtlinien 80/181 und 89/617). Ausführli-
che Informationen zum SI Einheitensystem findet man bei der Physikalisch-Technischen
Bundesanstalt unter http://www.ptb.de oder dem National Institut of Standards unter
http://www.physics.nist.gov.
Ihr ausführendes Organ, die Generalkonferenz für Maß und Gewicht, tagte zum ersten Mal
im Jahr 1889. Sie genehmigte Prototype für das Meter und das Kilogramm und verteilte sie
an die Mitgliedstaaten. Auf den folgenden Treffen ging es vor allem um ein Ziel: ein neues in-
ternationales Einheitensystem zu schaffen. 1948 verabschiedete die 9. Generalkonferenz für
Maß und Gewicht einen Entwurf für ein solches Einheitensystem, das zunächst auf sechs Ba-
siseinheiten beruhte. Alle anderen Einheiten sind mit diesen Basiseinheiten ausschließlich
über Multiplikation und Division verbunden. Der große Vorteil dieses Systems: Sämtliche
Umrechnungsfaktoren fielen weg.
Die 10. Generalkonferenz für Maß und Gewicht im Jahr 1954 nahm die sechs Basisein-
heiten offiziell an: Länge (Meter), Masse (Kilogramm), Zeit (Sekunde), elektrische Strom-
stärke (Ampère), thermodynamische Temperatur (Kelvin) und Lichtstärke (Candela). Eine
siebte Basiseinheit, die der Stoffmenge (Mol), kam erst 1973 dazu. Sie wird heute üblicher-
weise an sechster Stelle genannt. Diese Änderung der historisch gewachsenen Reihenfolge
hat das Internationale Büro für Maß und Gewicht (Bureau International des Poids et Me-
sures, BIPM) veranlasst, um auszudrücken, dass die Entwicklung in der Optik möglicher-
weise zu einer Diskussion über die Candela als Basiseinheit führen wird.
Im Jahr 1960 bekam das neue System seinen Namen: Système International d’Unités, ab-
gekürzt SI. Die 11. Generalkonferenz für Maß und Gewicht im Jahr 1960 vereinbarte, dass
diese Abkürzung in allen Sprachen zu verwenden ist, und verabschiedete Vorsätze zur Be-
zeichnung der dezimalen Vielfache und Teile von Einheiten. In Deutschland wurde das neue
System mit dem Gesetz über Einheiten im Messwesen (Einheitengesetz) vom 2. Juli 1969 und
der Ausführungsverordnung zu dem Gesetz vom 5. Juli 1970 eingeführt. Seit dem 1. Januar
1978 sind die alten Einheiten in Deutschland verboten.
I.3 Vorsätze
Faktor Bezeichnung Abkürzung Faktor Bezeichnung Abkürzung
1024 Yotta Y 10−1 Dezi d
1021 Zetta Z 10−2 Zenti c
1018 Exa E 10−3 Milli m
1015 Peta P 10−6 Mikro µ
12 −9
10 Tera T 10 Nano n
109 Giga G 10−12 Pico p
106 Mega M 10−15 Femto f
103 Kilo k 10−18 Atto a
102 Hekto h 10−21 Zepto z
101 Deka da 10−24 Yokto y
I.4.2 Masse
Einheit Abkürzung Umrechnung
atomare Masseneinheit u 1 u = 1.660 565 5 × 10−27 kg
Tonne t 1 t = 1000 kg
metrisches Karat 1 Karat = 2 × 10−4 kg
pound lb 1 lb = 0.4536 kg
ounce oz 1 oz = 1⇑16 lb = 0.02835 kg
I.4.4 Temperatur
Einheit Abkürzung Umrechnung
Grad Celsius ○
C T(○ C) = T(K) − 273.15 (K)
Grad Fahrenheit ○
F T(○ F) = 9
5
T(○ C) + 32
1020 I SI-Einheiten
I.4.5 Winkel
Einheit Abkürzung Umrechnung
Radiant rad 1 rad = 1 m⇑m
Grad ○
1 ○ = (2π⇑360) rad = 1.745 × 10−2 rad
Winkelminute ′ 1′ = 2.91 × 10−4 rad
Winkelsekunde ′′ 1′′ = 4.85 × 10−6 rad
Neugrad gon 1 gon = 2π⇑400 rad
Steradiant sr 1 sr = 1 m2 ⇑m2
Schwerpunkt Festkörpertheorie
1. Fundamentals of the Theory of Metals, A. A. Abrikosov, North-Holland, Amsterdam (1988).
2. Quantum Theory of the Solid State, J. Callaway, Academic Press, New York (1991).
3. Advanced Solid State Physics, Philip Phillips, Cambridge University Press, (2012).
4. Correlated Electrons in Quantum Matter, Peter Fulde, World Scientific, Singapore (2012).
5. Quantentheorie der Festkörper, Charles Kittel, Oldenbourg Verlag, München (1970).
6. Electrons and Phonons, J. M. Ziman, Oxford University Press, Oxford (1962).
7. Principles of the Theory of Solids, J. M. Ziman, Cambridge University Press, Cambridge (1972).
8. Prinzipien der Festkörpertheorie, J. M. Ziman, Verlag Harry Deutsch, Zürich (1975).
9. Festkörpertheorie, O. Madelung, Springer Verlag, Berlin (1972).
10. Elektronentheorie der Metalle, A. Sommerfeld, H. Bethge, Heidelberger Taschenbuch, Bd. 19,
Springer Verlag, Berlin (1967).
11. Solid State Theory, W. A. Harrison, McGraw-Hill, New York (1970).
12. Electronic Properties of Metals and Alloys, A. Dugdale, Edward Arnold Publishers, London (1982).
13. Simulations for Solid State Physics, Robert H. Silsbee, Jörg Dräger, Cambridge University Press,
Cambridge (1997).
14. Anharmonic Crystal, R. A. Cowley, Rep. Prog. Phys. 31, 123 (1968).
15. Thermal Conduction in Solids, R. Berman, Oxford University Press (1976).
16. Thermal Conduction in Semiconductors, C. M. Bhandari, D. M. Rowe, John Wiley and Sons, New
York (1988).
1028 Literatur
Weiterführende Literatur
Kristallographie, Strukturbestimmung
1. Kristallographie, W. Borchardt-Ott, Springer-Verlag, Berlin (2008).
2. Einführung in die Kristallographie, W. Kleber, H.-J. Bautsch, J. Bohm, D. Klimm, Oldenbourg Ver-
lag, München (2010).
3. Crystal Structure Analysis, J. P. Clusker, K. N. Trueblood, Oxford University Press (1985).
4. Kristallstrukturbestimmung, W. Massa, Teubner Verlag, Stuttgart (1996).
5. Theorie und Praxis der Röntgenstrukturanalyse, E. R. Wölfel, Vieweg, Braunschweig, Wiesbaden
(1987).
6. Introduction to X-Ray Crystallography, M. M. Woolfson, Cambridge University Press, Cambridge
(1997).
Kristalldefekte
1. Defects in Crystalline Solids, H. Henderson, Edward Arnold, London (1972).
2. Introduction to Dislocations, D. Hull, D. J. Bacon, Butterworth Heinemann, Oxford (2001).
3. Physikalische Grundlagen der Metallkunde, G. Gottstein, Springer-Verlag, Berlin (1998).
Werkstoffwissenschaften
1. Werkstoffkunde, H. J. Bargel, G. Schulze, 8. Aufl., Springer-Verlag, Berlin (2004).
2. Werkstofftechnik 1 und 2, W. Bergmann, Hauser-Verlag, München (2003).
3. Werkstoffe, E. Hornbogen, Springer-Verlag, Berlin (2002).
4. Ceramic Science for Materials Technologists, I. J. McCohn, Hill, Glasdow (1983).
5. Physikalische Metallkunde, P. Haasen, Springer-Verlag, Berlin (1994).
6. Die Kunststoffe und ihre Eigenschaften, H. Dominghaus, Springer Verlag, Berlin (1998).
Bandstruktur, Fermi-Flächen
1. Electronic Structure: Basic Theory and Practical Methods, R. M. Martin, Cambridge University
Press (2004).
2. Density Functional Theory, R. M. Dreizler, E. K. U. Gross, Springer Verlag, Berlin (1990).
3. Electronic Structure and the Properties of Solids, W. A. Harrison, Dover Publications (1989).
4. Electrons at the Fermi Surface, M. Springford , Cambridge University Press (1980).
5. Magnetic Oscillations in Metals, D. Shoenberg, Cambridge University Press (1980).
6. Fermi Surface, A. P. Crackwell, K. C. Wong, Oxford Univ. Press, London (1973).
Halbleiterphysik
1. Fundamentals of Semiconductors, P. Y. Yu, M. Cardona, Springer Verlag, Berlin (1996).
2. The Physics of Semiconductors: An Introduction Including Nanophysics and Application,
M. Grundmann, Springer Verlag, Berlin (2010).
3. Halbleiterphysik, Rolf Sauer, Oldenbourg Verlag, München (2009).
4. Semiconductor Physics, K. Seeger, Springer Series on Solid State Science, Vol. 40, Springer Verlag,
Berlin (1991).
Literatur 1029
5. Grundlagen der Halbleiterphysik, O. Madelung, Heidelberger Taschenbuch, Bd. 71, Springer Ver-
lag, Berlin (1970).
6. Semiconductor Devices: Physics and Technology, S. M. Sze, Wiley, New York (1985).
7. The Physics of Semiconductor Devices, S. M. Sze, John Wiley & Sons, New York (1981).
8. Electron and Holes in Semiconductors, W. Shockley, Van Nostrand, Princeton (1950).
9. Grundlagen der Halbleiterphysik, O. Madelung, Heidelberger Taschenbach Nr. 71, Springer Berlin,
Heidelberg (1970).
10. Two-dimensional Systems: Physics and New Devices, herausgegeben von G. Bauer, F. Kuchar,
H. Heinrich, Springer Series on Solid Sate Science, Vol. 67, Springer Berlin, Heidelberg (1986).
11. Introduction to the Theory of the Integer Quantum Hall Effect, M. Janssen, O. Viehweger, U. Fas-
tenrath, J. Hajdu, VCH Weinheim (1994).
12. The Quantum Hall Effect, R. E. Prange, S. M. Girvin, Springer Verlag, New York, Berlin (1990).
13. The Quantum Hall Effect – Fractional and Integral, T. Chakraborty, P. Pietiläinen, Springer Series
on Solid-State Science, Vol. 85, Springer Berlin, Heidelberg (1995).
14. The Quantum Hall Effect: A Perspective, A. H. McDonald, Kluwer, Boston (1989).
15. The Physics of Low Dimensional Semiconductors, J. H. Davies, Cambridge University Press, Cam-
bridge (1998).
16. Quantum Transport in Semiconductor Devieces, C. W. Beenakker, H. van Houten, Solid State
Physics 44, 1 (1991).
Dielektrische Eigenschaften
1. Theory of Dielectrics, H. Fröhlich, Oxford University Press (1986).
2. Optical Absorption and Dispersion in Solids, J. N. Hodgson, Chapman and Hall, London (1970).
3. Elementary Theory of Optical Properties of Metals, F. Stern, Solid Sate Physics 15, 300 (1963).
4. Dielectric Function of Condensed Systems, L. V. Keldysh, D. A. Kirzhnits, A. A. Maradudin, Elsevier
Publ., Amsterdam (1989).
5. Polarons and Excitons in Semiconductors and Ionic Crystals, Hrsg. J. T. Devreese und F. M. Peeters,
Plenum Press, New York (1984).
6. Optical Properties of Metals and Alloys, P. O. Nilsson, Solid State Physics 29, 139 (1974).
7. Nonlinear Optics, N. Bloembergen, W. A. Benjamin (1965).
8. Nonlinear Optics, Robert W. Boyd, 3. Auflage, Academic Press, New York (2008).
9. Optik, W. Zinth, U. Zinth, 3. Auflage. Oldenbourg, München (2011).
10. Optik, E. Hecht, 5. Auflage. Oldenbourg Wissenschaftsverlag, München (2009).
11. Structural Phase Transition, Hrsg. K. A. Müller, H. Thomas, Springer Verlag, Berlin, Heidelberg
(1981).
12. Plasmonics: Fundamentals und Applications, S. Maier, Springer Verlag, Berlin (2007).
Magnetismus
1. The Physical Principles of Magnetism, A. H. Morrish, IEEE Press, New York (1999).
2. Magnetism and Magnetic Materials, J. M. D. Coey, Cambridge University Press, Cambridge
(2010).
3. Magnetism, J. Stöhr, H. C. Siegmann, Springer-Verlag Berlin Heidelberg (2006).
4. Physics of Ferromagnetism, Soshin Chikazumi, Oxford University Press (1997).
5. Quantentheorie des Magnetismus I+II W. Nolting, Teubner, Stuttgart (1986).
6. Quantum Theory of Magnetism, Robert M. White, Springer, New York (1983).
7. Introduction to the Theory of Ferromagnetism, Amikam Aharoni, 2. Auflage, Oxford University
Press, New York (2000).
1030 Literatur
8. Magnetism in Condensed Matter, Stephen Blundell, Oxford University Press, New York (2001).
9. Magnetic Domains, A. Hubert, R. Schäfer, Springer-Verlag, Berlin, Heidelberg (1998).
10. Ferromagnetic Domains, C. Kittel, J. K. Galt, Solid State Physics 3, 437 (1956).
11. The Theory of Magnetism I and II, D. C. Mattis, Springer-Verlag Berlin Heidelberg (1988).
12. The Theory of Magnetism Made Simple, D. C. Mattis, World Scientific Singapore (2006).
13. Spin Fluctuations in Itinerant Electron Magnetism, T. Moriya, Springer Ser. Solid-State Sci., Vol. 56,
Springer, Berlin, Heidelberg (1985).
14. Spin Electronics, Hrsg. M. Ziese, M. J. Thornton, Springer-Verlag, Berlin, Heidelberg (2001).
S. 516
VIAS Encyclopedia, Wikimedia Commons
URL http://www.vias.org/encyclopedia/bio_schottky.html
S. 678
Gerhard Hund, Wikimedia Commons, lizensiert unter
Creative Commons Attribution 3.0 Unported
URL: http://creativecommons.org/licenses/by/3.0/legalcode
S. 878
PetaRZ, Wikimedia Commons, lizensiert unter
Creative Commons-Lizenz Namensnennung-Weitergabe unter gleichen Bedingungen 3.0
Unported
URL: http://creativecommons.org/licenses/by-sa/3.0/legalcode
Index
A Austauschfeld, 722, 724, 757
Abrikosov, Alexei Alexeyevich, 778, 836 Austauschintegral, 125
Abrikosov-Gitter, 837 Austauschkonstante, 700, 701
Abschirmradius, 629 Austauschkopplung, 745
Abschirmung Austauschloch, 713
klassisches Gas, 628 Austauschwechselwirkung, 117, 138, 671, 698, 703,
Metalle, 622–642 722, 736
Phononen in Metallen, 633–636 direkte, 703
statische, 623 Doppelaustausch, 704
Thomas-Fermi, 625 itinerante Elektronen, 711–718
Abschlussdomäne, 743 lokalisierte Elektronen, 698–705
Absorption, 579 RKKY-Wechselwirkung, 705
optische, Halbleiter, 493 Superaustausch, 703
Absorptionskoeffizient, 494, 495, 580 Austrittsarbeit, 355, 527
GaAs, 621 Avogadro-Konstante, 215
Metall, 613 Azbel-Kaner-Geometrie, 478
Absorptionskonstante, 579 Azbel-Kaner-Resonanz, 479
Absorptionsspektrum, 595
Achse B
polare, 644 Bahndrehimpuls, 663, 678, 707
adiabatische Näherung, 118, 172–175, 201 Bahndrehimpulsquantenzahl, 681
Air Mass (AM), 540 Bahnquantisierung, 459–470
Aktorik, 655 freie Ladungsträger, 459–464
Alfjorow, Schores Iwanowitsch, 554 Kristallelektronen, 465–468
amorphe Festkörper, 46 Bandbreite, 324
Anderson-Isolatoren, 349 Banddiskontinuität, 547
Andreev-Zustände Tabelle, 548
gebundene, 920 Bandferromagnetismus, 714–717
anharmonische Effekte, 647, 651 Bandindex, 320, 324, 374
Anisotropie Bandstruktur, 315–363, 323, 350, 374, 386
magnetische, 734–741 Berechnungsmethoden, 328–344
magnetokristalline, 708 APW-Methode, 342
Anisotropieenergie, 744 KKR-Methode, 342
Anisotropiekonstante, 737 LCAO-Methode, 342
hexagonale, 739 LMTO-Methode, 342
kubische, 739 OPW-Methode, 342
uniaxiale, 738 Pseudopotenzial-Methode, 342
Anomaler Hall-Effekt einfache Metalle, 352
extrinsisch, 443–445 experimentelle Bestimmung, 354–358
intrinsisch, 436–439 GaAs, 493
anomaler Skin-Effekt, 479 Ge, 489, 492
Antiferroelektrizität, 585, 643 Halbleiter, 354, 489–492
Antiferromagnetismus, 671, 730–734 kritische Punkte, 351
Anti-Stokes-Linie, 210 Kuprat-Supraleiter, 909
Antwortfunktion, lineare, 416, 578 Si, 489, 492
Atomformfaktor, 76 Übergangsmetalle, 353
Atomradius, 142, 676 Bandüberlappung, 347
Austauschanisotropie, 735, 741 Bandverbiegung, 548
Austauschbosonen, 848 Bardeen, John, 542, 770, 779, 789, 847
Austauschenergie, 701 Bardeen-Stephen Modell, 900
1034 Index
G H
Gaskonstante, allgemeine, 216 H2 -Molekül, 122–129
Geim, Andre, 35 Potenzialkurve, 125
Generationsstrom, 518 H+2 -Molekülion, 118–122, 121
geometrische Phase, 937 Halbleiter, 483–571
Gesamtdrehimpuls, 678 Absorptionskoeffizient, 494
Giaever, Ivar, 875 Akzeptor, 503
Gilbert, William, 659 Akzeptorniveau, 501
Gilbert-Dämpfung, 753 amorphe, 485
Ginzburg, Vitaly Lasarevich, 778, 814, 847 Banddiskontinuität, 547
Ginzburg-Landau-Gleichungen, 815 Tabelle, 548
erste, 819 Bandlücke, 620
zweite, 820 Bandverbiegung, 548
Ginzburg-Landau-Kohärenzlänge, 822, 833 Beweglichkeit, 508
anisotrope, 913 Tabelle, 511
1038 Index
Y
V Yosida, Kei, 705
Valenzbandkante, 546, 551, 554 Yosida-Funktion, 880
Valenzbindungsnäherung, 124–126 Young’s modulus, 151, 160
Valenzelektronen, 136, 361 Yukawa-Potenzial, 629
Valley-Entartung, 558
van Alphen, P.M., 355, 471 Z
Van der Waals Bindung, 102–110 Zeeman-Energie, 744
Bindungsenergie, 108 Zeeman-Wechselwirkung, 710
Van der Waals Wechselwirkung Zeitumkehrinvarianz, 325, 951, 984
Potenzial, 105 Zeitumkehr-Operator, 984
van der Waals, Johannes Diderik, 102, 103 Zeitumkehrtransformation, 984, 985
van Hove Singularität, 351 Zener, Clarence Melvin, 532, 704
van Leeuwen, Johanna Hendrika, 660 Zener-Diode, 532
Van Vleck Paramagnetismus, 673, 688 Zener-Tunneln, 532
van Vleck, John H., 673 Zentrierung, 15
Variationsrechnung, 864 Zinkblende-Struktur, 492
Varshni-Formel, 490 Zirkulation, 944
Verarmungszone, 537, 551 Zonenrand, 330
Index 1047