Gummi-Kappen und alte Schachteln


x Heidi's Spielzeug
x Teilchenkonzentrationen
x Boltzmannfaktor I
x Fermi-Dirac-Verteilung I
x Verteilungsfunktionen
x Berechnung von Extremwerten
x Reihenentwicklung für Fakultäten großer Zahlen
x Boltzmannfaktor II
x Boltzmannfaktor III
x Fermi-Dirac-Verteilung II


Heidis Spielzeug


  • Beim Gedankenexperiment der chemischen Solarzelle bei Heidi's Kreis wurde behauptet, dass das Konzentrationsprodukt bei Beleuchtung exponentiell mit der gespeicherten Energie zunimmt.
  • Mit der Ableitung diesen Zusammenhangs (für Solarzellen aus Halbleitermaterialien) beschäftigen sich die nächsten Kapitel. So "nebenbei" werden wir uns auf dem Weg dorthin einige neue Werkzeuge und Konzepte erarbeiten.
  • Es wird um Begriffe wie "Boltzmannfaktor", "Fermi-Dirac-Verteilung", "Zustandsdichte" und den Zusammenhang zwischen Teilchenkonzentration und totelem chemischen Potential (Quasi-Fermienergie) gehen.
  • Gefragt sind wieder möglichst bunte Modelle, die die nötige Mathematik enthalten...wir brauchen erst mal eine schöne Spielwiese.

  • Heidi hat auf dem Dachboden eine alte Kiste mit Spielzeug entdeckt: da gibt es eine Menge alter Pappschachteln und Gummi-Kappen. So tolle Teile, die man umstülpen kann und die dann nach einer Weile in die Luft springen. (Gibts die noch in Kaugummiautomaten?)
  • Heide stellt fest, dass man in eine Pappschachtel gerade zwei Gummi-Kappen legen kann. Damit sie zusammen Platz haben, muss Heidi allerdings eine Kappe umdrehen (Abb. 2.1).


SchachtelmitKappen.png
Abb. 2.1: Zwei Gummi-Kappen in einer Pappschachtel

  • An der Wand der Dachkammer gibt es zwei Pinnwände aus Kork, an die Heidi die Pappschachteln mit Reiszwecken festheften kann.
  • Dazu soll es eine Spielregel geben: Es dürfen niemals zwei Schachteln in exakt gleicher Höhe angebracht werden.
  • Einer bestimmten Höhe kann man also maximal eine Schachtel, bzw. maximal zwei Gummi-Kappen zuordnen.
  • Heidi hat sich über ihre Entdeckung gefreut und eifrig begonnen, die Schachteln an die Pinnwände zu tackern (Abb. 2.2).

Pinnwand.png
Abb. 2.2 Schachteln an der Pinnwand

  • Heidi baut sich noch eine kleine Abschussrampe, indem sie ein Brettchen mit einem Ende auf einen Stabel Bücher legt.
  • Sie stülpt die Gummi-Kappen um und legt sie auf die Abschussrampe.
  • Nach einer Weile fliegen die Gummis in Richtung Wand und einige bleiben in den Schachteln liegen.
  • Wir gehen davon aus, dass sich die Gummis auf den Schubladen nicht stabeln können; maximal zwei sollen in einer Pappschachtel Platz finden.
  • Die Wahrscheinlichkeit, dass eine Schachtel besetzt wird, soll nur von der Höhe der Schachtel an der Pinnwand abhängen. (Die Schachteln werden in unserem Gedankenexperiment nicht von den anderen Schachteln verdeckt oder so.)
  • Anstatt von der Höhe sprechen wir ab jetzt von der potentiellen Energie E, die ein Gummi in einer Schachtel (in Bezug auf den Boden) hat.
  • Einer bestimmten potentiellen Energie kann man also eine bestimmte Schachtel zuordnen (falls es dort eine gibt) und umgekehrt.
  • In einem gewählten Energiebereich (den man z.B. als farbigen Streifen auf der Pinnwand markieren kann) gibt es eine bestimmte Anzahl von Schachteln, die sich durch Abzählen ermitteln lässt.
  • In Solarzellenmaterialien gibt es auch "Energieplätze", die mit Elektronen besetzt werden können.
  • Die Pinnwände sollen ein Analogon zu einem Energieschema eines Halbleiterkristalls sein. Diese Vorstellung hinkt natürlich.
  • Vorerst ist aber schon alles enthalten, was wir brauchen: unsere Spielwiese ist fertig.
  • Der Begriff des Halbleiters wurde selbst noch nicht erläutert. Das kommt später.

Teilchenkonzentrationen


  • Die ganzen Gummis und Schachteln sollen dazu dienen, eine spezielle Art des Abzählens von Teilchen zu veranschaulichen.
  • Die Methode mag zunächst kompliziert erscheinen. Sie bietet aber eine elegante Möglichkeit zur Beschreibung der Vorgänge in Halbleitern.
  • Wenn Heidi wissen möchte, wie viele Gummis sich insgesamt in den Schachteln einer Pinnwand befinden, kann sie alle einzeln abzählen.
  • Wenn es aber sehr sehr viele Schachteln (z.B. 10^23) und sehr sehr viele Gummis (z.B. 10^16) gibt, ist es sinnvoll, anders vorzugehen.
  • Heidi ermittelt zunächst die Dichte der Schachteln in Abhängigkeit von der potentiellen Energie E.
  • Nimmt man diese Dichte mal zwei, erhält man die Dichte ρ(E) der verfügbaren Plätze für Gummi-Kappen..
  • Wird diese neue Dichte mit der "Energielänge" dE eines schmalen Bereichs auf der Pinnwand multipliziert, ergibt sich die Anzahl dN der verfügbaren Plätze in diesem Bereich:




Pinnwand-E-Bereiche.png
Abb. 2.3 Schmale Energiebereiche mit verschiedenen Schachtel-Dichten

  • Durch den Beschuss soll es eine Wahrscheinlichkeit f geben, mit der diese Plätze durch Gummis besetzt sind.
  • Multipliziert man die Anzahl der verfügbaren Plätze mit der Besetzungswahrscheinlichkeit f(E), erhält man die Anzahl der besetzten Plätze im Energiebereich dE.
  • Die Dichte der Schachteln betrage in einem Energiebereich von dE = 10^(-10) eV im Mittel z.B. 10^20 1/eV und die Besetzungswahrscheinlichkeit für einen Platz in dem Bereich sei im Mittel f = 0,1. Dann gibt es 2 x 10^9 Gummi-Kappen in diesem Bereich:



  • Die Gesamtanzahl der Gummis an einer Pinnwand ergibt sich als Summe über alle einzelnen betrachteten Energiebereiche einer Pinnwand.
  • Wir gehen davon aus, dass es sehr viele Schachteln gibt, und die Energieabstände zwischen den Schachteln sehr gering sind. Dann kann man den Zusammenhang als Integral kontinuierlicher Funktionen schreiben:



  • Diese Formel stellt die gesuchte Abzählmethode dar.
  • Damit wir sie anwenden können, brauchen wir die Dichte der verfügbaren Plätze, die Wahrscheinlichkeit, mit der die Plätze besetzt werden (jeweils in Abhängigkeit von der Energie) und die Grenzen E_unten und E_oben des Energiebereichs, der uns interessiert.
  • Eine Beschreibung, die unabhängig von der Größe des Halbleiters ist, wäre schön. (Hier springst du vom "Schachtelmodell" zum Halbleiter: bei den Schachteln ist es schwer vorstellbar, dass die Anzahl an Gummis von der Größe der Pinnwand unabhängig ist, da sie von den Grenzen E_unten und E_oben abhängt.)
  • Dazu wird die gesamte Gleichung durch das Volumen V des Halbleiters geteilt.
  • Auf der linken Seite steht dann die Teilchenzahldichte ( = Teilchenkonzentration) n = N / V.
  • Die ("doppelte") Dichte D(E) auf der rechten Seite, die Anzahl verfügbarer Plätze pro Energie und pro Volumen, wird Zustandsdichte genannt:



  • Damit lautet unsere allgemeine Formel für die Ermittlung von Teilchenkonzentrationen:



  • (Nebenbemerkungen: I. Die Zustandsdichte soll dabei unabhängig vom Ort im betrachteten Halbleiter sein. Sonst dürfte man das Volumen nicht so einfach ins Integral ziehen. Ist die Zustandsdichte übers Volumen nicht konstant, dürfen nur jeweils kleine Volumenstücke betrachtet werden, in denen D konstant ist. Für uns wird die Formel in angegebenen Form immer ausreichen, daher die Bezeichnung "allgemein". II. Die "zweite Achse" an der Pinnwand, die horizontale Richtung, hat als Analogon im Halbleiter nichts mit der räumlichen Ausdehnung zu tun. Wir brauchen sie nur für die bildliche Vorstellung. Später kann man in diese Richtung einen Impuls auftragen.)
  • In der Formel ist im Prinzip auch schon der Zusammenhang zwischen Teilchenkonzentration und Quasi-Fermienergie enthalten. Die Quasi-Fermienergie steckt nämlich in der Besetzungswahrscheinlichkeit f(E) mit drin.
  • Wie wir nachher noch sehen werden, wird diese Besetzungswahrscheinlichkeit f(E) in Halbleitern (meistens) durch die sogenannte Fermi-Dirac-Verteilung beschrieben.
  • Herzuleiten, wie die konkreten Zustandsdichten D(E) in Halbleitern aussehen (Abb. 2.4), ist nicht gerade einfach. Auch um "nur" eine näherungsweise Beschreibung zu finden, müssen wir weit ausholen. Das wird in einem extra Kapitel geschehen.


Zustandsdichte.png
Abb. 2.4 Zustandsdichte eines Halbleiterkristalls

  • Das "große Ziel" dieses und der nächsten Kapitel ist es, die obige Formel für die Teilchenkonzentrationen mit Inhalt zu füllen und auzurechnen.
  • Es wird darauf hinauslaufen, dass die Zustandsdichte näherungsweise durch Wurzelfunktionen und die Besetzungswahrscheinlichkeit näherungsweise durch abfallende Exponentialfunktionen beschrieben werden.
  • Für das erste Verständnis der Teilchenzahlkonzentrationen kann man diese Näherungslösungen hinnehmen ohne sie zu verstehen und in einer späteren Iteration die Herleitungen nachvollziehen. (Es wird empfohlen, sich erst einen Überblick zu verschaffen und Einzelheiten später einzusortieren.)
  • Für gedultige Leser geht es im Rest dieses Kapitels darum, Ausdrücke für Besetzungswahrscheinlichkeiten f(E) zu finden.
  • Bei manchen Herleitungen tauchen "böse Dinge" wie Variationsrechnung, Lagrange-Multiplikatoren und die Stirling-Näherung auf. Hier wird versucht, verschiedene Zugänge zu den Verteilungsfunktionen aufzuzeigen und im ersten Schritt ohne viel Mathematik auszukommen.
  • In Applet 2.1 sind die Verläufe dreier unterschiedlicher Besetzungswahrscheinlichkeiten zu sehen. Die Temperatur T und das totale chemische Potential μ ( = Quasifermienergie E_F) können im Applet variiert werden. Für große Energien nähern sich die Verteilungen aneinander an.
  • In Halbleitern tritt eine (für jede Teilchensorte) Fermi-Dirac-Verteilung als Besetzungswahrscheinlichkeit auf. Für die analytische Berechnung von Teilchenzahldichten wird die Besetzungswahrscheinlichkeit in der Regel durch eine Exponentialfunktion angenähert. Meistens tritt später eh der Fall relativ großer Energien auf und das Integral für die Teilchenkonzentration lässt sich mit Hilfe der exponentiellen Näherung noch ohne Probleme lösen.




Download: (Ein ähnliches Applet in Java gibt es hier.)

Applet 2.1: Verteilungsfunktionen




Boltzmannfaktor I


Der "Boltzmannfaktor" ist ein Exponentialfaktor der Form e^[ - E / (kT) ], zu dem Besetzungswahrscheinlichkeiten proportional sind. Der Boltzmannfaktor selbst ist keine Verteilungsfunktion. Er stellt aber sozusagen das "Herz" einiger Verteilungsfunktionen dar (die sich durch weitere Faktoren unterscheiden). Um die exponentielle Abhängigkeit der Besetzungswahrscheinlichkeit von der Energie zu verstehen, betrachten wir einige Überlegungen aus den Vorlesungen von R. Feynman [Quelle]. Die exponentielle Abhängigkeit wird am Beispiel der Atmosphäre eines idealen Gases hergeleitet (und dann noch etwas verallgemeinert).
  • Die Temperatur in allen Höhen über der Erde wird in der Atmmosphäre als konsant angenommen (z.B T = 300 K). Anders ausgedrückt: Es soll thermisches Gleichgewicht zwischen allen Gasmolekülen vorliegen.
  • Die Atmosphäre soll ungestört sein, also ohne Winde usw.
  • Die potentielle Energie E eines Moleküls wird als proportional zur Höhe h angenommen: E = m g h. (m ist die Masse eines Moleküls und g die als höhenunabhängig angenommene Erdbeschleunigung.)
  • Die Aufgabe ist nun herauszubekommen, durch welches Gesetz die Atmosphäre "dünn wird, wenn man aufsteigt".
  • Wenn N die Anzahl von Molekülen in einem Volumen V eines idealen Gases beim Druck p ist, gilt die ideale Gasgleichung: p V = N k T. Dabei ist k die Boltzmannkonstante: k = 8,62034 x 10^(-5) eV / K
  • Den Zusammenhang kann man auch schreiben als p = n k T, mit der Teilchendichte n = N/V.
  • Kennt man die Konzentration n der Teilchen, kennt man auch den Druck und umgekehrt.
  • Druck und Konzentration sind zueinander proportional, weil bei der Überlegung die Temperatur konstant gehalten wird.
  • Der Druck ist nicht konstant. Er muss anwachsen wenn die Höhe verringert wird, weil er "das Gewicht des gesamten Gases darüber halten muss".
  • Wir nehmen ein gedankliches Stück Fläche in der Höhe h. Auf die Fläche wirkt von unten eine vertikale Kraft F. Die Kraft pro Fläche entpricht gerade dem Druck: F / A = p.
  • In der Höhe h + dh stellen wir uns noch eine (gleichgroße) Fläche vor. Die vertikale Kraft, die diese Fläche nach unten drückt, wäre genau so groß wie die erste Kraft, gäbe es keine Erdanziehung.
  • Das ist aber nicht der Fall. Die Kraft pro Fläche von unten muss etwas größer sein als die Kraft pro Fläche von oben, da die Gewichtskraft der Gasmoleküle im Bereich zwischen h und h + dh zusätzlich nach unten drückt.
  • Die Gewichtskraft der Gasmoleküle pro Fläche beträgt dF_g / A = (dM g) / A = (dN m g) / A = (n dV m g) / A = (n A dh m g) / A = n m g dh.
  • Dabei ist m die Masse eines Gasmoleküls, dM die Gesamtmasse und dN die Gesamtanzahl an Molekülen des Höhenabschnitts dh.
  • Damit ergibt sich die Gleichung



  • Mit p = n k T wird daraus:




  • Dabei ist n eine Funktion für die Teilchendichte, die mit der Höhe variiert. Die Ableitung der Funktion ist proportional zur Funktion (sich) selbst.
  • Die Lösung für die gesuchte Funktion n lautet:



  • Wer' s nicht glaubt kann die Funktion und ihre Ableitung in die Bilanzgleichung einsetzen...
  • Die Integrationskonstante n_0 entspricht der Dichte bei h = 0. Die Dichte nimmt exponentiell mit der Höhe ab.
  • Jetzt bemerken wir, dass der Zähler im Exponenten die potentielle Energie E = m g h eines Moleküls in der Höhe h ist.
  • Die Dichte an jedem Ort ist proportional zu e ^ [ - die potentielle Energie eines Moleküls) /(kT)].
  • Das könnte ein Zufall sein, es könnte nur richtig sein in diesem besonderen Fall eines gleichmäßigen Gravitationsfeldes.
  • Wir können jedoch zeigen, dass es eine allgemeinere Aussage beinhaltet.

  • Angenommen, auf die Moleküle wirke nicht die Gravitationskraft sondern eine andere Kraft (z.B. elektrische Kraft), die sich mit einem Abstand verändert.
  • Wir nehmen an, dass alle Moleküle gleich sind. Die Gesamtkraft auf eine Gasmenge soll die Anzahl der Moleküle mal die Kraft F auf ein einzelnes Molekül sein.
  • Die Kraft soll entlang einer Achse (x-Achse) wirken.
  • Dann können wir die Formeln etwas noch etwas durchknteten. Es muss ähnlich wie oben gelten:



  • Aus dem Zusammenhang p = n k T erhält man: dp = kT dn. Damit gilt auch: F n dx = kT dn, oder so geschrieben:


  • Die Ableitung von ln n(x) ist gerade 1/n dn/dx:



  • Wenn man die Kraft F aus einem Potential E ableiten kann, gilt auch: F = - dE / dx:



  • Oder umgeschrieben:



  • Die Zahl der für die Moleküle verfügbaren Plätze in der Atmosphäre pro Energie und pro Volumen wird als konstant angenommen.
  • Die konstante Zustandsdichte kann in der Formel für die Teilchenkonzentration vors Integral gezogen werden. Durch Ableiten erhält man:

  • Die Wahrscheinlichkeit, Moleküle an einem bestimmten Ort zu finden, ändert sich exponentiell mit der negativen potentiellen Energie des Moleküls am Ort dividiert durch k T. Das ist unser erster Ausdruck für eine Besetzungswahrscheinlichkeit.
  • Um eine exponentielle Abhängigkeit der Teilchenzahldichte zu erhalten ist es also egal, wie die Kraft vom Abstand abhängt.
  • Die Kraft muss allerdings als Ableitung eines Potentials darstellbar sein. (Wenn die äußeren Kräfte auf die Moleküle nicht konservativ sind, kann das thermische Gleichgewicht nicht aufrecht erhalten werden.)
  • Den Normierungsfaktor C vor dem Boltzmannfaktor kann man in vielen Fällen durch die Bedingung erhalten, dass die Summe aller Wahrscheinlichkeiten 1 ergibt. (Irgendwo in der Atmosphäre muss sich ein betrachtetes Molekül ja aufhalten.)



Fermi-Dirac-Verteilung I


Wenn man die Elektronen in einem Halbleiter auf die verfügaren Energieplätze verteilt, muss etwas beachtet werden, dass im Prinzip des Boltzmannfaktors noch nicht enthalten ist. Nach dem Pauli-Prinzip dürfen zwei Elektronen nie in allen ihren Eigenschaften übereinstimmen. Wenn sie in der gleichen "Energieschachtel" landen, müssen sie sich zumindest noch durch eine andere Eigenschaft unterscheiden. (Die zwei Ausrichtungen der Gummi-Kappen sollen ein Analogon zu den zwei unterschiedlichen Spinzuständen von Elektronen sein.)
In der Atmosphäre kann man quasi beliebig viele Moleküle in einer bestimmten Höhe unterbringen. Die Besetzungswahrscheinlichkeit wird durch eine Exponentialfunktion mit konstantem Vorfaktor beschrieben. Für Elektronen im Halbleiter muss die Verteilungsfunktion wegen dem Pauli-Prinzip etwas abgeändert werden. Die Wahrscheinlichkeiten für die Besetzung von Energiezuständen in Festkörpern durch Elektronen werden durch die sogenannte Fermi-Dirac-Verteilung beschrieben. Durch die Fermi-Dirac-Verteilung wird das Streben der Natur nach geringen Energien und nach großer Unordnung verkörpert: die Fenergie (freie Energie) des Systems wird (unter Beachtung des Pauli-Prinzips) minimiert. Wer's eilig hat kann sich die Verteilung wie folgt plausibel machen:

  • Es gebe ein sehr großes System (System 1) mit vielen Teilchen, in dem die mittlere Energie eines Elektrons E_F beträgt.
  • Ein zweites System (System 2) steht in thermischem Gleichgewicht mit System 1 (besitzt die gleiche Temperatur).
  • Im System 2 soll es genau einen verfügbaren Platz ("eine halbe Schachtel") mit der Energie E geben.
  • Wenn N Elektronen von System 1 nach System 2 wechseln, beträgt ihre potentielle Energie in Bezug auf System 1: E_pot = N ( E - E_F ).
  • Für das System 2 gibt es zwei Möglichkeiten: Wegen dem Pauli-Prinzip darf der verfügbare Platz entweder mit keinem Elektron ( N = 0 ) oder mit einem Elektron ( N = 1 ) besetzt werden.
  • Die Besetzungswahrscheinlichkeit wird als proportional zum Boltzmannfaktor angenommen:



  • Die Summe der Wahrscheinlichkeiten muss 1 ergeben:



  • Daraus ergibt sich die Normierungskonstante C und damit die Besetzungswahrscheinlichkeit:


  • Dies ist die Fermi-Dirac-Verteilungsfunktion.
  • Wenn die Energie E viel größer als die Bezugsenergie E_F ist, kann man die 1 im Nenner vernachlässigen. Dann geht die Fermi-Dirac-Verteilung in eine Exponentialfunktion über:



  • Diese Näherung der Fermi-Dirac-Verteilung wird später zusammen mit der Zustandsdichte verwendet, um Konzentrationen von frei beweglichen Elektronen in Solarzellen zu berechnen.

http://ece-www.colorado.edu/~bart/book/fermi-dirac_derivation.htm
http://www.cooper.edu/engineering/projects/gateway/ee/solidmat/modlec2/node3.html#SECTION00120000000000000000
http://ece.colorado.edu/~bart/book/distrib.htm



Verteilungsfunktionen


Für detailliertere Herleitungen des Boltzmannfaktors und der Fermi-Dirac-Verteilung werden nun einige weitere Begriffe und Werkzeuge erläutert. Ausführlicher nachlesen kann man solche Sachen z.B. auch in [Gerd Wedler: Lehrbuch der physikalischen Chemie.], wonach sich folgende Überlegungen orientieren.
  • Wenn wir das mittlere Alter der Einwohner auf einer Insel ermitteln wollen, können wir alle Einwohner versammeln, jeden einzelnen nach seinem Alter fragen und die aufsummierten Lebensjahre durch die Anzahl der Einwohner teilen.
  • Wir können aber auch fragen, wie viele null Jahre, ein Jahr, zwei Jahre, usw. sind und fortfahren, bis sich kein älterer mehr findet. Multiplizieren wir das Alter in Jahren mit der jeweiligen Anzahl von Einwohnern, die dieses Alter besitzen, addieren alle diese Produkte und teilen durch die Anzahl der Einwohner, kommen wir zum gleichen Ergebnis.
  • Bei einer sehr großen Anzahl von Einwohnern ist das zweite Verfahren schneller. Zudem ist nach dem zweiten Verfahren auch die Altersstruktur bekannt.
  • Tragen wir die Anzahl der Einwohner mit einem bestimmten Alter gegen die Lebensjahre auf, erhalten wir eine Verteilungsfunktion.
  • Eine solche Funktion kann breit oder schmal sein und in beiden Fällen bei gleicher Einwohnerzahl zum gleichen Durchschnittsalter führen.
  • Als Wahrscheinlichkeit bezeichnen wir den Quotienten aus der Zahl N der günstigen ("richtigen") Möglichkeiten und der Gesamtzahl N_0 der Möglichkeiten:



  • Eine Wahrscheinlichkeit ist gleichzeitig immer das Quadrat der Länge eines Pfeils, welcher die Wahrscheinlichkeit repräsentiert.
  • Möchte man z.B. mehrere Wahrscheinlichkeiten addieren, addiert man die entsprechenden Pfeile ("Wahrscheinlichketisamplituden") und bildet das Quadrat des resultierenden Pfeils (Abb. 2.5). Ein Pfeil besitzt sowohl eine Länge (Betrag) als auch eine Richtung (einen Phasenwinkel). Wahrscheinlichkeitsrechnungen werden deshalb manchmal mit Hilfe von komplexen Zahlen durchgeführt.
  • Zum resultierenden Pfeil einer Summe tragen vor allem jene Pfeile bei, die etwa in in die "Hauptrichtung" zeigen ( = Pfeile, deren Phasenwinkel sich nur wenig unterschiden).
  • In Sonderfällen zeigen alle Pfeile in die gleiche Richtung. Dann können die Längen der Pfeile oder sogar die Werte der Wahrscheinlichkeiten selbst addiert werden, ohne dabei an die Richtung zu denken.
  • Diese "Pfeildarstellung" brauchen wir bei der Herleitung der Verteilungsfunktionen nicht. Wir werden aber an anderer Stelle darauf zurück kommen.

wahrscheinlichkeiten_als_pfeile.PNG
Abb. 2.5: Wahrscheinlichkeiten als Quadrierte Längen von Pfeilen

  • Für ein System aus mehreren Teilchen kann man sich mehrere verschiedene Verteilungen der Teilchen auf Energiezustände vorstellen. Die zu einem bestimmten Zeitpunkt tatsächlich vorliegende Verteilung kann man nicht vorhersagen, aber man kann berechnen, welche Verteilung am wahrscheinlichsten ist.
  • Es stellt sich heraus, dass für ein System aus sehr vielen Teilchen nur eine Verteilung besonders wahrscheinlich ist. Andere, merklich davon abweichende Verteilungen der Teilchen, sind viel unwahrscheinlicher und können vernachlässigt werden.
  • Das kann man anhand eines Würfelspiels mit mehreren Würfeln nachvollziehen.
  • Bei einem Spiel mit einem Würfel sind alle Zahlen 1...6 gleich wahrscheinlich: w_i = 1/6.
  • Bei einem Spiel mit zwei Würfeln sind die möglichen Ergebnisse der Würfelsumme 2...12 nicht gleich wahrscheinlich. Die Wahrscheinlichkeit für die Würfelsumme 2 beträgt w_2 = 1/(6*6) = 1/36, da es nur eine Realisierungsmöglichkeit gibt. Dagegen gibt es für eine Würfelsumme von 7 sechs verschiedene Realisierungsmöglichkeiten und die Wahrscheinlichkeit beträgt: w_7 = 6/36 = 1/6.
  • Die Wahrscheinlichkeit nimmt von der Würfelsumme 2 bis zur Würfelsumme 7 linear zu und dann bis zur Würfelsumme 12 wieder linear ab.
  • Bei drei Würfeln ergibt sich eine Verteilungsfunktion für die Wahrscheinlichkeit, die stärker als linear bis zum Maximum 1/8 ansteigt.
  • In Abb. 2.5 sind die normierten Wahrscheinlichkeitsverteilungen für verschiedene Anzahlen von Würfeln dargestellt. Je größer die Anzahl der Würfel (oder die Anzahl von Teilchen in einem System) ist, desto schmaler werden die Wahrscheinlichkeitsverteilungen. (Die Verteilungen wurden für den Vergleich so normiert, dass die "Augensummen" auf der horizontalen Achse Werte von 0 bis 1 annehmen. Den maximalen Wahrscheinlichkeiten wird bei der vertikalen Achse jeweils ein Wert von 1 zugeordnet. Die Breite bei einem vertikalen Wert von 0,5 kann für den Vergleich als Maß für die Breite der Verteilung herangezogen werden. Die Linien wurden nur zur Führung des Auges eingezeichnet: Die Verteilungen sind natürlich diskret.)
  • Für eine Würfelanzahl von 10^23 würde man die Verteilung nur noch als schmale Linie wahrnehmen. Wenn man in einer große Rüttelmaschine 10^23 Würfel kullern lässt, wird nach Stillstand in guter Näherung immer die gleiche Würfelsumme herauskommen.




Abb. 2.6: Normierte Wahrscheinlichkeitsverteilungen bei Würfelspielen

  • Unter einem Mikrozustand wollen wir eine mögliche Zuordnung von bestimmten Teilchen zu bestimmten Energiezuständen verstehen. (Wir geben für jeden einzelnen Würfel an, welche Augenzahl er anzeigt.)
  • Bei einem Makrozustand muss nur eine bestimmte Anzahl von Teilchen bestimmte Energiezustände einnehmen. Die einzelnen Teilchen werden dabei nicht benannt. (Uns interessiert nur die Würfelsumme.)
  • Meistens kann ein bestimmter Makrozustand durch mehrere verschiedene Mikrozustände realisiert werden. Mehr zu Mikro- und Makrozuständen gibt es im Abschnitt Boltzmannfaktor II.



Berechnung von Extremwerten (Lagrange-Multiplikatoren)


  • Wie kann die Stelle des Extremwerts einer Funktion berechnet werden, die von mehreren (gekoppelten) Variablen abhängt? Mit Hilfe des Verfahrens der Lagrange-Multiplikatoren!
  • Das Verfahren der Langrangen Multiplikatoren ist ein nützliches Werkzeug, das bei der Herleitung von Verteilungsfunktonen und anderen Extremwertaufgaben öfters vorkommt.
  • Die Lagrange-Multiplikatoren funktionieren im Gegensatz zu anderen Verfahren auch noch, wenn die Kopplungs-Funktionen nicht aufgelöst und Schritt für Schritt ineinander eingesetzt werden können.
  • Besitzt eine Funktion f(A) einen Extremwert (, der nicht am Rand des Definitonsbereiches liegt), wird an der Stelle des Extremwerts die erste Ableitung zu null:



  • Hängt die Funktion von mehreren Variablen (z.B. A und B) ab, lautet die Bedingung für einen Extremwert dagegen: an der betrachteten Stelle darf sich der Funktionswert (z.B. f(A,B)) bei kleinen Änderungen (z.B. dA und dB) der Variablen nicht ändern:



  • Anders ausgedrückt: "Es darf sich nicht viel tun, wenn wir ein wenig an den Schrauben wackeln".
  • Für die Wahl der kleinen Änderungen gibt es beliebig viele Möglichkeiten. Egal in welche Richtung man sich (z.B. mit dA und dB) im Definitionsbereich bewegt, muss die "Steigung" null sein. Damit ein Extremwert vorliegt, muss für die partiellen Ableitungen gelten:



  • Bei uns tritt später das Problem auf, den Extremwert einer Funktion von mehreren Variablen zu bestimmen, die miteinander gekoppelt sind. Dann müssen als Bedinung bei einem Extremwert nicht mehr unbedingt alle partiellen Ableitungen null sein.
  • Als Beispiel werden die Funktion f(A, B) zweier Variablen und die Nebenbedinung B = g(A) betrachtet.
  • Die Nebenbedingung, die "Kopplung der Schrauben", kann für alle Funktionen g auch in die implizite Form h(A, B) = 0 umgeschrieben werden. (Diese Schreibweise ist allgemeiner: umgekehrt können nicht alle Nebenbedinungen h = 0 in der expliziten Form mit g geschrieben werden.)
  • Wenn die Funktion h konstant sein soll (sie soll ja für alle Werte A, B null sein), müssen ihre partiellen Ableitungen null sein.
  • Das Ganze können wir in zwei Gleichungen zusammenfassen, die den Fall des Extremwerts mit Nebenbedingung beschreiben:



  • Wie lösen wir dieses Gleichungssystem? Wir könnten z.B. die zweite Gleichung nach dA auflösen und in die erste Gleichung einsetzen, so ähnlich wie wir es beim Chemischen Potential schon einmal getan haben.
  • Eine andere Möglichkeit bietet die Multiplikationsmethode: Wir multiplizieren die erste Gleichung mit - ∂h / ∂B , die zweite mit ∂f / ∂B und addieren die beiden Gleichungen:



  • Zusammen mit der Gleichung h(A, B) = 0 lassen sich daraus die Werte A_extr, B_extr berechnen, an denen Extremwerte vorliegen.

  • Das Vorgehen kann man alternativ auch so formulieren: Multipliziere die Gleichung der Nebenbedinung mit einer (noch unbekannten) Konstanten und addiere das Ergebnis zur Gleichung der Optimierungsfunktion:



  • Das können wir dann auch schreiben als:



  • Diese Gleichung ist nur erfüllt, wenn:



  • Mit der ersten Gleichung lässt sich die Konstante bestimmen:



  • Und man erhält durch Einsetzen in die zweite Gleichung:



  • Zusammen mit h(A, B) = 0 lässt sich daraus wiederum die Lage des Extremums bestimmen. Das haben wir alternativ noch einmal so "kompliziert" aufgeschrieben, da wir später auch mit mehr als zwei Variablen und einer Nebenbedingung klar kommen möchten.


  • Lagrange, ein italienischer Mathematiker und Astronom, hat folgendes systematische Vorgehen vorgeschlagen:
I. Bilde eine Hilfsfunktion i = f(A, B) + α h(A, B). ( Der noch unbekannte Faktor α heißt Lagranger Multiplikator.)
II. Berechne die ersten partiellen Ableitungen nach A, B und α und setze diese gleich null:



  • Damit hat man drei Gleichungen zur Bestimmung der gesuchten Werte A_extr, B_extr und der Konstanten α.
  • Ein Gleichungssystem lässt sich z.B. so lösen: Eine Gleichung nach einer Unbekannten auflösen, in alle übrigen Gleichungen einsetzen. Wiederholen, bis alle Gleichungen aufgebraucht sind. Dann die Ergebnisse Schritt für Schritt in die aufgelösten Gleichungen darüber einsetzen ("Rückeinsetzverfahren"). Wenn während des gesamten Vorgangs keine falsche Aussage (z.B. 0 =1) entstanden ist, sind am Ende die Unbekannten bestmöglichst bestimmt. Sind nicht so viele unabhängige Gleichungen wie Unbekannte vorhanden, ist die Lösungsmenge mehrdimensional (Es kommt als Lösungsmenge z.B. eine Gerade oder Ebene heraus). Eventuell sind Fallunterscheidungen nötig, um während des Umstellens Divisonen durch Null zu vermeiden. Tritt während des Verfahrens (z.B. beim Rückeinsetzen) eine falsche Aussage auf, ist die Lösungsmenge die leere Menge: Es gibt dann keinen Satz an Variablen, die alle Bedingungen erfüllt.

  • Verallgemeinert für die Funktion f von n Variablen und r Nebenbedinungen lauten die Hilfsfunktion und die Bedingungen für ihre partiellen Ableitungen:



  • Die Lagrangen Multiplikatoren sind Hilfsgrößen ohne nähere Bedeutung. Sie sollten möglichst früh aus den Rechnungen eliminiert werden.
  • Die Bedingungen für die partiellen Ableitungen sind notwendig, aber nicht hinreichend für die Existenz eines Extremwerts unter Nebenbedingungen. Es muss daher gebrüft werden, ob es sich um einen Extremwert handelt (und ob es ein Minium oder Maximum ist).




Beispiel:
Ein Punkt P auf einer Bühne wird durch eine Lichtquelle in der Höhe s beleuchtet (Abb. 2.7). Der Punkt liege auf der Bühne fest; die Lichtquelle kann nur in der Höhe verschoben werden. Damit kann der Winkel A und der Abstand B zum Punkt verstellt werden. Die von Winkel und Abstand abhängige Intentsität f betrage:



Unter welchem Einfallswinkel A wird der Punkt P mit maximaler Intensität beleuchtet?


Optimierte-Beleuchtung.png
Abb. 2.7: Skizze zur optimierten Beleuchtung auf einer Bühne.

  • A und B sind so miteinander gekoppelt: sin A = x/B => B sin(A) = x => h(A, B) = B sin(A) - x
  • Hilfsfunktion:



  • Gleichungssystem:



  • Lösung:










Reihenentwicklung für Fakultäten großer Zahlen (Stirling-Näherung)


Wenn man irgendwelche Kombinationsmöglichkeiten abzählt, tauchen oft Terme mit Fakultäten (z.B. ln N!, n! /(k! (n! - k!) ), ... ) auf. Bei der gleich folgenden Herleitung des Boltzmannfaktors ist das auch so und statt der diskreten Funktion N! wird eine kontinuierliche Näherungsfunktion verwendet.
  • Für große Zahlen kann der Wert der Fakultät mit Hilfe der Reihenentwicklung von Herrn Stirling angenähert werden:



  • Bei Wikipedia ist die prozentuale Abweichung der Näherung zum tatsächlichen Wert in einem Diagramm aufgetragen. Uns interessieren später sehr große N und wir brechen die Reihenentwicklung schon früh ab:



  • Für N = 50 gilt z.B. ln N! = 148.48 und N lnN - N = 145.6. Die relative Abweichung (bei dieser für uns relativ kleinen Zahl) beträgt etwa -2 %.
  • Eine Formel für N!, die öfters in der Literatur vorkommt (eigentlich brauchen wir nur die obige Formel für ln N!) lautet:





Boltzmannfaktor II


Der zweite Zugang zum Boltzmannfaktor wurde von hier stibitzt und ist noch etwas "laxer" formuliert als Boltzmannfaktor III weiter unten. Die Herleitung funktioniert etwa so:

I. Wahrscheinlichkeiten mit der Entropie verknüpfen.
II. Entropie bei konstanter Energie, konstantem Volumen und konstanter Teilchenzahl maximieren, um einen Gleichgewichtszustand zu erhalten.
III. Daraus den exponentiellen Zusammenhang zwischen Energie und Besetzungswahrscheinlichkeit entnehmen.

Der erste Schritt wird sein, sich die Formel plausibel zu machen, die auf dem Grabstein von Herrn Ludwig Boltzmann (Abb. 2.8) steht: S = k log W. Im zweiten Schritt wird definiert, was Temperatur ist. Schließlich wird ein kleines Testsystem betrachtet, dass sich in Nachbarschaft eines zweiten Systems, eines riesigen Wärmebads, befindet. Durch Betrachtung des großen Wärmebads lassen sich Rückschlüsse auf das kleine Testsystem ziehen. Den Boltzmannfaktor gibt es, weil im großen System die Anzahl der Mikrozustände exponentiell mit der Energie anwächst.


Boltzmann.PNG
Abb. 2.8: Grabstein von Ludwig Boltzmann.


  • Betrachtet wird ein physikalische System, das aus sehr vielen Teilchen besteht. Die ganzen mikroskopischen Eigenschaften der einzelnen Teilchen können (wenn überhaupt) nur sehr schwer erfasst werden. Was einfacher zu messen ist, sind makroskopische Eigenschaften, die sich als eine Art von "Mittelwerten" aus den mikroskopischen Eigenschaften ergeben.
  • Die "Mikrozustände" des Systems ergeben sich aus der exakten Beschreibung jedes einzelnen Teilchens und sind wie gesagt schwer zu ermitteln.
  • Zu einem "Makrozustand", der durch die makroskopischen "Mittelwerte" (z.B. Druck, Temperatur) beschrieben wird, kann es verschiedene Möglichkeiten für die Realisierung geben. Anders ausgedrückt: Verschiedene Anordnungen oder Bewegungszustände der mikroskopischen Teilchen können den gleichen Makrozustand erzeugen.
  • Heidi verteilt z.B. bei einem neuen Spiel 8 Gummi-Kappen auf zehn verfügbare Schachteln, die sie auf den Boden gelegt hat. Als "makroskopische Größe" interessiere uns, wie groß der Unterschied der Anzahl der Kappen mit der gekrümmten Seite nach oben zur Anzahl der übrigen Kappen ist.
  • Für den Makrozustand mit einer Differenz von "2", wird es dann verschiedene Realisierungsmöglichkeiten (Mikrozustände, Verteilungen der Kappen auf die Schachteln) geben.
  • Oft ist es so, dass sich der Mikrozustand in einem System laufend ändert, der Makrozustand aber erhalten bleibt. Die Gasmoleküle in einer abgeschlossenen Kammer flitzen ständig durch die Gegend. Die mittlere Dichte der Teilchen bleibt dabei konstant.
  • Man kann (zumindest in Gedankenexperimenten) von außen bestimmte Bedingungen für ein System vorgeben. Man erlaubt z.B. nur einen bestimmten Druck oder eine bestimmte Gesamtenergie E. Damit wird gleichzeitig eine bestimmte Auswahl an erlaubten Makrozustanden festgelegt.
  • In einem isolierten System wird sich dann am wahrscheinlichsten gerade jener Makrozustand einstellen, für den es die meisten Realisierungsmöglichkeiten, also Mikrozustände, gibt.
  • Betrachten wir z.B. ein Würfelspiel mit zwei sechsaugigen Würfeln. Man kann die Gesamtaugenzahl als bestimmende Eigenschaft eines Makrozustands der beiden Würfel auffassen. Es gibt sechs Möglichkeiten, eine 7 zu würfeln. Für das Würfeln einer 2 oder einer 12 gibt es jeweils nur eine Möglichkeit. Das System wird sich wahrscheinlicher im Makrozustand "7" befinden als in den Makrozuständen "2" oder "12".

  • Wenn man zwei Systeme zusammenfügt, erhält man die Gesamtanzahl der verfügbaren Mikrozustände durch Multiplikation der Anzahlen bei den Einzelsystemen: Für einen einzelnen Würfel des Würfelspiels gibt es 6 Mikrozustände. Für das System aus zwei Würfeln gibt es insgesamt 36.
  • Für den Logarithmus gilt der Zusammenhang: log a b = log a + log b. Nimmt man statt der direkten Anzahl N den Logarithmus der Anzahl, addiert sich diese Größe beim Zusammenfügen der Systeme (log 36 = log 6 + log 6).

  • Wie hängt die Anzahl dieser Mikrozustände nun mit der Entropie S zusammen?
  • Nach dem Zusammenfügen von zwei Systemen wird sich am wahrscheinlichsten jener Makrozustand einstellen, der die meisten Mikrozustände im Gesamtsystem hat. Anders ausgedrückt: "Das Gesamtsystem maximiert die Größe log N." (Man kann genau so sagen, dass N, die Anzahl erreichbarer Mikrozustände, maximiert wird. Aber mit dem Logarithmus lässt sich schöner rechnen.)
  • Das ist genau das was geschieht, wenn man davon spricht, dass ein System "nach Unordnung strebt": Die Anzahl der erreichbaren Mikrozustände wird für die gegebenen Randbedingungen maximiert.
  • Die Entropie hat deshalb mit der Anzahl der Möglichkeiten zu tun, mit der sich ein Mikrozustand umwandeln kann, ohne den Makrozustand zu beeinflussen.
  • Der Physiker R. Feynman drückte das so aus [Quelle: Feynman, Vorlesungen über Physik, Band1]: "Angenommen, wir teilen den Raum in kleine Volumenelemente auf. Wenn wir weiße und schwarze Moleküle haben, auf wieviele verschiedene Arten könnten wir sie dann in die Volumenelemente aufteilen, so dass sich die weißen auf der einen und die schwarzen auf der anderen Seite befinden? Und wieviele Möglichkeiten gibt es andererseites, sie ohne Einschränkung, wo welches hinkommt, zu verteilen? Natürlich gibt es viel mehr Möglichkeiten, sie in dem letzteren Fall anzuordnen. Wir messen "Unordnung" durch die Zahl der Möglichkeiten, wie die Moleküle innen angeordnet werden können, so dass es von außen gleich aussieht. Der Logarithmus dieser Zahl der Möglichkeiten ist die Entropie. Die Zahl der Möglichkeiten in dem getrennten Fall ist geringer und folglich ist die Entropie geringer oder die "Unordnung" ist geringer. ... ...Erstens gibt die Entropie die Unordnung an. Zweitens geht das Universum immer von der "Ordnung" in die "Unordnung" über, so dass die Entropie dauernd anwächst. Ordnung ist nicht Ordnung in dem Sinne, dass wir die Anordnung leiden mögen, sondern in dem Sinne, dass die Anzahl der verschiedenen Möglichkeiten, in der wir sie einrichten können und sie trotzdem von außen gleich aussieht, relativ begrenzt ist."
  • Bei der Formel auf dem Grabstein von Ludwig Boltzmann ist das Argument des Logarithmus allerdings nicht eine Anzahl N sondern eine Wahrscheinlichkeit w.
  • Eine Wahrscheinlichkeit w ist der Quotient aus der Anzahl der "richtigen" Möglichkeiten N und der Anzahl aller Möglichkeiten N_0: w = N / N_0.
  • Das gilt auch für die Wahrscheinlichkeit W des Makrozustands im Gleichgewicht. Die Wahrscheinlichkeit W ist proportional zur Anzahl N der im Makrozustand erreichbaren Mikrozustände. Für die einzelnen Mikrozustände wird angenommen, dass jeder gleich wahrscheinlich ist.
  • Die Entropie S hat Boltzmann definiert als S = k log W. Diese Größe ist nach unseren Überlegungen ein Maß für die Unordnung (und ein Maß für eine Wahrscheinlichkeit).

  • Später interessiert uns nur die Ableitung der Entropie. Da N_0 beim Ableiten von S = k log N / N_0 rausfällt, müssen wir die Gesamtanzahl der Mikrozustände nicht unbedingt wissen.
  • Bei physikalischen Überlegungen werden Proportionalitätskonstanten manchmal außer Acht gelassen. Am Ende der Rechnung fügt man dann wieder eine Konstante ein, die durch Experimente oder weitere Überleungen (z.B. Normierungsbedingung) bestimmt wird. Wenn man vorsichtig genug ist, darf man das machen. Anstatt des dekadischen Logarithmus, der auf dem Grabstein von Ludwig Boltzmann steht, kann deshalb auch der dazu proportionale natürliche Logarithmus (ln x = log x / log e) in Formeln für die Entropie vorkommen.
  • Nebenbemerkungen: I. Es gibt natürlich auch ästhetische, moralische, politische usw. Bedeutungen vom Begriff "Unordnung", die nichts mit dem Ausdruck k log W zu tun haben. II. Der Faktor k ist im Prinzip eine beliebige Konstante. Sie wird so gewählt, das der Wert von S mit jenem Wert übereinstimmt, der von einer anderen (älteren) Definition der Entropie aus der Wärmelehre herrührt: k ist die Boltzmannkonstante.
  • Wenn man die verschiedenen Werte von S aller möglichen Makrozustände bei einer bestimmten Energie addiert, erhält man die (Gesamt-) Entropie S(E), die zu dieser Energie gehört.
  • Der Zusammenhang zwischen Entropie S und thermodynamischer Wahrscheinlichkeit W ist im Grunde ein Postulat. Wir nehmen an, dass die so defnierte Entropie die gleiche ist, wie jene in anderen Zusammenhängen (z.B. F = E - T S ).
  • So viel zu der Formel S = k log W.

  • Was geschieht, wenn man zwei Systeme in thermischen Kontakt bringt und sie untereinander Wärmeenergie (aber keine Teilchen) austauschen können?
  • Die Gesamtenergie E = E_1 + E_2 ist konstant, aber E_1 und E_2 können sich jeweils ändern. Wie werden die Energien der (gedachten) Einzelsysteme im Gleichgewicht aussehen?
  • Energie kann z.B. vom System 1 nach System 2 fließen. Die Richtung des Energieflusses hängt aber nicht nur alleine von den Energiemengen E_1 und E_2 ab. Wenn E_1 > E_2 ist, muss trotzdem nicht unbedingt Energie von System 1 nach System 2 fließen. Die Richtung und Menge des Energieflusses werden anders bestimmt.
  • Die einzelnen Systeme sind zwar nicht voneinander isoliert, aber für das isolierte Gesamtsystem gilt unsere Regel der Entropiemaximierung (log N und damit S = k log W werden wie gesagt maximiert.).
  • Die Gesamtergie E soll konstant bleiben. Die Fenergie F = E - T S wird minimiert.
  • Die Anzahl der Mikrozustände N_1 * N_2 wird im Gleichgewichts-Makrozustand maximal sein, genauso wie die Gesamtentropie S.
  • Für den Gleichgewichtszustand wird also die Funktion S = S(E_1, E_2) maximiert.
  • Die beiden "Schrauben" E_1 und E_2 hängen ähnlich wie die beiden Teilchenzahlen bei der Beispielrechnung fürs chemische Potential zusammen. Für kleine Änderungen ΔE gilt: ΔE_1 = - ΔE_2. Nimmt die Energie des einen Teilsystems zu, muss die andere in gleichem Maße abnehmen.
  • Ein bisschen "Wackeln" an den Schrauben wirkt sich im Gleichgewichtszustand nicht aus:



  • Mit ΔE_1 = - ΔE_2 gilt im Gleichgewichtszustand, bei maximaler Entropie:



  • Die Bedingung für das Gleichgewicht ist also, dass die Ableitung der Entropie nach der Energie in beiden Systemen gleich ist.
  • Wir vergeben für den Kehrwert dieser Ableitung ein neues Symbol T: dS / dE = 1/T
  • Dieses geheimnisvolle T ist nichts anderes als die Temperatur !
  • Im thermischen Gleichgewicht nehmen beide Teilsysteme die gleiche Temperatur an.
  • Energie fließt vom System mit höherer Temperatur zum System mit niedrigerer Temperatur, bis überall im Gesamtsystem die gleiche Temperatur herrscht; bis das Änderungsverhalten der Entropie S bei Variationen der Energie E überall gleich ist.
  • Wenn es draußen kalt ist, bedeutet das folgendes: Die Welt holt sich gierig Entropie, indem sie Energie aus Dich raussaugt. Zieh Dich warm an!
  • Nebenbemerkung: Man kann sagen, dass die Boltzmannkonstante k so gewählt ist, dass wir die Temperatur in der Einheit Kelvin messen.
  • Das war Schritt 2. Wir haben definiert, was Temperatur ist: der Kehrwert der Ableitung der Entropie nach der Energie. Im thermischen Gleichgewicht ist die Temperatur überall gleich.

  • Nun schauen wir uns zwei Systeme im thermischen Kontakt an. Eines (System 1) wollen wir genauer untersuchen. Das andere (System 2) dient als Wärmebad: System 2 soll ein sehr großes System mit der Temperatur T_2 sein (viele Teilchen beinhalten). Das System 2 ist so groß, das es nahezu die gesamte Energie E des Gedankenexperiments enthält. Anders ausgedrückt: Für die Energien der beiden Systeme soll gelten: E_1 << E_2.
  • Das große System 2 soll so beschaffen sein, dass sich seine Temperatur quasi nicht ändern würde, wenn es die kleine Energie E_1 des Systems 1 absorbieren würde. Anders ausgedrückt: Die Entropie von System 2 soll eine flache, glatte Funktion der Energie sein: die Ableitung ändert sich in einem Energiebereich der Breite E_1 kaum.
  • In einer Badewanne voller warmen Wasser schwimme ein kleiner gelber Behälter aus einem Überraschungsei. In dieser Plastikhülle ist heißes Wasser. Wenn sich das gelbe Ding etwas abkühlt, wird sich das Wasser in der Badewanne trotzdem nicht merklich aufwärmen. (Die Badewanne völlig zu isolieren dürfte zwar schwer werden, aber na ja. Das soll als Beispiel reichen.)

  • Die Preisfrage ist: Wovon hängt bei einer gegebenen Gesamtenergie E = E_1 + E_2 die Wahrscheinlichkeit ab, dass das erste System eine bestimmte Energie E_1 annimmt (und gleichzeitig das System 2 die Energie E_2 annimmt) ?
  • Die Wahrscheinlichkeit ist proportional zu der Gesamtanzahl N_1 der Mikrozustände von System 1, die gerade die Energie E_1 besitzen.
  • Sie ist auch proportional zur Gesamtanzahl N_2 der Mikrozustände von System 2, die mit der Energie E_2 verbunden sind. (Wenn System 1 die Energie E_1 hat, muss das System 2 die Energie E_2 annehmen, da E_1 + E_2 = konstant.) Das wollen wir näher betrachten.
  • Für N_2 gilt:



  • Wir dürfen die Änderung des Funktionswerts S_2 durch das Produkt aus Ableitung und kleiner Schrittweite annähern (da S_2 glatt und flach verläuft):



  • Die Ableitung ist gerade 1/T_2 und im Gleichgewicht gilt T_2 = T_1 = T:



  • Ta Ta! Da ist plötzlich der Boltzmannfaktor. Die Wahrscheinlichkeit eines jeden Mikrozustands des Systems 1 mit Energie E_1 ist proportional zu einen Faktor e^(-E_1 / kT).
  • Das liegt daran, dass die Anzahl der Mikrozustände des Wärmebads mit der Energie E_2 = E - E_1 proportional zu diesem Faktor ist.
  • Der andere Faktor ist eine Konsante, die für alle Mikrozustände gleich ist. (Wieso??)
  • Diese Konstante können wir ignorieren. Am Ende der Rechnung kann immer eine Konstante eingeführt werden, die alles passend macht: Der gesuchte Vorfaktor wird durch die Normierungsbediungung "Summe aller Wahrscheinlichkeiten gleich 1" bestimmt. Deshalb brauchen wir erst mal nur einen Ausdruck, zu dem die Wahrscheinlichkeiten proportional sind: den Boltzmannfaktor.

  • Die Argumentation noch einmal etwas anders ausgedrückt:
  • Je mehr Energie das System 1 hat, desto weniger Energie hat das Wärmebad.
  • Wir haben gesagt, dass die Temperatur des Wärmebads sich quasi nicht ändert. Das bedeutet, dass sich bei einer Änderung der Energie E_2 um einen festen Betrag die Entropie S_2 auch um einen festen Betrag ändert.
  • Das bedeutet wiederum, dass sich die Anzahl der verfügbaren Mikrozustände des Wärmebads um einen konstanten Faktor ändert, wenn die Energie um einen konstanten Betrag geändert wird.
  • Das bedeutet, dass sich N_2 exponentiell mit der Energie ändert.
  • Die gesuchte Besetzungswahrscheinlichkeit ist proportional zu N_2.

  • Und nochmal anders ausgedrückt:
  • Angenommen, es gibt eine große Anzahl N an Oszillatoren mit quantisierten Energiezuständen.
  • Wenn man ein wenig Energie zufügt werden einige Oszillatoren um eine oder mehrere Energiestufen angeregt.
  • Je mehr Energie man zufügt, desto mehr Oszillatoren werden angeregt.
  • Wenn man gerade Energie genug für einen Oszillator hinzufügt, gibt es N Möglichkeiten dies zu tun.
  • Wenn man zweimal so viel hinzufügt könnte man den gleichen Oszillator um eine weiter Stufe anregen. Es ist aber viel wahrscheinlicher, einen der anderen N - 1 Oszillatoren anzuregen.
  • N - 1 ist quasi das gleiche wie N, da N sehr groß ist. Es gibt also N * N Möglichkeiten, doppelt so viel Energie unterzubringen.
  • Bei der dreifachen Energie gibt es N * N * N Möglichkeiten, usw.
  • Das ist der konstante Faktor, der mit einer konstanten Änderung des Energiebetrags verbunden ist.
  • (Wenn man zu viel Energie zufügen würde, würde sich die Temperatur irgendwann doch ändern und die Annahmen würden nicht mehr stimmen.)

  • Den Boltzmannfaktor gibt es, weil in einem sehr großen System die Anzahl der Mikrozustände exponentiell mit der Energie anwächst.
  • Da Geschmäcker verschieden sind und wir etwas lax vorgegangen sind, wird das Ganze im nächsten Abschnitt noch einmal etwas anders formuliert.


Boltzmannfaktor III


  • Wir gehen von folgenden Annahmen aus:

1. Unser System besteht aus N Teilchen.
2. Die Gesamtenergie E des Systems ist konstant.
3. Die Teilchen seien voneinander unterscheidbar, wir können sie uns z.B. nummeriert vorstellen.
4. Die Teilchen können sich nicht gegenseitig beeinflussen: sie sind unabhängig voneinander.
5. Es sollen j verschiedene Energiezustände existieren.
6. Jedes der Teilchen liegt in einem der Energiezustände E_0, E_1,....E_(j -1) vor. Die Anzahl der Teilchen im Energiezustand E_k nennen wir N_k.

  • Folgende Nebenbedingungen müssen erfüllt sein:

1. Die Gesamtanzahl der Teilchen ist:



2. Die Gesamtenergie des Systems ist:



  • Wie viele verschiedene Mikrozustände m gäbe es, wenn man jeweils nur ein Teilchen auf einen Energiezustand verteilen könnte? Fürs erste Teilchen gäbe es beim Verteilen N Möglichkeiten, fürs zweite noch (N-1) usw. Insgesamt gäbe es also m = N (N - 1) (N - 2) ... = N! Mikrozustände.
  • Wir wollen aber zulassen, dass mehrere Teilchen die gleiche Energie besitzen können. Dann ist die Anzahl r der besetzen Energiezustände geringer als die Anzahl N der Teilchen.
  • Wenn man die Teilchen in einer "Energieschublade" vertauscht, entsteht dadurch kein neuer Mikrozustand. Deshalb gibt es nicht mehr N! Mikrozustände; wir müssen Korrekturfaktoren einführen, die die Vertauschbarkeit im gleichen Energiezustand berücksichtigen. Bringt man z.B. in einer Schublade zwei Teilchen unter, gibt es nur noch halb so viele unterscheidbare Mikrozustände.
  • Die Gesamtanzahl der Mikrozustände beträgt:



  • Wir suchen nun die wahrscheinlichste Verteilungsfunktion. Das ist jene Funktion, für die m maximal wird.
  • Jetzt ist es allerdings nicht gerade schön, mit der obigen Formel für m zu rechnen. Es gibt einen Trick: Wenn m maximal wird, wird auch die Funktion ln m maximal sein. Wir können also genau so gut auch die Verteilung suchen, für die folgender Ausdruck maximal wird:



  • Mit Hilfe der Stirlingschen Formel lnN! ≈ N lnN - N und der Bedingung für die Gesamtanzahl N wird daraus die kontinuierliche Funktion:



  • Für welche Verteilung der Teilchen wird unter den Nebenbedingungen konstanter Gesamtenergie und konstanter Gesamtanzahl dieser Ausdruck nun maximal? Da der erste Term N lnN konstant ist, können wir auch untersuchen, wann der zweite Term minimal wird. Nach dem Verfahren der Lagrangen Multiplikatoren bilden wir dazu die Hilfsfunktion:



  • Die ersten j Bedingungen lauten dann:



  • Die Bedingungen aus den Ableitungen nach α und β entsprechen den Bedingungen für die Gesamtanzahl N und Gesamtenergie E.
  • Die ersten j Bedingungen können wir umschreiben als:



  • Das α können wir mit Hilfe der Bedingung für die Gesamtanzahl eliminieren:



  • Der Kehrwert von β muss anscheinend die Einheit einer Energie haben, da das Argument der Exponentialfunktion ohne Einheit sein muss.
  • Der Parameter β lässt sich aber nicht so einfach aus der Bedingung für die Gesamtenergie herausziehen:



  • Das können wir noch ein wenig umformen. Der Zähler ist die negative Ableitung des Nenners nach β:



  • Für die Ableitung des Logarithmus einer Funktion gilt der Zusammenhang d/dx ln(f(x)) = 1/f(x) d/dx f(x):



  • Und wie kommt man jetzt darauf, dass β = 1/kT ? Hat jemand eine schlaue Idee?





Fermi-Dirac-Verteilung II


  • Nehmen wir an, dass zwei Elektronen in ein System mit vier verfügbaren Plätzen gefüllt werden. Es gibt dann sechs verschiedene Möglichketien, die Elektronen anzuordnen, wie unten gezeigt.
   ε1   ε2   ε3   ε4
A  *    *
B  *         *
C  *              *
D       *    *
E       *         *
F            *    *
 
  • Jede dieser Anordnungen wird ein Mikrozustand genannt. Man kann postulieren, dass im thermischen Gleichgewicht jeder dieser Mikrozustände gleich wahrscheinlich ist.
  • Abhängig von der Energie des jeweiligen Platzes kann es sein, dass die Gesamtenergie eines Mikrozustands die gleich wie bei einem anderen ist.
  • Wenn wir annehmen, das die Energien Vielfache eines konstanten Wertes ε sind, betragen die Energien der einzelnen Mikrozustände:
A: 3ε
B: 4ε
C: 5ε
D: 5ε
E: 6ε
F: 7ε
  • Wenn wir wissen, dass das System eine Energie von 5 ε hat, können wir folgendes daraus schließen: Es wird gleich wahrscheinlich sein, das System im Mikrozustand C oder D anzutreffen. (Nebenbemerkung: Wenn die Elektronen unterscheidbar wären gäbe es insgesamt 12 Mikrozustände statt nur sechs.)
  • Nun nehmen wir an, dass wir eine bestimmte Anzahl an Energielevel haben, durchnummeriert mit dem Index i. Ein bestimmter Level besitze die Energie E_i und beinhalte N_i Teilchen.
  • Jedes jeweilige Level habe g_i verfügbare Plätze, welche alle die gleiche Energie besitzen. Die einzelnen Plätze seien voneinander unterscheidbar. Beispielsweise könnten zwei Plätze verschiedene Momente repräsentieren, aber trotzdem die gleiche Energie haben.
  • Den Wert g_i, der mit dem Energielevel i in Verbindung gebracht wird, nennt man Entartung.
  • Das Pauliprinzip besagt, dass nur ein einziges Elektron (allgemeiner: Fermion) so einen verfügbaren Platz besetzen darf.
  • Der Term w(n, g) soll die Anzahl der Möglichkeiten sein, N Teilchen auf die g Plätze eines Energielevels zu verteilen.
  • Es gibt g Möglichkeiten, ein Teilchen auf g verfügbare Plätze zu verteilen. Das schreiben wir als w(1, g) = g.
  • Wir können 2 Teilchen auf g Plätze verteilen, indem wir das erste auf den ersten Platz setzen und die übrigen N -1 Teilchen auf die übrigen g -1 Plätze verteilen. Oder wir könnten
We can distribute 2 particles in g sublevels by putting one in the first sublevel and then distributing the remaining n − 1 particles in the remaining g − 1 sublevels, or we could put one in the second sublevel and then distribute the remaining n − 1 particles in the remaining g − 2 sublevels, etc. so that w'(2, g) = w(1, g − 1) + w(1,g − 2) + ... + w(1, 1) or
where we have used the following theorem involving binomial coefficients:
Continuing this process, we can see that w(n, g) is just a binomial coefficient
The number of ways that a set of occupation numbers ni can be realized is the product of the ways that each individual energy level can be populated:
Following the same procedure used in deriving the Maxwell-Boltzmann distribution, we wish to find the set of ni for which W is maximised, subject to the constraint that there be a fixed number of particles, and a fixed energy. We constrain our solution using Lagrange multipliers forming the function:
Again, using Stirling's approximation for the factorials and taking the derivative with respect to ni, and setting the result to zero and solving for ni yields the Fermi-Dirac population numbers:
It can be shown thermodynamically that β = 1/kT where k is Boltzmann's constant and T is the temperature, and that α = -μ/kT where μ is the chemical potential, so that finally:
Note that the above formula is sometimes written:
where z = exp(μ / kT) is the absolute activity.