Sitzung: Jeden Freitag in der Vorlesungszeit ab 16 Uhr c. t. im MAR 0.005. In der vorlesungsfreien Zeit unregelmäßig (Jemensch da?). Macht mit!

Die wichtigsten Unix-Befehle: Unterschied zwischen den Versionen

(Wichtige Befehle: da hat jemand zu viel kopiert -> auseinanderfusseln ...)
Zeile 395: Zeile 395:
  
 
== Wichtige Befehle ==
 
== Wichtige Befehle ==
Der Leser wird dazu aufgerufen, interessante Befehle gleich auszuprobieren. Das macht es einfacher, sich später daran zu erinnern. Außerdem sollte man die [[Manpage|Manpages]] zu den einzelnen Befehlen lesen, bevor man sie ernsthaft einsetzt.
 
 
Da laut Unix-Philosophie der Benutzer immer am besten weiß, was zu tun ist, fragen die hier vorgestellten Programme im Allgemeinen nicht nach, ob zum Beispiel Dateien "wirklich" gelöscht werden sollen, sondern tun es einfach. (Allerdings ist das im Fakultätsnetz teilweise anders konfiguriert.)
 
 
=== <code>ls</code> ===
 
<code>ls</code> steht für ''list'' und zeigt den inhalt des derzeitigen Verzeichnisses an.
 
 
Nützliche Optionen sind:
 
* <code>-a</code> alle Dateien anzeigen (auch "versteckte", die mit "." anfangen)
 
* <code>-l</code> langes Format mit Anzeige vieler nützlicher Informationen zu den Dateien
 
 
=== <code>cd</code> ===
 
<code>cd</code> steht für ''change directory'' und macht genau das.
 
 
cd
 
bringt einen immer ins Homeverzeichnis zurück,
 
cd ..
 
in das Verzeichnis, das das aktuelle Verzeichnis enthält und
 
cd einVerzeichnisName
 
in genau das angegebene Verzeichnis.
 
 
=== <code>mv</code> ===
 
<code>mv</code> steht für ''move'' und verschiebt Dateien (auch Verzeichnisse). Da Umbenennung ein Spezialfall des Verschiebens ist, kann <code>mv</code> auch Dateien umbenennen.
 
 
Aufruf:
 
mv alter_name neuer_name
 
 
=== <code>cp</code> ===
 
<code>cp</code> steht für ''copy'' und kopiert Dateien (mit dem Parameter <code>-R</code> auch Verzeichnisse).
 
 
Aufruf:
 
cp name1 name2
 
kopiert die Datei <code>name1</code> nach <code>name2</code>,
 
cp name verzeichnis/
 
kopiert die Datei <code>name</code> in das Verzeichnis <code>verzeichnis/</code> und
 
cp -R verzeichnis1 verzeichnis2
 
kopiert das Verzeichnis <code>verzeichnis1</code> [[Rekursion|rekursiv]] nach <code>verzeichnis2</code>, falls <code>verzeichnis2</code> noch nicht existiert, oder in das Verzeichnis <code>verzeichnis2</code>, falls es existiert.
 
 
=== <code>ssh</code> ===
 
Siehe [[SSH]].
 
 
=== <code>scp</code> ===
 
Siehe [[SSH]].
 
 
=== <code>less</code> ===
 
<code>less</code> zeigt komfortabel und einfach Dateien an. In <code>less</code> kann man sich mit "h" eine ausführliche Hilfe anzeigen lassen. Wichtigste Kommandos: <code> </code> (Leerzeichen) für nächste Seite, <code>b</code> (backwards) für vorherige Seite, ansonsten Pfeiltasten. <code>/muster</code> sucht nach ''muster'' und man kann mit <code>n</code> zum nächsten Fundort springen. <code>f</code> geht ganz ans Ende und <code>F</code> geht ganz ans Ende und zeigt neue Zeilen falls diese dazukommen.
 
 
Aufruf:
 
less dateiname
 
 
=== <code>grep</code> ===
 
<code>grep</code> sucht nach Text in Dateien, oder, falls keine Dateien angegeben werden, in der Eingabe. Es kann auch nach regulären Ausdrücken gesucht werden.
 
 
Aufruf:
 
grep 'zu suchender Text' dateinamen...
 
egrep '[rR]egulärer *Ausdruck' dateinamen...
 
 
=== <code>man</code> ===
 
Siehe [[Manpage]].
 
 
=== <code>gzip</code> ===
 
Packt und entpackt Dateien. Im Unterschied z. B. zu WinZip arbeitet <code>gzip</code> mit genau einer Datei. Das Packen mehrerer Dateien wird weiter unten erläutert.
 
 
Packen:
 
gzip datei
 
erzeugt eine komprimierte Datei mit dem Namen <code>datei.gz</code> und '''löscht''' die Datei <code>datei</code>.
 
 
Packen ohne Löschen:
 
cp datei datei.bck
 
gzip datei
 
mv datei.bck datei
 
(siehe auch die Beschreibungen von <code>cp</code> und <code>mv</code>).
 
 
Entpacken:
 
gunzip datei.gz
 
entpackt die Daten aus <code>datei.gz</code> nach <code>datei</code> und '''löscht''' <code>datei.gz</code>.
 
 
Entpacken ohne Löschen:<br />
 
geht analog zum Packen ohne Löschen.
 
 
=== <code>tar</code> ===
 
<code>tar</code> ist der ''tape archiver'' und wurde ursprünglich für Backups auf Bandlaufwerken verwendet. Es ist inzwischen das Unix-Standardwerkzeug, um viele Dateien in eine Datei zu packen.
 
 
Aufruf:
 
tar fvc datei.tar dateinamen...
 
erzeugt das Archiv <code>datei.tar</code> aus den weiter angegebenen Dateien (und Verzeichnissen!).
 
tar fvt datei.tar
 
zeigt den Inhalt des Archivs <code>datei.tar</code> an.
 
tar fvx datei.tar
 
entpackt alle Dateien aus <code>datei.tar</code> und
 
tar fvx datei.tar dateinamen...
 
nur die angegebenen.
 
 
Erklärung der Optionen:
 
* <code>f</code> steht für ''file'', d. h., <code>tar</code> soll eine Archivdatei bearbeiten. (Sonst ist das Verhalten je nach <code>tar</code>-Implementierung unterschiedlich.)
 
* <code>v</code> steht für ''verbose''. In diesem Modus zeigt <code>tar</code> mehr Information als sonst an.
 
* <code>c</code> steht für ''create'' und sagt <code>tar</code>, dass es ein neues Archiv erzeugen soll.
 
* <code>t</code> zeigt die Dateien in einem Archiv an.
 
* <code>x</code> steht für ''extract'' und tut genau das.
 
* <code>z</code> steht für ''zip''. Fügt man diesen Parameter hinzu, dann arbeitet <code>tar</code> mit komprimierten Archiven. Amsonsten bleibt die Benutzung gleich; statt <code>datei.tar</code> schreibt man dann sinnvollerweise immer <code>datei.tar.gz</code>.
 
Von den Optionen <code>c</code>, <code>t</code> und <code>x</code> sollte genau eine angegeben werden.
 
 
Wenn man ein <code>tar</code>-Archiv erstellt, das für andere Leute gedacht ist, sollte man im Allgemeinen darin genau ein Verzeichnis packen, dessen Name etwas mit dem Inhalt zu tun hat. Das macht es einfacher, nach dem Entpacken den Überblick über die entpackten Dateien zu behalten.
 
 
Verschickt man viele Dateien in einer Email, dann sollte man sie zuerst in ein komprimiertes <code>tar</code>-Archiv packen. Das erspart dem Empfänger Arbeit (Wer speichert schon gern ein dutzend Anhänge einzeln ab?) und ist deshalb höflich. WinZip würde zwar prinzipiell das Gleiche tun, aber nicht alle Unix-Benutzer können WinZip-Dateien lesen.
 
 
Quellcode wird häufig in komprimierten <code>tar</code>-Archiven (''tarballs'') angeboten.
 
 
=== <code>pico</code> und <code>nano</code> ===
 
<code>pico</code> ein minimaler Texteditor aus dem Mailprogramm <code>pine</code>. Sein großer Vorteil ist, das er unten am Bildschirmrand immer ein Menü anzeigt. "<code>^</code>" steht dabei immer für <code><Ctrl></code>. <code>nano</code> ist eine Standalone-Version des Editors.
 
 
Tastenkombinationen:
 
* <code><Ctrl>-x</code> um den Editor zu beenden
 
 
=== <code>emacs</code> ===
 
Ein eigenes Betriebsystem (in Lisp geschrieben und programmierbar). Nebenbei noch ein brauchbarer Text-Editor.
 
 
Tastenkombinationen:
 
* <code><Ctrl>-x-c</code> (x und c nacheinander, Controltaste dabei gedrückt halten) um Emacs zu beenden.
 
 
=== <code>vi</code> oder <code>vim</code> ===
 
<code>vi</code> (''visual'') ist der Unix-Standardtexteditor und bei fast jedem Unix vorhanden, daher sollte man zumindest die wichtigsten Befehle beherrschen. <code>vim</code> (''Vi IMproved'') ist der beliebteste und mächtigste Vi-Clone und der Editor der Wahl für Leute, die keinen Lisp-Editor brauchen um ASCII-Dateien zu editieren.
 
 
Tastenkombinationen:
 
* <code><Esc>:q<Enter></code> zum Beenden. Alles Weitere liest man [http://de.wikipedia.org/wiki/Vi woanders] nach.
 
 
=== <code>chmod</code> ===
 
<code>chmod</code> steht für ''change mode'' und ändert die Zugriffsrechte von Dateien, also wer sie lesen und schreiben darf und wer nicht. Das ist wichtig, wenn man mit anderen Leuten zusammenarbeiten will/muss. Dass man es braucht, merkt man, wenn man Fehlermeldungen wie "Permission Denied" bekommt. Eine Erläuterung der Unix-Dateirechte und somit auch der <code>chmod</code>-Optionen  lässt sich anderswo nachlesen.
 
 
=== <code>grp</code> ===
 
Mit <code>grp</code> (''group administrativia'') könnt ihr euch in Unix-Gruppen eintragen. Das ist wichtig, wenn ihr in Gruppen Hausaufgaben erledigen wollt. Siehe auch http://irb.cs.tu-berlin.de/leitfaden/arbeiten-in-gruppen.html
 
  
 
=== <code>utsettings</code> ===
 
=== <code>utsettings</code> ===

Version vom 24. Oktober 2006, 21:23 Uhr

Die Unix-Shell

Was ist das überhaupt

Prinzipiell kann man mit einem Betriebsystem auf verschiedenen Ebenen arbeiten (um z. B. Dateien zu erzeugen, zu bearbeiten, zu verschieben oder zu löschen):

  • als Benutzer einer graphischen Oberfläche (GUI) indem man Programme wie den OS X Finder, Windows Explorer oder Gnome Nautilus verwendet,
  • als Programmierer, indem man Funktionen des Betriebsystems aufruft,
  • als Shell-Benutzer, der (scheinbar) kryptische Befehle in eine Text-Eingabe schreibt.

Und genau um diesen letzten Weg soll es hier gehen.

Im Prinzip gibt es genau fünf Gründe, wieso man eine Shell verwenden möchte:

  • Es ist in der Regel schneller, etwas in einer Shell zu machen, als das äquivalente Ergebnis mit einer GUI zu erzielen.
  • Shellscripte lassen sich schneller schreiben als (C-)Programme.
  • Eine Shell ist in der Regel kleiner als eine GUI und beansprucht weniger Ressourcen.
  • Wenn man sich über SSH auf einem anderen Rechner einloggt, bekommt man eine Shell. (Eine GUI zu bekommen ist nichttrivial.)
  • In einer Shell werden Befehle für extrem einfache und extrem komplexe Vorgänge nach dem gleichen Prinzip aufgebaut. (Bei einer GUI muss man dazu oft jeweils verschiedene Werkzeuge benutzen, oder sogar Zusatzsoftware installieren.)
  • Wenn man sich damit auskennt, kann man alle paar Wochen mal jemanden, der sich nicht damit auskennt, extrem verblüffen.

Verschiedene Shells

Es gibt viele Shells. Alle haben kryptische Namen und die meisten enden auf -sh. Bekannte Beispiele sind:

  • sh ist die erste moderne Shell, genannt Bourne-Shell. Eine sh-kompatible Shell ist auf fast jedem Unix-System vorhanden.
  • bash ist die Bourne Again SHell, ein Nachfolger von sh, und die Standardshell in den meisten Linux-Distributionen und auch im Fakultätsnetz.
  • csh ist die C Shell.
  • tcsh ist eine Weiterentwicklung von csh, die manche Leute mehr mögen als bash.

Im Rest dieses Artikels geht es um die bash; wer eine andere Shell benutzt, kann die Unterschiede anhand der Manpages nachlesen.

Beispiele

So lässt man sich die Dateien im aktuellen Verzeichnis anzeigen:

ls

Und so wird die Anzeige ausführlicher:

ls -l

... und mit versteckten Dateien (das sind Dateien, deren Name mit einem Punkt beginnt):

ls -la

Verzeichniswechsel:

cd      # ins Homeverzeichnis gehen
cd foo  # in das Verzeichnis foo gehen
cd ..   # ein Verzeichnis aufwärts gehen
cd .    # in das aktuelle Verzeichnis gehen (sinnlos, aber möglich)

(# ist das Kommentarzeichen der bash. # und alles, was rechts davon steht, wird ignoriert.)

Dieser Schnipsel ersetzt mit Hilfe des Texteditors vi in allen html-Dateien im aktuellen Verzeichnis eine veraltete Emailadresse:

for i in *.html; do \
        vi -c ':1,$s/alt@meinedomain.de/webmaster@meinedomain.de/g' -c ':wq' "$i"; done

So sieht es aus, wenn man auf Lesbarkeit Wert legt:

for i in *.html
do
        vi -c ':1,$s/alt@meinedomain.de/webmaster@meinedomain.de/g' -c ':wq' "$i"
done

Alternativer Weg (wobei auch die Unterverzeichnisse rekursiv bearbeitet werden):

find . -name '*.html' -type f -exec \
        vi -c ':1,$s/alt@meinedomain.de/webmaster@meinedomain.de/g' -c ':wq' '{}' ';'

Prinzipien

Die Idee der Shell ist, dass man eine relativ einfache (und aus vielen Abkürzungen bestehende) Programmiersprache hat, die man in einem Interpreter (der Shell) direkt eingeben kann - also genau das richtige Spielzeug für Informatiker.

Man kann Befehle auch in eine Datei schreiben und dann am Stück ausführen lassen. Diese Dateien heißen Shellskripte. Beispiel:

#!/bin/bash
# Das ist ein Shellskript. Die erste Zeile sagt dem Betriebssystem,
# dass es diese Datei mit Hilfe der bash interpretieren soll.
#
# Der Rest der Datei besteht aus bash-Befehlen und ist in diesem
# Fall sinnfrei (und harmlos).
FOO="foo    bar"        # eine Variable (Name links, Inhalt rechts)
                        # um das Gleichheitszeichen herum dürfen
                        # keine Leerzeichen stehen.
echo -n '$FOO = '
echo $FOO
echo -n '"$FOO" = '
echo "$FOO"
echo -n "'$FOO' = "
echo '$FOO'

Wenn man diesen Text in einer Textdatei, z. B. foo.sh, speichert und diese ausführbar macht, z. B. mit

chmod 700 foo.sh

dann kann man sie wie ein normales Unix-Programm ausführen.

Befehle

Es gibt vier Arten von einfachen Befehlen:

  • shellinterne Befehle (zum Beispiel echo),
  • Kontrollstrukturen der Shell (zum Beispiel while bedingung do code done),
  • Aliase (primitive Makros, die dann durch etwas anderes ersetzt werden) und
  • Aufrufe externer Programme (zum Beispiel vi und find).

Dabei gibt man immer den Befehl selbst gefolgt von eventuellen Parametern an. Die Parameter sind vom Befehl und untereinander durch Leerräume (typischerweise Leerzeichen) getrennt.

Befehle lassen sich auf mehrere Arten zusammenfassen:

  • als Verkettung mit einem Semikolon zwischen je zwei Befehlen:
echo foo ; echo bar
  • als durch geschweifte Klammern begrenzter Befehlsblock:
{ echo foo ; echo bar ; echo qux }
  • als Pipeline, wobei die Befehle durch einen senkrechten Strich getrennt werden:
echo 'Umweltverschmutzung' | tr mu nü | cat -
  • als logischer Ausdruck:
test -e foo.bar && echo "Datei existiert." || echo "Datei existiert nicht."

Pipe(line)s bewirken, dass die Ausgabe des ersten Befehls die Eingabe des zweiten Befehls wird; dessen Ausgabe geht zum dritten Befehl und so weiter. Da viele Unix-Programme Text produzieren, umwandeln oder lesen, ist das ein mächtiges Werkzeug, um mit einfachen Mitteln komplizierte Dinge zu machen, die in einer GUI bestenfalls dann möglich sind, wenn die Entwickler sie genau in der Form eingeplant haben. Zum Beispiel erzeugt

cat foo.txt | sort | uniq > bar.txt

die Datei bar.txt, die die sortierten Zeilen aus foo.txt ohne doppelte Zeilen enthält. Das Zeichen > lenkt dabei die Ausgabe in die Datei bar.txt um. Eleganter lässt sich das ganze als

{ sort | uniq } < foo.txt > bar.txt

schreiben. (< lenkt logischerweise die Eingabe so um, dass sie aus der Datei foo.txt kommt.)

Wenn man einen Befehl mit einem & (kaufmännisches Und) abschließt (also befehl &, das Lehrzeichen ist wichtig), so wird er im Hintergrund ausgeführt und man kann in der Shell solange etwas anderes tun. Hat man das & vergessen, kann man einen laufenden Befehl durch den Tastenkürzel <Ctrl>-Z anhalten und mit dem Kommando bg im Hintergrund fortsetzen.

Führt man ein Kommando im Vordergrund in der Shell aus und schließt sie, wird das laufende Programm in der Regel (aber nicht unbedingt) mit der Shell beendet. Besser ist es, erst das Programm und dann die Shell zu beenden.

Jeder Befehl hat seine eigene Menge von möglichen und/oder erforderlichen Argumenten, die bei jedem Befehl anders sind. Allerdings ist die Schreibweise der Argumente bei vielen Befehlen (es gibt Ausnahmen) ähnlich:

  • Kurzform: -a -d -f -r, aus jeweils einem Buchstaben bestehende Argumente mit einem Bindestrich vor jedem Argument
  • abgekürzte Kurzform: -adfr. Diese Form wird nicht von allen Befehlen unterstützt und kann manchmal eine sehr unerwartete Wirkung haben.
  • Langform: --all --directory --force --recursive etc. Hier werden aus Worten (oder zumindest längeren Zeichenketten) geschriebe Worte von zwei Bindestrichen (manchmal aber nur einem) angeführt. Zusammenfassen kann man diese Argumente nicht. Diese Form ist bei vielen GNU-Programmen möglich.
  • Parametrisierte Argumente: Manchmal gibt es Argumente, die aus einem Schalter und einem Wert bestehen, z. B. --directory /home/pub/lib, -d /home/pub/lib, --force YES, -f YES, --number 23.

Zu all diesen Regelmäßigkeiten gibt es Ausnahmen. Es ist also immer ratsam, Manpages zu konsultieren.

Was sieht man

Man hat immer zuerst einen Prompt, der im Fakultätsnetz standardmäßig so aussieht:

conde mhaecker 11 (~):
  1. Vorne steht immer der Name des Rechners, auf dem man gerade eingelogt ist. In der Uni kann das zum Beispiel conde (schnell), fiesta (lahm) oder einer von vielen anderen sein. (Welcher Rechner schnell ist, hängt natürlich davon ab, wie viele hundert Studierende dort gerade versuchen, die ziemlich ressourcenlastige grafische Benutzeroberfläche KDE zu benutzen.)
  2. Danach kommt der Benutzername desjenigen, dem die Shell gehört, das heißt, in wessen Namen die eingegebenen Kommandos ausgeführt werden (mhaecker ist der Benutzername von Martin Häcker).
  3. Die Zahl danach gibt an, wie viele Kommandos schon in dieser Shell eingegeben wurden. (Das ist meistens nicht nützlich.)
  4. Danach steht in Klammern das aktuelle Verzeichnis (~ ist eine Abkürzung für das eigene Heimatverzeichnis).

Das Aussehen und den Inhalt des Prompts kann man durch Setzen der Shellvariable PS1 anpassen. Zum Beispiel kann man durch die Eingabe von

PS1='\[\033[01;32m\]\u@\h \[\033[01;34m\]\w \$ \[\033[00m\]'

den Gentoo-Standardprompt bekommen (die Syntax der Promptbeschreibung muss nicht unbedingt verstanden werden), der die Form

estar@fiesta ~ $ 

hat (Benutzername, @, Rechnername, $), oder mit

PS1='\$'

einen extrem einfachen Prompt.

Am Prompt kann man Befehle eingeben. Nachdem ein vollständiger Befehl eingegeben wurde, lässt man mit der Eingabetaste die Shell den Befehl ausführen. Wenn die Shell damit fertig ist, erscheint wieder der Prompt.

.bashrc

Viele Sachen, zum Beispiel das Setzen eines eigenen Prompts, möchte man bei jedem Start der Shell automatisch erledigen. Bei der bash geht das, indem man die entsprechenden Befehle zur Datei .bashrc im Homeverzeichnis hinzufügt.

Bevor man .bashrc bearbeitet

  • Diese Datei lässt sich so kaputtmachen, dass man keine Shell mehr öffnen kann. Also sollten alle Befehle zuerst in der Shell getestet werden.
  • Damit SSH und insbesondere scp richtig funktionieren, dürfen die Befehle in .bashrc keine Ausgabe produzieren.
  • Es ist sinnvoll, zuerst die Dokumentation der bash zu lesen.

Wichtige Befehle

Der Leser wird dazu aufgerufen, interessante Befehle gleich auszuprobieren. Das macht es einfacher, sich später daran zu erinnern. Außerdem sollte man die Manpages zu den einzelnen Befehlen lesen, bevor man sie ernsthaft einsetzt.

Da laut Unix-Philosophie der Benutzer immer am besten weiß, was zu tun ist, fragen die hier vorgestellten Programme im Allgemeinen nicht nach, ob zum Beispiel Dateien "wirklich" gelöscht werden sollen, sondern tun es einfach. (Allerdings ist das im Fakultätsnetz teilweise anders konfiguriert.)

ls

ls steht für list und zeigt den inhalt des derzeitigen Verzeichnisses an.

Nützliche Optionen sind:

  • -a alle Dateien anzeigen (auch "versteckte", die mit "." anfangen)
  • -l langes Format mit Anzeige vieler nützlicher Informationen zu den Dateien

cd

cd steht für change directory und macht genau das.

cd

bringt einen immer ins Homeverzeichnis zurück,

cd ..

in das Verzeichnis, das das aktuelle Verzeichnis enthält und

cd einVerzeichnisName

in genau das angegebene Verzeichnis.

mv

mv steht für move und verschiebt Dateien (auch Verzeichnisse). Da Umbenennung ein Spezialfall des Verschiebens ist, kann mv auch Dateien umbenennen.

Aufruf:

mv alter_name neuer_name

cp

cp steht für copy und kopiert Dateien (mit dem Parameter -R auch Verzeichnisse).

Aufruf:

cp name1 name2

kopiert die Datei name1 nach name2,

cp name verzeichnis/

kopiert die Datei name in das Verzeichnis verzeichnis/ und

cp -R verzeichnis1 verzeichnis2

kopiert das Verzeichnis verzeichnis1 rekursiv nach verzeichnis2, falls verzeichnis2 noch nicht existiert, oder in das Verzeichnis verzeichnis2, falls es existiert.

ssh

Siehe SSH.

scp

Siehe SSH.

less

less zeigt komfortabel und einfach Dateien an. In less kann man sich mit "h" eine ausführliche Hilfe anzeigen lassen. Wichtigste Kommandos: (Leerzeichen) für nächste Seite, b (backwards) für vorherige Seite, ansonsten Pfeiltasten. /muster sucht nach muster und man kann mit n zum nächsten Fundort springen. f geht ganz ans Ende und F geht ganz ans Ende und zeigt neue Zeilen falls diese dazukommen.

Aufruf:

less dateiname

grep

grep sucht nach Text in Dateien, oder, falls keine Dateien angegeben werden, in der Eingabe. Es kann auch nach regulären Ausdrücken gesucht werden.

Aufruf:

grep 'zu suchender Text' dateinamen...
egrep '[rR]egulärer *Ausdruck' dateinamen...

man

Siehe Manpage.

gzip

Packt und entpackt Dateien. Im Unterschied z. B. zu WinZip arbeitet gzip mit genau einer Datei. Das Packen mehrerer Dateien wird weiter unten erläutert.

Packen:

gzip datei

erzeugt eine komprimierte Datei mit dem Namen datei.gz und löscht die Datei datei.

Packen ohne Löschen:

cp datei datei.bck
gzip datei
mv datei.bck datei

(siehe auch die Beschreibungen von cp und mv).

Entpacken:

gunzip datei.gz

entpackt die Daten aus datei.gz nach datei und löscht datei.gz.

Entpacken ohne Löschen:
geht analog zum Packen ohne Löschen.

tar

tar ist der tape archiver und wurde ursprünglich für Backups auf Bandlaufwerken verwendet. Es ist inzwischen das Unix-Standardwerkzeug, um viele Dateien in eine Datei zu packen.

Aufruf:

tar fvc datei.tar dateinamen...

erzeugt das Archiv datei.tar aus den weiter angegebenen Dateien (und Verzeichnissen!).

tar fvt datei.tar

zeigt den Inhalt des Archivs datei.tar an.

tar fvx datei.tar

entpackt alle Dateien aus datei.tar und

tar fvx datei.tar dateinamen...

nur die angegebenen.

Erklärung der Optionen:

  • f steht für file, d. h., tar soll eine Archivdatei bearbeiten. (Sonst ist das Verhalten je nach tar-Implementierung unterschiedlich.)
  • v steht für verbose. In diesem Modus zeigt tar mehr Information als sonst an.
  • c steht für create und sagt tar, dass es ein neues Archiv erzeugen soll.
  • t zeigt die Dateien in einem Archiv an.
  • x steht für extract und tut genau das.
  • z steht für zip. Fügt man diesen Parameter hinzu, dann arbeitet tar mit komprimierten Archiven. Amsonsten bleibt die Benutzung gleich; statt datei.tar schreibt man dann sinnvollerweise immer datei.tar.gz.

Von den Optionen c, t und x sollte genau eine angegeben werden.

Wenn man ein tar-Archiv erstellt, das für andere Leute gedacht ist, sollte man im Allgemeinen darin genau ein Verzeichnis packen, dessen Name etwas mit dem Inhalt zu tun hat. Das macht es einfacher, nach dem Entpacken den Überblick über die entpackten Dateien zu behalten.

Verschickt man viele Dateien in einer Email, dann sollte man sie zuerst in ein komprimiertes tar-Archiv packen. Das erspart dem Empfänger Arbeit (Wer speichert schon gern ein dutzend Anhänge einzeln ab?) und ist deshalb höflich. WinZip würde zwar prinzipiell das Gleiche tun, aber nicht alle Unix-Benutzer können WinZip-Dateien lesen.

Quellcode wird häufig in komprimierten tar-Archiven (tarballs) angeboten.

pico und nano

pico ein minimaler Texteditor aus dem Mailprogramm pine. Sein großer Vorteil ist, das er unten am Bildschirmrand immer ein Menü anzeigt. "^" steht dabei immer für <Ctrl>. nano ist eine Standalone-Version des Editors.

Tastenkombinationen:

  • <Ctrl>-x um den Editor zu beenden

emacs

Ein eigenes Betriebsystem (in Lisp geschrieben und programmierbar). Nebenbei noch ein brauchbarer Text-Editor.

Tastenkombinationen:

  • <Ctrl>-x-c (x und c nacheinander, Controltaste dabei gedrückt halten) um Emacs zu beenden.

vi oder vim

vi (visual) ist der Unix-Standardtexteditor und bei fast jedem Unix vorhanden, daher sollte man zumindest die wichtigsten Befehle beherrschen. vim (Vi IMproved) ist der beliebteste und mächtigste Vi-Clone und der Editor der Wahl für Leute, die keinen Lisp-Editor brauchen um ASCII-Dateien zu editieren.

Tastenkombinationen:

  • <Esc>:q<Enter> zum Beenden. Alles Weitere liest man woanders nach.

chmod

chmod steht für change mode und ändert die Zugriffsrechte von Dateien, also wer sie lesen und schreiben darf und wer nicht. Das ist wichtig, wenn man mit anderen Leuten zusammenarbeiten will/muss. Dass man es braucht, merkt man, wenn man Fehlermeldungen wie "Permission Denied" bekommt. Eine Erläuterung der Unix-Dateirechte und somit auch der chmod-Optionen lässt sich anderswo nachlesen.

grp

Mit grp (group administrativia) könnt ihr euch in Unix-Gruppen eintragen. Das ist wichtig, wenn ihr in Gruppen Hausaufgaben erledigen wollt. Siehe auch http://irb.cs.tu-berlin.de/leitfaden/arbeiten-in-gruppen.html


Im Prinzip gibt es genau fünf Gründe, wieso man eine Shell verwenden möchte:

  • Es ist in der Regel schneller, etwas in einer Shell zu machen, als das äquivalente Ergebnis mit einer GUI zu erzielen.
  • Shellscripte lassen sich schneller schreiben als (C-)Programme.
  • Eine Shell ist in der Regel kleiner als eine GUI und beansprucht weniger Ressourcen.
  • Wenn man sich über SSH auf einem anderen Rechner einloggt, bekommt man eine Shell. (Eine GUI zu bekommen ist nichttrivial.)
  • In einer Shell werden Befehle für extrem einfache und extrem komplexe Vorgänge nach dem gleichen Prinzip aufgebaut. (Bei einer GUI muss man dazu oft jeweils verschiedene Werkzeuge benutzen, oder sogar Zusatzsoftware installieren.)
  • Wenn man sich damit auskennt, kann man alle paar Wochen mal jemanden, der sich nicht damit auskennt, extrem verblüffen.

Verschiedene Shells

Es gibt viele Shells. Alle haben kryptische Namen und die meisten enden auf -sh. Bekannte Beispiele sind:

  • sh ist die erste moderne Shell, genannt Bourne-Shell. Eine sh-kompatible Shell ist auf fast jedem Unix-System vorhanden.
  • bash ist die Bourne Again SHell, ein Nachfolger von sh, und die Standardshell in den meisten Linux-Distributionen und auch im Fakultätsnetz.
  • csh ist die C Shell.
  • tcsh ist eine Weiterentwicklung von csh, die manche Leute mehr mögen als bash.

Im Rest dieses Artikels geht es um die bash; wer eine andere Shell benutzt, kann die Unterschiede anhand der Manpages nachlesen.

Beispiele

So lässt man sich die Dateien im aktuellen Verzeichnis anzeigen:

ls

Und so wird die Anzeige ausführlicher:

ls -l

... und mit versteckten Dateien (das sind Dateien, deren Name mit einem Punkt beginnt):

ls -la

Verzeichniswechsel:

cd      # ins Homeverzeichnis gehen
cd foo  # in das Verzeichnis foo gehen
cd ..   # ein Verzeichnis aufwärts gehen
cd .    # in das aktuelle Verzeichnis gehen (sinnlos, aber möglich)

(# ist das Kommentarzeichen der bash. # und alles, was rechts davon steht, wird ignoriert.)

Dieser Schnipsel ersetzt mit Hilfe des Texteditors vi in allen html-Dateien im aktuellen Verzeichnis eine veraltete Emailadresse:

for i in *.html; do \
        vi -c ':1,$s/alt@meinedomain.de/webmaster@meinedomain.de/g' -c ':wq' "$i"; done

So sieht es aus, wenn man auf Lesbarkeit Wert legt:

for i in *.html
do
        vi -c ':1,$s/alt@meinedomain.de/webmaster@meinedomain.de/g' -c ':wq' "$i"
done

Alternativer Weg (wobei auch die Unterverzeichnisse rekursiv bearbeitet werden):

find . -name '*.html' -type f -exec \
        vi -c ':1,$s/alt@meinedomain.de/webmaster@meinedomain.de/g' -c ':wq' '{}' ';'

Prinzipien

Die Idee der Shell ist, dass man eine relativ einfache (und aus vielen Abkürzungen bestehende) Programmiersprache hat, die man in einem Interpreter (der Shell) direkt eingeben kann - also genau das richtige Spielzeug für Informatiker.

Man kann Befehle auch in eine Datei schreiben und dann am Stück ausführen lassen. Diese Dateien heißen Shellskripte. Beispiel:

#!/bin/bash
# Das ist ein Shellskript. Die erste Zeile sagt dem Betriebssystem,
# dass es diese Datei mit Hilfe der bash interpretieren soll.
#
# Der Rest der Datei besteht aus bash-Befehlen und ist in diesem
# Fall sinnfrei (und harmlos).
FOO="foo    bar"        # eine Variable (Name links, Inhalt rechts)
                        # um das Gleichheitszeichen herum dürfen
                        # keine Leerzeichen stehen.
echo -n '$FOO = '
echo $FOO
echo -n '"$FOO" = '
echo "$FOO"
echo -n "'$FOO' = "
echo '$FOO'

Wenn man diesen Text in einer Textdatei, z. B. foo.sh, speichert und diese ausführbar macht, z. B. mit

chmod 700 foo.sh

dann kann man sie wie ein normales Unix-Programm ausführen.

Befehle

Es gibt vier Arten von einfachen Befehlen:

  • shellinterne Befehle (zum Beispiel echo),
  • Kontrollstrukturen der Shell (zum Beispiel while bedingung do code done),
  • Aliase (primitive Makros, die dann durch etwas anderes ersetzt werden) und
  • Aufrufe externer Programme (zum Beispiel vi und find).

Dabei gibt man immer den Befehl selbst gefolgt von eventuellen Parametern an. Die Parameter sind vom Befehl und untereinander durch Leerräume (typischerweise Leerzeichen) getrennt.

Befehle lassen sich auf mehrere Arten zusammenfassen:

  • als Verkettung mit einem Semikolon zwischen je zwei Befehlen:
echo foo ; echo bar
  • als durch geschweifte Klammern begrenzter Befehlsblock:
{ echo foo ; echo bar ; echo qux }
  • als Pipeline, wobei die Befehle durch einen senkrechten Strich getrennt werden:
echo 'Umweltverschmutzung' | tr mu nü | cat -
  • als logischer Ausdruck:
test -e foo.bar && echo "Datei existiert." || echo "Datei existiert nicht."

Pipe(line)s bewirken, dass die Ausgabe des ersten Befehls die Eingabe des zweiten Befehls wird; dessen Ausgabe geht zum dritten Befehl und so weiter. Da viele Unix-Programme Text produzieren, umwandeln oder lesen, ist das ein mächtiges Werkzeug, um mit einfachen Mitteln komplizierte Dinge zu machen, die in einer GUI bestenfalls dann möglich sind, wenn die Entwickler sie genau in der Form eingeplant haben. Zum Beispiel erzeugt

cat foo.txt | sort | uniq > bar.txt

die Datei bar.txt, die die sortierten Zeilen aus foo.txt ohne doppelte Zeilen enthält. Das Zeichen > lenkt dabei die Ausgabe in die Datei bar.txt um. Eleganter lässt sich das ganze als

{ sort | uniq } < foo.txt > bar.txt

schreiben. (< lenkt logischerweise die Eingabe so um, dass sie aus der Datei foo.txt kommt.)

Wenn man einen Befehl mit einem & (kaufmännisches Und) abschließt (also befehl &, das Lehrzeichen ist wichtig), so wird er im Hintergrund ausgeführt und man kann in der Shell solange etwas anderes tun. Hat man das & vergessen, kann man einen laufenden Befehl durch den Tastenkürzel <Ctrl>-Z anhalten und mit dem Kommando bg im Hintergrund fortsetzen.

Führt man ein Kommando im Vordergrund in der Shell aus und schließt sie, wird das laufende Programm in der Regel (aber nicht unbedingt) mit der Shell beendet. Besser ist es, erst das Programm und dann die Shell zu beenden.

Jeder Befehl hat seine eigene Menge von möglichen und/oder erforderlichen Argumenten, die bei jedem Befehl anders sind. Allerdings ist die Schreibweise der Argumente bei vielen Befehlen (es gibt Ausnahmen) ähnlich:

  • Kurzform: -a -d -f -r, aus jeweils einem Buchstaben bestehende Argumente mit einem Bindestrich vor jedem Argument
  • abgekürzte Kurzform: -adfr. Diese Form wird nicht von allen Befehlen unterstützt und kann manchmal eine sehr unerwartete Wirkung haben.
  • Langform: --all --directory --force --recursive etc. Hier werden aus Worten (oder zumindest längeren Zeichenketten) geschriebe Worte von zwei Bindestrichen (manchmal aber nur einem) angeführt. Zusammenfassen kann man diese Argumente nicht. Diese Form ist bei vielen GNU-Programmen möglich.
  • Parametrisierte Argumente: Manchmal gibt es Argumente, die aus einem Schalter und einem Wert bestehen, z. B. --directory /home/pub/lib, -d /home/pub/lib, --force YES, -f YES, --number 23.

Zu all diesen Regelmäßigkeiten gibt es Ausnahmen. Es ist also immer ratsam, Manpages zu konsultieren.

Was sieht man

Man hat immer zuerst einen Prompt, der im Fakultätsnetz standardmäßig so aussieht:

conde mhaecker 11 (~):
  1. Vorne steht immer der Name des Rechners, auf dem man gerade eingelogt ist. In der Uni kann das zum Beispiel conde (schnell), fiesta (lahm) oder einer von vielen anderen sein. (Welcher Rechner schnell ist, hängt natürlich davon ab, wie viele hundert Studierende dort gerade versuchen, die ziemlich ressourcenlastige grafische Benutzeroberfläche KDE zu benutzen.)
  2. Danach kommt der Benutzername desjenigen, dem die Shell gehört, das heißt, in wessen Namen die eingegebenen Kommandos ausgeführt werden (mhaecker ist der Benutzername von Martin Häcker).
  3. Die Zahl danach gibt an, wie viele Kommandos schon in dieser Shell eingegeben wurden. (Das ist meistens nicht nützlich.)
  4. Danach steht in Klammern das aktuelle Verzeichnis (~ ist eine Abkürzung für das eigene Heimatverzeichnis).

Das Aussehen und den Inhalt des Prompts kann man durch Setzen der Shellvariable PS1 anpassen. Zum Beispiel kann man durch die Eingabe von

PS1='\[\033[01;32m\]\u@\h \[\033[01;34m\]\w \$ \[\033[00m\]'

den Gentoo-Standardprompt bekommen (die Syntax der Promptbeschreibung muss nicht unbedingt verstanden werden), der die Form

estar@fiesta ~ $ 

hat (Benutzername, @, Rechnername, $), oder mit

PS1='\$'

einen extrem einfachen Prompt.

Am Prompt kann man Befehle eingeben. Nachdem ein vollständiger Befehl eingegeben wurde, lässt man mit der Eingabetaste die Shell den Befehl ausführen. Wenn die Shell damit fertig ist, erscheint wieder der Prompt.

.bashrc

Viele Sachen, zum Beispiel das Setzen eines eigenen Prompts, möchte man bei jedem Start der Shell automatisch erledigen. Bei der bash geht das, indem man die entsprechenden Befehle zur Datei .bashrc im Homeverzeichnis hinzufügt.

Bevor man .bashrc bearbeitet

  • Diese Datei lässt sich so kaputtmachen, dass man keine Shell mehr öffnen kann. Also sollten alle Befehle zuerst in der Shell getestet werden.
  • Damit SSH und insbesondere scp richtig funktionieren, dürfen die Befehle in .bashrc keine Ausgabe produzieren.
  • Es ist sinnvoll, zuerst die Dokumentation der bash zu lesen.

Wichtige Befehle

utsettings

Mit utsettings kann man u.a. die Auflösung eines, an eine SunRay angeschlossenen, Monitors ändern. Dies ist insbesondere dann sinnvoll, wenn zum Beispiel nach einem Stromausfall die Standardauflösung nicht wieder hergestellt wurde. Bei Eingabe des Befehls in ein Terminal ('/usr/local/bin/utsettings') öffnet sich ein kleines Programm in einem Fenster, dessen Bedienung selbsterklärend sein sollte.

Weitere Programme

Viele interessante Programme, z. B. Firefox und Eclipse, aber auch relative aktuelle GNU-Implementierungen der Standardwerkzeuge von Unix, werden von Studenten installiert und gewartet.

Alle diese Programme findet Ihr im Verzeichnis /home/pub. Es lohnt sich also, ab und an einen Blick dorthin zu werfen. Wer diese Programme öfter verwendet, sollte in .applrc den Eintrag

pub

hinzufügen. Fügt man ihn oberhalb von

standard

hinzu, so hat das die Wirkung, dass die Shell zuerst in /home/pub nach Programmen sucht, also z. B. zuerst die GNU-Werkzeuge findet (die Solaris-Gegenstücke sind teilweise deutlich anders), was vor allem Linux-Anwender freuen sollte.

Bevor man die Programme aus /home/pub benutzt oder dort etwas installiert, sollte man die Hinweise des IRB lesen (die allerdings nicht mehr 100%-ig zutreffen).

Ausblick, links

Es lohnt sich, zumindest rudimentär über die Shell Bescheid zu wissen, gerade weil man an der Uni nicht daran vorbeikommt. Weiter Informationen findet Ihr in der Anleitung des Fachbereichs und überall sonst im Internet.

Es lohnt sich auch zumindest eine Shell-Script-Sprache zu beherschen. Ich bin allerdings der Meinung das man sich für diesen Zweck ruhig eine richtige Programmiersprache so wie Python oder Ruby ins mentale Boot holen sollte.

Weblinks