This is an old revision of the document!


TP 3 - Fonctions d'entrée et sortie

Documents d'aide

Agréable à lire

  • TLPI - Chapter 4, File I/O: The Universal I/O model

Fichiers. Systèmes de fichiers

Le fichier est l’une des abstractions fondamentales dans le domaine des systèmes d’exploitation; L'autre abstraction est le processus. Si le processus résume l'exécution d'une tâche spécifique sur le processeur, le fichier résume les informations persistantes d'un système d'exploitation. Un fichier est utilisé pour stocker les informations nécessaires au fonctionnement du système d'exploitation et aux interactions de l'utilisateur.

Un système de fichiers est un moyen d'organiser les fichiers et de les présenter à l'utilisateur. Du point de vue de l'utilisateur, un système de fichiers a une structure hiérarchique de fichiers et de répertoires, commençant par un répertoire racine. L'emplacement d'une entrée (fichier ou répertoire) est défini par un chemin qui répertorie toutes les entrées jusque-là. Ainsi, pour le chemin /usr/local/file.txt , le répertoire racine / contient un sous-répertoire usr qui comprend le sous-répertoire local contenant un fichier file.txt.

Chaque fichier est donc associé à un nom identifiant, à un ensemble de droits d'accès et à des zones contenant des informations utiles.

Les systèmes de fichiers pris en charge par les systèmes d'exploitation Unix et Windows sont hiérarchiques. Les systèmes Linux / Unix sont sensibles à la casse (“Données” est différent de “données”) et les systèmes Windows ne font pas la distinction entre les casse.

La hiérarchie du système de fichiers Unix comporte un seul répertoire appelé “racine” et ”” / ”” dans lequel n’importe quel fichier est localisé (à ne pas confondre avec le répertoire ”/ racine”, qui est: patrie de privilegiat, root). La liste des chemins de fichiers Unix est une chaîne de noms de répertoires séparés par '/' , suivis du nom du fichier. Il existe également des chemins relatifs au répertoire en cours '.' Ou au répertoire parent '..'.

Sous Unix, il n'y a pas de différence entre les fichiers du disque local, du CD ou du lecteur réseau. Tous ces fichiers feront partie de la hiérarchie unique du répertoire racine. Cela se fait par 'mount': les systèmes de fichiers seront montés dans l'un des répertoires du système de fichiers racine.

Il existe plusieurs hiérarchies dans Windows, une pour chaque partition et une pour chaque emplacement réseau. Contrairement à Unix, le délimiteur entre les noms de répertoire dans un chemin et pour les chemins absolus, la hiérarchie doit être spécifiée sous la forme C: \ , E: \ ou \\FILESERVER\myFile (pour le réseau). Comme Unix, Windows utilise . Pour le répertoire actuel et '..' pour le répertoire parent.

Opérations sur les fichiers

Sous Unix, un descripteur de fichier est un ensemble qui indexe une table avec des pointeurs sur des structures décrivant les fichiers ouverts par un processus. Si un programme est exécuté dans un shell Unix, le processus parent (shell) ouvre pour le processus enfant (le programme) 3 fichiers standard avec des descripteurs de fichier de valeur spéciaux:

Descripteurs de fichiers standard * standard input (0) - lecture à partir d'une entrée standard (clavier)

  • standard output (1) - affichage sur la sortie standard (console)
  • standard error (2) - affichage sur la sortie d'erreur standard (console)

Un fichier associe le pointeur de fichier qui indique la position actuelle dans le fichier. Le curseur de fichier est un entier représentant le déplacement (décalage) du début du fichier.

Opérations spécifiques pour travailler avec des fichiers:

  • ouverture / création d'un fichier - signifie associer un descripteur de fichier identifié par son nom (fopen (ANSI C), open, creat (POSIX), CreateFile (Win32 API))). ( Linux)
  • fermer un fichier - signifie libérer les structures de fichier associées au processus et au descripteur de ce fichier - uniquement s’il n’ya pas d’entrée dans la table des descripteurs fichier qui pointe vers cette structure (fclose (ANSI C), close (POSIX), CloseHandle (Win32 API)). ( Linux)
  • lecture dans un fichier - signifie copier un bloc de données dans une mémoire tampon; après la lecture est mis à jour le curseur de fichier (fread (ANSI C), read (POSIX), ReadFile (Win32 API)). ( Linux)
  • écriture dans un fichier - signifie copier un bloc de données d'un tampon dans un fichier; Ecrire signifie aussi mettre à jour le curseur de fichier (fwrite (ISO C), write (POSIX), WriteFile (Win32 API)). ( Linux)
  • positionnement dans un fichier - signifie changer la valeur du curseur de fichier; les lectures ou écritures suivantes commenceront à l'emplacement indiqué par ce curseur de fichier (fseek (ANSI C), lseek (POSIX), SetFilePointer (Win32 API)). ( Linux)
  • changer les attributs d'un fichier - signifie définir les paramètres du fichier ( fcntl (POSIX), SetFileAttributes (Win32 API)). ( Linux)

Opérations sur les fichiers sous Linux

Pour pouvoir utiliser des fonctions pour la gestion des fichiers en Python, on va importer la bibliotheque os.

import os

Création, ouverture, fermeture et suppression des fichiers

ouverture

Pour ouvrir / créer un fichier, utilisez la fonction open.

os.open(path, flags);               # ouverture 
os.open(path, flags, mode);  # creation 

Les valeurs possibles pour flags sont:

  • os.O_RDONLY ouverture seulement pour la lecture
  • os.O_WRONLY ouverture uniquement pour l'écriture
  • os.O_RDWR ouverture pour la lecture et l'écriture
  • os.O_NONBLOCK ne bloque pas l'ouverture ni la disponibilité des données
  • os.O_APPEND ajouter à chaque écriture
  • os.O_CREAT crée un fichier s'il n'existe pas
  • Taille tronquée O_TRUNC à 0
  • Erreur os.O_EXCL et * os.O_CREAT si le fichier existe
  • os.O_SHLOCK obtenir atomiquement un verrou partagé
  • os.O_EXLOCK obtient atomiquement un verrou exclusif
  • os.O_NOFOLLOW ne suit pas les liens symboliques
  • os.O_SYMLINK autorise l'ouverture de liens symboliques
  • Le descripteur os.O_EVTONLY est demandé pour les notifications d'événement uniquement
  • os.O_CLOEXEC marque comme proche-sur-exec

Les valeurs des indicateurs sont représentées par des bits, car elles peuvent être combinées par l'opérateur | (ou sur des bits).

# open a file in write only and delete all its contents (truncate to 0)
os. open(pathname, O_WRONLY | O_TRUNC, mode);

La valeur de mode est représentée par les droits du nouveau fichier créé (en bits). Généralement, un nombre de base de 8 est utilisé. Il a trois chiffres, chacun avec trois bits.

r w x r - x r - -
1 1 1 1 0 1 1 0 0
7 5 4
  • r - read
  • w - write
  • x - execute

Chaque chiffre se réfère à:

  • premier chiffre - permissions de l'utilisateur qui détient le fichier
  • deuxième chiffre - permissions du groupe contenant le fichier
  • troisième chiffre - les autorisations des utilisateurs qui ne possèdent pas le fichier et ne font pas partie du groupe qui détient le fichier

fermeture

La fermeture des fichiers se fait avec close:

os.close(int fd)

La suppression effective d'un fichier du disque se fait avec unlink:

os.unlink(pathname);

Toutes les fonctions de la bibliothèque os lèvent une exception si l'opération de peuts pas etre effectuée avec succès. Pour traiter ces exceptions, on va utiliser la construction try - except.

Exemple

Si, par exemple, nous voulons ouvrir le fichier in.txt pour la lecture et l'écriture, éventuellement le créer, et le fichier out.txt pour l'écriture, avec des troncatures, nous pouvons utiliser la séquence de code suivante:

import os
 
try:
	fd1 = os.open("in.txt", O_RDWR | O_CREAT, 0644)
 
	# will fail if out.txt does not exist 
	fd2 = os,open("out.txt", O_WRONLY | O_TRUNC)
 
	os.close(fd1)
 
        os.close(fd2)
 
except Exception as e:
        print ("Error: {}".format (e))

Attention Une erreur courante est l'omission des droits de création de fichier (0644 dans l'exemple ci-dessus) lorsque l'indicateur O_CREAT ouvert est appelé.

Lecture et écriture

lecture

La fonction read est utilisée pour lire maximum count octets du fichier:

os.read(fd, count)

La fonction read renvoie le nombre d'octets réellement lus, tout au plus “count”. Quand elle atteint la fin du fichier, elle renvoieun bytestring vide.

écriture

La fonction write est utilisée pour écrire dans un ficher les données stockées en str:

os.write(fd, count)

La valeur de retour est le nombre d'octets réellement écrits. Par défaut, il n'est pas garanti que le retour de write soit terminé. Pour forcer la mise à jour, vous pouvez utiliser fsync ou le fichier peut être ouvert à l'aide de l'indicateur O_FSYNC . Dans ce cas, il est garanti qu'après chaque écriture le fichier a été mis à jour.

Note : Pour read, write, il y a les versions pread, pwrite, qui vous permettent de spécifier un décalage de fichier à partir duquel effectuer l'opération de lecture / écriture.

Positionnement dans un fichier (lseek)

lseek

La fonction lseek permet le déplacement du curseur du fichier vers une position absolue ou relative.

 os.lseek(fd, offset, whence)

Le paramètre “wheece” représente la position relative à partir de laquelle le déplacement est effectué:

  • os.SEEK_SET - contre la position de départ
  • os.SEEK_CUR - à la position actuelle
  • os.SEEK_END - vers la position finale

Remarque lseek permet également le positionnement à la fin du fichier. L'écriture dans de telles zones n'est pas perdue, ce qui est obtenu en étant un fichier void , une zone ignorée - n'est pas allouée au disque.

Troncature des fichiers

Outre la troncature à 0, ce qui peut être fait en appelant open avec l'indicateur O_TRUNC , vous pouvez spécifier de tronquer un fichier à une taille spécifiée par des appels système ftruncate et truncate:

os.ftruncate(fd, length)      
os.truncate(path, length)

Dans le cas de ftrunched, le paramètre fd est le fichier descripteur obtenu avec un appel ouvert fournissant l'autorisation d'écriture. Dans le cas de truncate, le fichier représenté par chemin doit avoir le droit d'écriture.

Exemple d'utilisation des opérations d'E / S

import os
 
 
# Print the last 100 bytes from a file 
 
try:
	# open file 
	fd = os.open("file.txt", O_RDONLY)
 
	# set file pointer at 100 characters
	 _before_ the end of the file 
	rc = os.lseek(fd, -100, SEEK_END)
 
	# read the last 100 characthers 
	bytes_read = os.read(fd, buf, 100)
 
	# set '\0' at end of buffer for printing purposes
	buf[bytes_read] = '\0'
 
	print ("the last %ld bytes: \n%s\n", bytes_read, buf)
 
	# close file 
	os.close(fd)
 
except Exception as e:
        print ("Error: {}".format (e))

Redirections

Sous Linux, les redirections sont effectuées à l'aide des fonctions de duplication des descripteurs de fichier dup et dup2 (notez la différence entre 2 dans les liens précédents):

os.dup(oldfd);
os.dup2(oldfd, newfd, inhertable=True)

Par exemple, pour rediriger la sortie vers le fichier output.txt , deux lignes de code sont requises:

try:
     fd = os.open("output.txt", O_RDWR|O_CREAT|O_TRUNC, 0600)
     os.dup2(fd, STDOUT_FILENO)
except Exception as e:
     print ("Error: {}".format (e))

Exercices

Pour résoudre le laboratoire, utilisez des clones repository.

Exercice 1 - redirection (1p)

Allez dans le répertoire 1-redirect et regardez le contenu du fichier redirect.py .

Compilez le fichier (utilisez 'make'). Exécutez le programme à l'aide de la commande './redirect'.

Ouvrez un autre terminal et lancez la commande:

 watch -d lsof -p $(pidof redirect) 

lsof est un utilitaire qui affiche des informations sur les fichiers ouverts (fichiers ouverts dans le système, fichiers ouverts par un utilisateur particulier, etc.). Regardez dans le manuel ( man 8 lsof ) pour identifier la signification de la colonne FD et de la colonne TYPE.

Utilisez la commande Entrée pour continuer le programme. En parallèle, observez l’évolution de la table des descripteurs.

Dans le code, notez les paramètres de redirection avec dup2 (après 2 (fd2, STDERR_FILENO)). Remarquez ce qui se passe si les paramètres sont dans l'ordre inverse.

Exercice 2 - read-write (3p)

Allez dans le répertoire 2-read-write et regardez le contenu du fichier read-write.c.

2a. Écrivez votre nom (1p)

Mettez votre nom dans la variable name. Écrivez la variable à l'écran en utilisant uniquement la fonction write. Suivez les lignes avec TODO 1.

2b. Lisez votre nom (1p)

Lisez votre nom depuis le clavier dans la variable name en utilisant uniquement la fonction read.

La fonction read lit les tampons, elle n’ajoutera pas le caractère \0 à la fin de la chaîne. Assurez-vous que le texte de la chaîne comporte le caractère \0 à la fin.

Ecrivez le nouveau nom lu sur l'écran en utilisant uniquement les fonctions write.

Suivez les lignes avec TODO 2.

2c. Redirection de la sortie standard (1p)

Ecrivez votre nom dans le fichier output.txt en utilisant la fonction printf.

Vous devrez rediriger la sortie standard.

Lors de la création d'un nouveau fichier, vous devez définir le mode du fichier (le troisième paramètre de la fonction open ). Le mode le plus commun est 0644.

Suivez les lignes avec TODO 3.

Exercice 3 - lseek (1p)

Allez dans le répertoire 3-lseek et regardez le code source dans lseek.c . Quelle valeur le second appel de “lseek” retournera-t-il? Décommentez la ligne d'affichage, compilez et exécutez pour vérification.

Source ne ferme que le fichier descripteur fd1 . Avez-vous besoin de fermer et de classer le descripteur fd2 ? Pourquoi

Exercice 4 - mcat (4p)

Allez dans le répertoire 4-mcat .

4a. Similarité de chat (1p)

Remplissez le fichier pour que le programme mcat résultant ait une fonctionnalité similaire à celle de 'cat' (suivez les commentaires avec TODO 1 )

Le programme 'mcat' recevra comme argument de ligne de commande le nom d'un fichier dont il affichera le contenu à la sortie standard. Vous ne pouvez pas lire le fichier entier en mémoire. Vous ne pouvez lire que des morceaux de taille maximale BUFSIZE.

Vérifiez le code d'erreur renvoyé par les appels système. Vous pouvez utiliser le DIE. Passez en revue les sections Création, ouverture et fermeture de fichiers et Écriture et lecture de fichiers.

Testez avec une commande comme:

./mcat Makefile 

4b. Similarité cp (1p)

Étendez la fonctionnalité de sorte que la sortie soit redirigée vers un fichier reçu en tant que deuxième argument - une fonctionnalité similaire à l'utilitaire cp . (suivez les commentaires avec TODO 2 )

Consultez la section redirections.

Tester la fonctionnalité:

./mcat Makefile out ; ./mcat out 

4c. / dev / méchant (2p)

Initialisez le fichier /dev/nasty:

 ./set_nasty.sh 

Essayez de copier les fonctionnalités sur /dev/nasty :

./mcat /dev/nasty
./mcat /dev/nasty out ; ./mcat out 

Si des différences se produisent, veillez à ce que les fonctions de lecture et d'écriture (affichent éventuellement ces valeurs) et résolvez le problème.

La sortie standard étant redirigée vers un fichier, vous ne pouvez pas utiliser printf. Pour écrire à l'écran, vous pouvez utiliser fprintf (stderr, …) pour écrire à l'erreur standard.

Testez l'écriture avec:

./mcat Makefile /dev/nasty ; cat /dev/nasty

Si la dernière commande ne produit pas le résultat attendu, vous n'avez probablement pas correctement géré les cas où read/write renvoie une valeur inférieure au troisième paramètre.

Exercice 5 - Dépannage (1p)

Allez dans le répertoire 5-trouble . Compilez et exécutez le programme trouble .

Le programme devrait s'afficher dans tmp1.txt le message msg . Affichez le fichier tmp1.txt .

Que remarquez-vous? Identifiez et corrigez le problème. Passez en revue la section: Création, ouverture et fermeture de fichiers.

Astuce: utilisez ls -l

BONUS

Exercice 6 - Verrouillage de fichier

Nous voulons nous assurer que seule une instance d'un programme s'exécute à la fois. Pour cela, un fichier temporaire est en cours de création et tente d'obtenir un verrou à l'aide de la commande Flock.

Entrez le répertoire “6-singular” et remplissez la source “singular.c” (suivez les commentaires avec TODO).

Hint: man 2 flock, nonblocking

Testez en exécutant l'exécutable à partir de deux terminaux différents ou à l'aide de la commande:

./singular & sleep 3 ; ./singular

Trouvez une méthode permettant de vous assurer que notre programme n'a qu'une seule instance, en utilisant moins d'appels système .

EXTRA

  • Opérations sur les fichiers en Python
  • Étudiez les exemples dans archive, lisez la documentation et notez les différences entre les API.

Solutions

Ressources utiles

  1. Low level I/O (info libc “Low-Level I/O”)
  2. Duplicating descriptors (info libc “Duplicating Descriptors”)
  3. Low level I/O (Advanced Linux Programming)
sde/laboratoare/03.1583253387.txt.gz · Last modified: 2020/03/03 18:36 by diana.ghindaoanu
CC Attribution-Share Alike 3.0 Unported
www.chimeric.de Valid CSS Driven by DokuWiki do yourself a favour and use a real browser - get firefox!! Recent changes RSS feed Valid XHTML 1.0