Resposabili:Responsabili:
În urma parcurgerii acestui laborator studentul va fi capabil:
Un caracter se declară în C de forma: char a='a'
; Pentru inițializarea lui, se observă că am pus un caracter între apostroafe.
Un şir de caractere presupune practic un vector de caractere, terminat prin caracterul \0
.
Compilatorul folosește în mod implicit această reprezentare, astfel încât cea mai simplă declarație este char c[]=“cuvant”
; Observăm aici folosirea ghilimelelor în locul apostroafelor. Acecastă instrucțiune va aloca un spațiu de 7
octeți pe care va reprezenta șirul de caractere 'cuvant' (care are 6
caractere).
Dacă dorim să alocăm un spațiu de memorie mai mare (pentru a putea folosi variabila pentru a stoca șiruri de caractere mai lungi), putem folosi o declarație de tipul char c[10] = “cuvant”;
. Astfel am alocat spațiu suficient pentru un șir de 9
caractere.
char c[6] = “cuvant”
, în care spațiul alocat este egal cu numărul de caractere, nu va determina compilatorul să genereze un warning/o eroare, acest lucru poate avea rezultate neașteptate dacă în memorie - la finalul șirului - nu se află (întâmplător) valoarea 0 binar.
Cum s-a prezentat anterior, o variabilă vector conţine adresa de început a vectorului(adresa primei componente a vectorului), şi de aceea este echivalentă cu un pointer la tipul elementelor din vector. Deci declaraţiile de mai jos vor declara fiecare cate un şir de caractere:
char a[5]; char *b="unsir"; char *c;
Diferenţa majoră dintre între ele este însa că primele două declaraţii vor aloca 5 pozitii în memorie, pe când ultima nu va aloca nici o zona de memorie, necesitând sa fie ulterior alocată, folosind funcţiile de alocare dinamică (malloc(), calloc(), realloc()
), prezentate în laboratorul anterior.
Între prima și a 2-a declarație, diferența este mai subtilă și constră în faptul că declarația char *b=“unsir”
va determina compilatorul să plaseze șirul respectiv într-o zonă de memorie asupra căreia nu avem drepturi de scriere, deci orice încercare de a modifica acel șir - pe Linux - va genera, cel mai probabil, o eroare de tipul segmentation fault
.
Un mic exemplu de citire a unui şir, caracter cu caracter pana la întâlnirea caracterului -
:
#include <stdio.h> #include <string.h> #define N 30 int main () { char str[N], c; int n = 0; do { scanf("%c", &c); if (c == '-') { break; } str[n++] = c; } while(1); str[n] = '\0'; // setam terminatorul de șir printf("%s", str); return 0; }
Pentru citirea si afisarea unui şir de caractere se poate folosi flagul 's' la citirea cu scanf
sau afişarea cu printf
. De asemenea biblioteca stdio.h
defineşte funcţiile gets()
şi puts()
pentru lucrul cu şiruri de caractere.
gets(zona)
-– citeşte de la terminalul standard un şir de caractere terminat cu linie noua (enter).puts(zona)
– afişeaza la terminalul standard şirul de caractere din zona data ca parametru, până la caracterul terminator de şir (\0), în locul căruia va afișa caracterul sfârșit de linie.
gets()
va citi de la tastatura câte caractere sunt introduse, chiar daca şirul declarat are o lungime mai mică. Presupunem un şir declarat: char a[]=”unsir”
, care va avea deci 5 caractere. Citind un şir de lungime mai mare ca 5 de la tastatura, în şirul a, la afişare vom vedea ca s-a reţinut tot sirul (nu doar primele 5 caractere)! . Nimic deosebit până acum. Dar dacă luăm în considerare că citirea caracterelor auxiliare se face în continuare în zona de memorie, ne punem problema ce se va suprascrie?!
Raspunsul este: nu se ştie… poate nimic important pentru programul nostru, poate ceva ce il va bloca sau duce la obţinerea de date eronate.
Pentru a evita aceasta se recomandă utilizarea fgets()
.
fgets(zona, lung_zona, stdin)
-– citeşte de la stdin
un şir de caractere terminat printr-o linie nouă dacă lungimea lui este mai mică decat lung_zona
sau primele lung_zona - 1
caractere în caz contrar. Parametrii sunt: zona de memorie, lungimea maxima admisă a şirului, şi terminalul standard de intrare. În cazul în care şirul dorit are lungime mai mică decât cea maximă, înaintea terminatorului de şir (\0), în zona de memorie va fi reţinut şi enter-ul dat(\n).Pentru manipularea şirurilor de caractere în limbajul C se folosesc funcţii declarate în fişierul <string.h>. Vom încerca să le detaliem putin pe cele mai des folosite:
size_t strlen(const char *str);
Returneaza lungimea unui şir dat ca parametru. (numarul de caractere până la întalnirea terminatorului de şir: \0)
Exemplu:
#include <stdio.h> #include <string.h> #define N 256 int main () { char text[N]; printf("Introduceti un text: "); gets(text); printf("Textul are %u caractere.\n", strlen(text)); return 0; }
Iesire:
Introduceti un text: just testing Textul are 12 caractere.
void* memset(void *ptr, int val, size_t num);
În zona de memorie dată de pointerul ptr, sunt setate primii num octeți la valoarea dată de val. Pentru șiruri de caractere - în care fiecare element ocupă 1 octet - aceasta are ca rezultat înlocuirea primelor 'num' valori cu cea dată ca argument.
Funcţia returnează şirul ptr.
Exemplu:
#include <stdio.h> #include <string.h> int main () { char str[] = "nu prea vreau vacanta!"; memset(str, '-', 7); puts(str); return 0; }
Iesire:
------- vreau vacanta!
memset
este folosit pentru inițializarea de vectori de diverse tipuri.
Atunci când scrieți sau evaluați cod care face acest lucru trebuie să aveți în vedere că memset face scrierea valorii primite pe fiecare octet (fără a ține cont de dimensiunea reperezentării tipului de date). Următorul cod arată cum putem folosi memset pentru a inițializa un vector de int la 0 folosind memset, respectiv care ar fi rezultatul dacă am încerca să inițializăm vectorul cu o altă valoare:
#include <stdio.h> #include <string.h> #define SIZE 2 int main(void) { int a[SIZE], b[SIZE], i; memset(a, 0, SIZE * sizeof(int)); memset(b, 5, SIZE * sizeof(int)); for(i = 0; i < SIZE; i++) printf("%d ", a[i]); printf("\n"); for(i = 0; i < SIZE; i++) printf("%d ", b[i]); return 0; }
Rezultatul este…
0 0 84215045 84215045
rezultatul neașteptat de pe a 2-a linie provenind din faptul că fiecare octet al int-urilor a fost setat la 5, și nu valoarea întregii structuri.
Este de menționat faptul că utilizarea memset
în astfel de situații nu este recomandată.
void* memmove(void *destination, const void *source, size_t num);
Copiază un număr de num caractere de la sursă, la zona de memorie indicată de destinaţie. Copierea are loc ca şi cum ar exista un buffer intermediar, deci sursa si destinatia se pot suprapune. Funcţia nu verifică terminatorul de şir la sursă, copiază mereu num bytes, deci pentru a evita depăsirea trebuie ca dimensiunea sursei sa fie mai mare ca num. Funcţia returnează destinaţia.
Exemplu:
#include <stdio.h> #include <string.h> int main () { char str[] = "memmove can be very useful......"; memmove(str + 20, str + 15, 11); puts(str); return 0; }
Iesire:
memmove can be very very useful.
void* memcpy(void *destination, const void *source, size_t num);
Copiază un număr de num caractere din şirul sursă in şirul destinaţie. Funcţia returnează şirul destinaţie.
Exemplu:
#include <stdio.h> #include <string.h> #define N 40 int main () { char str1[] = "Exemplu"; char str2[N]; char str3[N]; memcpy(str2, str1, strlen(str1) + 1); // + 1 este necesar pentru a copia și terminatorul de șir memcpy(str3, "un sir", 7); printf("str1: %s\nstr2: %s\nstr3: %s\n", str1, str2, str3); return 0; }
Iesire:
str1: Exemplu str2: Exemplu str3: un sir
char* strcpy(char *destination, const char *source);
Copiază şirul sursă in şirul destinaţie. Şirul destinaţie va fi suprascris. Funcţia asigură plasarea terminatorului de şir în şirul destinaţie după copiere. Funcţia returneaza şirul destinaţie.
char* strncpy(char *destination, const char *source, size_t num);
Asemeni cu strcpy()
, dar in loc de a fi copiată toata sursa sunt copiate doar primele num caractere.
Exemplu:
#include <stdio.h> #include <string.h> #define N 40 int main () { char str1[] = "Exemplu"; char str2[N]; char str3[N]; strcpy(str2, str1); strncpy(str3, "un sir", 2); str3[2] = '\0'; printf("str1: %s\nstr2: %s\nstr3: %s\n", str1, str2, str3); return 0; }
Iesire:
str1: Exemplu str2: Exemplu str3: un
char* strcat(char *destination, const char *source);
Concatenenaza şirul sursă la şirul destinaţie. Funcţia returnează şirul destinaţie.
char* strncat(char *destination, const char *source, size_t num);
Asemeni cu strcat()
, dar în loc de a fi concatenată toată sursa sunt concatenate cel mult primele num caractere din șirul sursa (aceasta putând fii și mai scurt).
Exemplu:
#include <stdio.h> #include <string.h> #define N 80 int main () { char str[N]; strcpy(str, "ana "); strcat(str, "are "); strcat(str, "mere "); puts(str); strncat(str, "si pere si prune", 7); puts(str); return 0; }
Iesire:
ana are mere ana are mere si pere
int strcmp(const char *str1, const char *str2);
Compară şirul str1 cu şirul str2, verificându-le caracter cu caracter. Valoarea returnată este 0 daca cele şiruri sunt identice, mai mare ca 0 daca str1 este “mai mare”(alfabetic) şi mai mic ca 0 altfel.
Exemplu:
#include <stdio.h> #include <string.h> #define N 80 int main () { char cuv[] = "rosu"; char cuv_citit[N]; do { printf ("Ghiceste culoarea..."); gets(cuv_citit); } while (strcmp(cuv,cuv_citit) != 0); puts("OK"); return 0; }
În situația în care șirurile au lungimi diferite, ultima comparație se face între \0 și caracterul de pe aceași poziție din șirul mai lung,
char* strchr(const char *str, int character);
Caută caracterul character în şirul str şi returnează un pointer la prima sa apariţie sau NULL
dacă acesta nu a fost găsit..
char* strrchr(const char *str, int character);
Caută caracterul character în şirul str şi returnează un pointer la ultima sa apariţie sau NULL
dacă acesta nu există în șir.
char* strstr(const char *str1, const char *str2);
Caută şirul str2 în şirul str1 şi returnează un pointer la prima sa apariţie, sau NULL
dacă nu a fost găsit.
char* strdup(const char *str);
Realizează un duplicat al şirului str, pe care îl şi returnează. Spațiul de memorie necesar copiei este alocată dinamic, fiind responsabilitatea noastră să o dealocăm (așa cum am s-a prezentat laboratorul anterior).
Exemplu:
#include <stdio.h> #include <string.h> #define N 80 int main () { char str[N] = "salut", *d; d = strdup(str); if(d == NULL) { printf("Eroare!\n"); return -1; } puts(d); free(d); return 0; }
strdup(..)
va aloca întotdeuna strlen() + 1
octeți pentru destinație, indiferent de dimensiunea memoriei alocate pentru sursă.
char* strtok(char *str, const char *delimitators);
Funcţia are rolul de a împarţi şirul str în tokens(subşiruri separate de orice caracter aflat în lista de delimitatori), prin apelarea ei succesivă.
La primul apel, parametrul str trebuie sa fie un şir de caractere, ce urmează a fi împartit. Apelurile urmatoare, vor avea în loc de str, NULL
conţinuând împarţirea aceluiaşi şir.
Funcţia va returna la fiecare apel un token(un subsir), ignorând caracterele cu rol de separator aflate în şirul de delimitatori. O dată terminat şirul, funcţia va returna NULL
.
<string.h>
nu permite folosirea strtok()
în paralel pe mai mult de un şir.
Exemplu:
#include <stdio.h> #include <string.h> int main () { char str[] = "- Uite, asta e un sir."; char *p; p = strtok(str, " ,.-"); /* separa sirul in "tokeni" si afiseaza-i pe linii separate. */ while (p != NULL) { printf("%s\n", p); p = strtok(NULL, " ,.-"); } return 0; }
Iesire:
Uite asta e un sir
Primul exercitiu presupune modificarea/adaugarea de instructiuni unui cod existent pentru a realiza anumite lucruri. In momentul actual programul numara cate cuvinte doar cu litere mici se gasesc intr-un sir de caractere.
#include <stdio.h> #include <string.h> #include <ctype.h> #include <stdlib.h> #define SEPARATORS " ,." int count_lowercases_words(char *str) { char *tmp_str = strdup(str); unsigned int count = 0; if (tmp_str == NULL) { printf("Eroare la alocare\n"); return -1; } char *word = strtok(tmp_str, SEPARATORS); while (word) { unsigned int i; for (i = 0; i < strlen(word); i++) { if (isupper(word[i])) { break; } } if (i == strlen(word)) { count++; } word = strtok(NULL, SEPARATORS); } free(tmp_str); return count; } int main(void) { char sentence[] = "Ana are mere, pere si gutui. Gigel nu are nimic."; printf("%d\n", count_lowercases_words(sentence)); return 0; }
Cerinte:
Următoarele două probleme vă vor fi date de asistent în cadrul laboratorului.
void ordCresc(char *vectorschar[], int n);
care să ordoneze cuvintele crescător<string.h>
înlocuiţi într-un text dat o secventă de caractere cu altă secvenţă de caractere, date la intrare.