Bài 2.3: Bảng mã ASCII và ứng dụng trong C++

Chào mừng trở lại với series học lập trình C++! Hôm nay, chúng ta sẽ khám phá một trong những nền tảng cơ bản nhưng cực kỳ quan trọng trong thế giới máy tính và lập trình: Bảng mã ASCII. Dù có vẻ đơn giản, việc hiểu về ASCII sẽ giúp bạn nắm vững cách máy tính xử lý và lưu trữ ký tự, từ đó mở ra nhiều khả năng thú vị trong C++.

ASCII là gì?

ASCII là viết tắt của American Standard Code for Information Interchange (Mã tiêu chuẩn Mỹ để trao đổi thông tin). Về cơ bản, nó là một tiêu chuẩn mã hóa ký tự, gán một giá trị số duy nhất cho mỗi ký tự. Tưởng tượng như một cuốn từ điển nhỏ nơi mỗi ký tự (như 'A', 'b', '7', '#') đều có một "mã số" riêng.

Bảng mã ASCII gốc chỉ sử dụng 7 bit để biểu diễn ký tự, cho phép nó định nghĩa được 128 ký tự khác nhau (từ 0 đến 127). Các ký tự này bao gồm:

Các chữ cái tiếng Anh viết hoa (A-Z) và viết thường (a-z).
Các chữ số (0-9).
Các ký hiệu phổ biến (như !, @, #, $, %, ^, &, *, (, ), +, -, _, =, ..., space).
Một số ký tự điều khiển (không in ra màn hình, dùng cho mục đích điều khiển thiết bị hoặc định dạng văn bản thô).

Điều quan trọng về ASCII là nó tạo ra một mối liên hệ trực tiếp giữa ký tự mà chúng ta thấy và giá trị số mà máy tính hiểu và xử lý.

Bảng mã ASCII hoạt động như thế nào trong C++?

Trong C++, kiểu dữ liệu char (character) được thiết kế để lưu trữ một ký tự đơn lẻ. Tuy nhiên, điều thú vị là về bản chất, char trong C++ là một kiểu dữ liệu số nguyên nhỏ. Khi bạn gán một ký tự vào biến kiểu char, máy tính sẽ lưu trữ giá trị ASCII tương ứng của ký tự đó.

Ví dụ:

Ký tự 'A' có giá trị ASCII là 65.
Ký tự 'a' có giá trị ASCII là 97.
Ký tự '0' có giá trị ASCII là 48.
Ký tự space (khoảng trắng) có giá trị ASCII là 32.

Mối liên hệ giữa ký tự và giá trị số này là chìa khóa để hiểu cách C++ làm việc với ký tự và cũng là nền tảng cho nhiều kỹ thuật xử lý chuỗi cơ bản.

Ứng dụng của Bảng mã ASCII trong C++ (với ví dụ)

Việc biết rằng char là một kiểu số nguyên dựa trên ASCII (hoặc một bảng mã tương thích) cho phép chúng ta thực hiện nhiều thao tác thú vị và hữu ích. Dưới đây là một số ví dụ minh họa:

1. Lấy giá trị ASCII của một ký tự

Bạn có thể dễ dàng lấy giá trị ASCII của một ký tự bằng cách ép kiểu (cast) nó sang một kiểu số nguyên như int.

#include <iostream>

using namespace std;

int main() {
    char k = 'B';
    int ma = static_cast<int>(k);

    cout << "Ky tu '" << k << "' co gia tri ASCII la: " << ma << endl;

    char s = '5';
    int ma_s = s;

    cout << "Ky tu so '" << s << "' co gia tri ASCII la: " << ma_s << endl;

    return 0;
}

Ky tu 'B' co gia tri ASCII la: 66
Ky tu so '5' co gia tri ASCII la: 53

Giải thích: Trong C++, khi bạn gán một biến char cho một biến int (hoặc sử dụng nó trong một phép tính số học), giá trị số nguyên tương ứng với ký tự đó (chính là giá trị ASCII trong trường hợp này) sẽ được sử dụng. Lệnh static_cast<int>(ky_tu) là cách rõ ràng và an toàn để thực hiện việc ép kiểu này.

2. Chuyển đổi giá trị ASCII thành ký tự

Ngược lại, bạn có thể lấy một giá trị số nguyên (trong phạm vi ASCII) và ép kiểu nó thành char để lấy ký tự tương ứng.

#include <iostream>

using namespace std;

int main() {
    int ma = 77;
    char k = static_cast<char>(ma);

    cout << "Gia tri ASCII " << ma << " tuong ung voi ky tu: '" << k << "'" << endl;

    int ma_dk = 13;
    char k_dk = static_cast<char>(ma_dk);

    cout << "Gia tri ASCII " << ma_dk << " tuong ung voi ky tu dieu khien." << endl;

    return 0;
}

Gia tri ASCII 77 tuong ung voi ky tu: 'M'
Gia tri ASCII 13 tuong ung voi ky tu dieu khien.

Giải thích: Phép ép kiểu static_cast<char>(ma_ascii) hướng dẫn trình biên dịch coi giá trị số nguyên ma_ascii như một ký tự và hiển thị nó theo bảng mã đang được sử dụng (thường là ASCII cho các giá trị này).

3. Thực hiện phép toán số học với ký tự

Vì char được coi là kiểu số nguyên, bạn có thể thực hiện các phép toán số học trực tiếp trên các biến kiểu char. Phép toán này sẽ được thực hiện trên giá trị ASCII của ký tự.

#include <iostream>

using namespace std;

int main() {
    char c1 = 'C';
    char c2 = c1 + 1;

    cout << "Ky tu sau '" << c1 << "' la: '" << c2 << "'" << endl;

    char s1 = '1';
    char s2 = '2';

    int kc = s2 - s1;
    cout << "Khoang cach ASCII giua '" << s1 << "' va '" << s2 << "' la: " << kc << endl;

    int gts = (s1 - '0') + (s2 - '0');
    cout << "Tong gia tri so cua '" << s1 << "' va '" << s2 << "' la: " << gts << endl;

    return 0;
}

Ky tu sau 'C' la: 'D'
Khoang cach ASCII giua '1' va '2' la: 1
Tong gia tri so cua '1' va '2' la: 3

Giải thích: Khi bạn cộng hoặc trừ số nguyên với một char, phép toán thực chất được thực hiện trên giá trị ASCII của char. Kết quả có thể được lưu trữ lại trong một char (nếu nằm trong phạm vi) hoặc một int tùy thuộc vào kiểu dữ liệu của kết quả. Kỹ thuật trừ đi '0' (có giá trị ASCII 48) là một cách phổ biến để chuyển ký tự số ('0'-'9') thành giá trị số nguyên tương ứng (0-9), bởi vì các ký tự số được đặt liên tiếp trong bảng ASCII.

4. So sánh ký tự

So sánh các ký tự (>, <, >=, <=, ==, !=) thực chất là so sánh các giá trị ASCII tương ứng của chúng. Điều này rất hữu ích vì các chữ cái (hoa và thường) và các chữ số được sắp xếp liên tục trong bảng ASCII.

#include <iostream>

using namespace std;

int main() {
    char a = 'a';
    char b = 'b';

    if (a < b) {
        cout << "'" << a << "' nho hon '" << b << "' (theo ASCII)" << endl;
    }

    char sl = '9';
    char sb = '0';

    if (sl > sb) {
         cout << "'" << sl << "' lon hon '" << sb << "' (theo ASCII)" << endl;
    }

    char ch = 'A';
    char ct = 'a';

    if (ch != ct) {
        cout << "'" << ch << "' khac voi '" << ct << "' (theo ASCII)" << endl;
    }

    char t = 'G';
    if (t >= 'A' && t <= 'Z') {
        cout << "'" << t << "' la chu cai viet hoa." << endl;
    }

    return 0;
}

'a' nho hon 'b' (theo ASCII)
'9' lon hon '0' (theo ASCII)
'A' khac voi 'a' (theo ASCII)
'G' la chu cai viet hoa.

Giải thích: Các toán tử so sánh hoạt động dựa trên giá trị số nguyên bên dưới của các ký tự. Nhờ cấu trúc liên tục của bảng ASCII, bạn có thể dễ dàng kiểm tra xem một ký tự có phải là chữ cái, chữ số hay nằm trong một phạm vi nhất định nào đó chỉ bằng cách so sánh giá trị của nó với các ký tự biên như 'A', 'Z', 'a', 'z', '0', '9'.

5. Lặp qua các ký tự trong một phạm vi

Bạn có thể sử dụng vòng lặp và tận dụng mối liên hệ giữa char và int để in ra các ký tự trong một phạm vi ASCII nhất định.

#include <iostream>

using namespace std;

int main() {
    cout << "Cac chu cai thuong:" << endl;
    for (char c = 'a'; c <= 'z'; ++c) {
        cout << c << " ";
    }
    cout << endl;

    cout << "10 ky tu dau tien cua bang ASCII (tu 0 den 9):" << endl;
    for (int i = 0; i < 10; ++i) {
        cout << i << " ";
    }
    cout << endl;

    cout << "Cac chu so ky tu:" << endl;
    for (char d = '0'; d <= '9'; ++d) {
        cout << d << " ";
    }
    cout << endl;

    return 0;
}

Cac chu cai thuong:
a b c d e f g h i j k l m n o p q r s t u v w x y z 
10 ky tu dau tien cua bang ASCII (tu 0 den 9):
0 1 2 3 4 5 6 7 8 9 
Cac chu so ky tu:
0 1 2 3 4 5 6 7 8 9

Giải thích: Vòng lặp for (char c = 'a'; c <= 'z'; ++c) hoạt động vì c ban đầu được gán giá trị ASCII của 'a'. Mỗi lần lặp, ++c tăng giá trị ASCII lên 1. Điều kiện c <= 'z' so sánh giá trị ASCII hiện tại của c với giá trị ASCII của 'z'. Miễn là giá trị ASCII vẫn nhỏ hơn hoặc bằng giá trị của 'z', vòng lặp tiếp tục, và khi cout in biến char, nó hiển thị ký tự tương ứng.

6. Chuyển đổi chữ hoa/thường thủ công (dùng khoảng cách ASCII)

Vì các chữ cái viết hoa ('A'-'Z') và viết thường ('a'-'z') đều được sắp xếp liên tục và có một khoảng cách cố định trong bảng ASCII (97 - 65 = 32), bạn có thể chuyển đổi giữa chúng bằng phép cộng/trừ đơn giản.

#include <iostream>

using namespace std;

int main() {
    char ch = 'K';
    char cth = ch + ('a' - 'A');

    cout << "'" << ch << "' sau khi chuyen sang thuong (ASCII) la: '" << cth << "'" << endl;

    char ct = 'r';
    char cht = ct - ('a' - 'A');

    cout << "'" << ct << "' sau khi chuyen sang hoa (ASCII) la: '" << cht << "'" << endl;

    return 0;
}

'K' sau khi chuyen sang thuong (ASCII) la: 'k'
'r' sau khi chuyen sang hoa (ASCII) la: 'R'

Giải thích: ('a' - 'A') là một biểu thức thông minh để tính toán khoảng cách ASCII giữa chữ thường và chữ hoa bất kể hệ thống nào (miễn là sử dụng ASCII hoặc tương thích cho phạm vi này). Việc cộng khoảng cách này vào một chữ hoa sẽ đưa nó tới vị trí của chữ thường tương ứng trong bảng mã, và trừ đi khoảng cách này từ một chữ thường sẽ đưa nó về vị trí của chữ hoa tương ứng.

Hạn chế của ASCII (và cần gì sau này)

Mặc dù ASCII là nền tảng, nhưng nó chỉ bao gồm 128 ký tự Latin cơ bản, số, ký hiệu và ký tự điều khiển. Rõ ràng, nó không đủ để biểu diễn ký tự của tiếng Việt (có dấu), tiếng Nhật, tiếng Trung, tiếng Ả Rập và vô số ngôn ngữ khác trên thế giới.

Để giải quyết vấn đề này, các bảng mã mở rộng (Extended ASCII, sử dụng 8 bit, cho 256 ký tự) và đặc biệt là Unicode (sử dụng nhiều byte hơn, có thể biểu diễn hàng triệu ký tự) đã ra đời và trở nên phổ biến. Unicode cùng với các chuẩn mã hóa như UTF-8 là những gì chúng ta sử dụng chủ yếu ngày nay để xử lý văn bản đa ngôn ngữ.

Tuy nhiên, hiểu về ASCII vẫn là cực kỳ quan trọng vì:

Nó là cơ sở lịch sử và kỹ thuật cho các bảng mã sau này.
Các ký tự cơ bản (A-Z, a-z, 0-9, ký hiệu phổ biến) trong hầu hết các bảng mã hiện đại (bao gồm cả Unicode/UTF-8) đều có giá trị tương thích với ASCII gốc.
Nó giúp hiểu cách C++ xử lý char như một kiểu số nguyên.

Nắm vững kiến thức về ASCII sẽ giúp bạn dễ dàng hơn khi làm việc với các bảng mã phức tạp hơn và xử lý ký tự trong C++.

Hướng dẫn sử dụng:

Lưu nội dung trên vào một file có đuôi .md (ví dụ: bai_2_3_ascii_cpp.md).
Mở file đó bằng trình soạn thảo Markdown hoặc xem trước để xem kết quả.

Tôi đã cố gắng:

Giữ nguyên cấu trúc YAML và tiêu đề theo yêu cầu, cập nhật thông tin mô tả và từ khóa cho phù hợp với bài ASCII.
Viết nội dung giải thích về ASCII và mối liên hệ với char trong C++.
Tạo nhiều ví dụ C++ nhỏ gọn, dễ hiểu, sử dụng cout, endl, static_cast.
Giải thích rõ ràng sau mỗi đoạn code.
Sử dụng in đậm (**) và in nghiêng (*) để làm bài viết hấp dẫn hơn.
Đảm bảo không có phần giới thiệu bài tiếp theo hoặc kết luận bài này.
Đề cập ngắn gọn về giới hạn của ASCII và sự cần thiết của Unicode mà không đi sâu vào chi tiết hay biến thành giới thiệu bài mới.

Bài tập ví dụ: C++ Bài 2.A3: Chia hết cho 3 hoặc 7

Viết một chương trình để kiểm tra xem $n$ có phải là bội số của 3 hoặc 7, nhưng không phải bội của cả hai số.

INPUT FORMAT

Dòng đầu tiên chứa giá $n (1\leq n \leq 10^9)$.

OUTPUT FORMAT

In ra 1 nếu $n$ là bội số của 3 hoặc 7 nhưng không phải bội của cả hai số, ngược lại in ra 0.

Ví dụ 1:

Input

Ouput

Ví dụ 2:

Input

Output

Giải thích ví dụ mẫu:

Ví dụ 1: 21 không phải là bội số của 3 hoặc 7 mà không phải cả hai, nên in 0.
Ví dụ 2: 3 là bội số của 3 nhưng không phải của 7, nên in 1.

1. Hiểu bài toán:

Yêu cầu là kiểm tra một số nguyên n có thỏa mãn điều kiện sau không:

n chia hết cho 3 HOẶC n chia hết cho 7.
Và n KHÔNG chia hết cho cả 3 và 7 cùng lúc.

Nếu thỏa mãn, in ra 1. Ngược lại, in ra 0.

2. Cách kiểm tra chia hết:

Trong C++, toán tử % (modulo) được sử dụng để lấy phần dư của phép chia.

n chia hết cho k khi và chỉ khi n % k == 0.

3. Áp dụng logic điều kiện:

Điều kiện "A HOẶC B nhưng KHÔNG phải cả A và B" là một dạng của phép toán "XOR" (Exclusive OR). Trong bài toán này:

A là điều kiện "n chia hết cho 3" (n % 3 == 0).
B là điều kiện "n chia hết cho 7" (n % 7 == 0).

Bạn cần kiểm tra xem điều kiện (A || B) && !(A && B) có đúng không. Hoặc cách khác, bạn có thể kiểm tra xem điều kiện (A && !B) || (!A && B) có đúng không. Cả hai đều diễn tả đúng yêu cầu "A hoặc B, nhưng không cả hai".

4. Cấu trúc chương trình:

Sử dụng thư viện iostream để nhập và xuất dữ liệu.
Trong hàm main, khai báo một biến kiểu số nguyên để lưu giá trị n. int là đủ cho n <= 10^9.
Đọc giá trị n từ đầu vào chuẩn (cin).
Viết một biểu thức logic kiểm tra điều kiện bạn đã xác định ở bước 3, sử dụng toán tử % và các toán tử logic || (HOẶC), && (VÀ), ! (PHỦ ĐỊNH).
In kết quả ra đầu ra chuẩn (cout). Nếu biểu thức logic đúng, in 1. Nếu sai, in 0.
Bạn có thể sử dụng cấu trúc if/else hoặc toán tử ba ngôi (? :) để in kết quả một cách ngắn gọn.

Ví dụ về cách viết biểu thức logic (không phải code hoàn chỉnh):

Hãy tưởng tượng bạn có các biến boolean: bool chia_het_cho_3 = (n % 3 == 0); bool chia_het_cho_7 = (n % 7 == 0);

Điều kiện cần kiểm tra sẽ là một sự kết hợp của chia_het_cho_3 và chia_het_cho_7 dựa trên logic "XOR" đã nói ở trên.

5. Gợi ý về cách in kết quả ngắn gọn:

Sau khi có biểu thức điều kiện logic hoàn chỉnh, giả sử nó là bieu_thuc_dieu_kien, bạn có thể in kết quả bằng: cout << (bieu_thuc_dieu_kien ? 1 : 0) << endl;

Tóm lại các bước cần thực hiện trong code:

#include <iostream>
Hàm main
Khai báo int n;
cin >> n;
Tính toán biểu thức logic kiểm tra (n % 3 == 0 XOR n % 7 == 0).
cout << (ket_qua_bieu_thuc_logic ? 1 : 0) << endl;
return 0;

#include <iostream>

int main() {
    using namespace std;
    int n;
    cin >> n;
    bool c3 = (n % 3 == 0);
    bool c7 = (n % 7 == 0);
    cout << ((c3 && !c7) || (!c3 && c7) ? 1 : 0) << endl;
    return 0;
}

Làm thêm nhiều bài tập miễn phí tại đây

Comments

There are no comments at the moment.