Bài 14.4. Quick Sort với các dữ liệu đặc biệt

Quick Sort nổi tiếng với tốc độ trung bình cực kỳ ấn tượng, thường là O(n log n), khiến nó trở thành một trong những thuật toán sắp xếp nhanh nhất trong thực tế. Tuy nhiên, giống như nhiều thuật toán, hiệu suất của Quick Sort có thể thay đổi đáng kể tùy thuộc vào cấu trúc của dữ liệu đầu vào. Đặc biệt, có những trường hợp dữ liệu "đặc biệt" có thể đẩy Quick Sort vào kịch bản tệ nhất, làm giảm hiệu suất của nó xuống O(n^2) - một hiệu suất tương đương với các thuật toán đơn giản hơn như Bubble Sort hay Selection Sort trong trường hợp xấu nhất.

Trong bài viết này, chúng ta sẽ đi sâu vào:

Tại sao Quick Sort lại có thể bị chậm lại với dữ liệu đặc biệt?
Các trường hợp dữ liệu đặc biệt nào gây ra vấn đề này?
Làm thế nào để cải thiện Quick Sort để nó hoạt động hiệu quả hơn với những dữ liệu đó?

Nhắc lại về Cách Quick Sort Hoạt Động và Điểm Yếu

Quick Sort hoạt động dựa trên nguyên tắc chia để trị (Divide and Conquer). Các bước cơ bản là:

Chọn phần tử chốt (Pivot): Chọn một phần tử trong mảng làm "chốt".
Phân hoạch (Partition): Sắp xếp lại mảng sao cho tất cả các phần tử nhỏ hơn phần tử chốt nằm ở bên trái nó, và tất cả các phần tử lớn hơn nó nằm ở bên phải. Các phần tử bằng phần tử chốt có thể nằm ở bất kỳ bên nào tùy thuộc vào cách triển khai phân hoạch. Sau bước này, phần tử chốt đã nằm ở vị trí cuối cùng của nó trong mảng đã sắp xếp.
Đệ quy: Áp dụng đệ quy thuật toán Quick Sort cho mảng con bên trái (các phần tử nhỏ hơn chốt) và mảng con bên phải (các phần tử lớn hơn chốt).

Hiệu suất của Quick Sort phụ thuộc mạnh mẽ vào bước phân hoạch và cách chọn phần tử chốt. Nếu mỗi bước phân hoạch tạo ra hai mảng con có kích thước gần bằng nhau (ví dụ: mỗi mảng con có kích thước khoảng n/2), thì độ sâu của cây đệ quy sẽ là O(log n). Mỗi lần phân hoạch mất thời gian O(n) để duyệt qua mảng. Tổng cộng, thời gian trung bình sẽ là O(n log n).

Tuy nhiên, nếu bước phân hoạch tạo ra các mảng con rất mất cân bằng (ví dụ: một mảng con có kích thước n-1 và mảng con kia có kích thước 0), điều này xảy ra khi phần tử chốt là phần tử nhỏ nhất hoặc lớn nhất trong mảng con hiện tại. Khi đó, độ sâu của cây đệ quy sẽ là O(n). Mỗi lần phân hoạch vẫn mất O(n). Tổng cộng, thời gian sẽ là O(n n) = O(n^2). Đây chính là kịch bản xấu nhất* của Quick Sort.

Các "dữ liệu đặc biệt" mà chúng ta sắp xét chính là những loại dữ liệu có khả năng cao gây ra kịch bản mất cân bằng này, đặc biệt là với cách chọn chốt đơn giản (như luôn chọn phần tử đầu tiên hoặc cuối cùng).

Các Trường Hợp Dữ liệu Đặc biệt Gây Vấn Đề

Chúng ta sẽ tập trung vào hai loại dữ liệu đặc biệt chính:

1. Dữ liệu đã được sắp xếp (tăng dần hoặc giảm dần)

Nghe có vẻ nghịch lý, nhưng mảng đã được sắp xếp lại là một trong những trường hợp tồi tệ nhất đối với Quick Sort nếu bạn sử dụng chiến lược chọn chốt đơn giản như luôn chọn phần tử đầu tiên hoặc cuối cùng.

Giả sử mảng đã được sắp xếp tăng dần: [1, 2, 3, 4, 5, 6, 7, 8, 9, 10]

Nếu chọn phần tử đầu tiên làm chốt (ví dụ: 1): Sau phân hoạch, 1 sẽ ở vị trí đầu tiên. Mảng con bên trái trống. Mảng con bên phải chứa [2, 3, 4, 5, 6, 7, 8, 9, 10] (kích thước n-1).
Nếu chọn phần tử cuối cùng làm chốt (ví dụ: 10): Sau phân hoạch, 10 sẽ ở vị trí cuối cùng. Mảng con bên trái chứa [1, 2, 3, 4, 5, 6, 7, 8, 9] (kích thước n-1). Mảng con bên phải trống.

Trong cả hai trường hợp, mỗi lần phân hoạch đều tạo ra một mảng con có kích thước n-1 và một mảng con rỗng. Điều này dẫn đến cây đệ quy "thẳng", có độ sâu O(n), và tổng thời gian là O(n^2).

Mảng đã được sắp xếp giảm dần cũng gặp vấn đề tương tự.

Hãy xem một ví dụ code C++ đơn giản sử dụng phần tử cuối cùng làm chốt (Lomuto partition scheme):

#include <iostream>
#include <vector>
#include <algorithm>

// Hàm phân hoạch sử dụng phần tử cuối cùng làm chốt (Lomuto partition)
int partition(std::vector<int>& arr, int low, int high) {
    int pivot = arr[high]; // Chọn phần tử cuối cùng làm chốt
    int i = (low - 1);     // Chỉ mục của phần tử nhỏ hơn

    for (int j = low; j <= high - 1; j++) {
        // Nếu phần tử hiện tại nhỏ hơn hoặc bằng chốt
        if (arr[j] <= pivot) {
            i++; // Tăng chỉ mục của phần tử nhỏ hơn
            std::swap(arr[i], arr[j]);
        }
    }
    std::swap(arr[i + 1], arr[high]); // Đặt chốt vào đúng vị trí
    return (i + 1); // Trả về chỉ mục của chốt
}

// Hàm Quick Sort
void quickSort(std::vector<int>& arr, int low, int high) {
    if (low < high) {
        // pi là chỉ mục phân hoạch, arr[pi] đã đứng đúng vị trí
        int pi = partition(arr, low, high);

        // Sắp xếp đệ quy các phần tử trước và sau phân hoạch
        quickSort(arr, low, pi - 1);
        quickSort(arr, pi + 1, high);
    }
}

// Hàm in vector
void printVector(const std::vector<int>& arr) {
    for (int x : arr) {
        std::cout << x << " ";
    }
    std::cout << std::endl;
}

int main() {
    // Ví dụ với dữ liệu đã sắp xếp tăng dần
    std::vector<int> sorted_data = {1, 2, 3, 4, 5, 6, 7, 8, 9, 10};
    std::cout << "Mang ban dau (da sap xep): ";
    printVector(sorted_data);
    quickSort(sorted_data, 0, sorted_data.size() - 1);
    std::cout << "Mang sau Quick Sort: ";
    printVector(sorted_data); // Kết quả đúng, nhưng performance la O(n^2)

    std::cout << "\n--------------------\n";

    // Ví dụ với dữ liệu đã sắp xếp giảm dần
    std::vector<int> reverse_sorted_data = {10, 9, 8, 7, 6, 5, 4, 3, 2, 1};
    std::cout << "Mang ban dau (sap xep giam dan): ";
    printVector(reverse_sorted_data);
    quickSort(reverse_sorted_data, 0, reverse_sorted_data.size() - 1);
    std::cout << "Mang sau Quick Sort: ";
    printVector(reverse_sorted_data); // Kết quả đúng, performance la O(n^2)

    return 0;
}

Giải thích code:

Hàm partition nhận một vector và phạm vi [low, high]. Nó chọn arr[high] làm chốt.
Nó sử dụng một chỉ mục i để theo dõi vị trí cuối cùng của các phần tử nhỏ hơn hoặc bằng chốt.
Vòng lặp duyệt qua các phần tử từ low đến high-1. Nếu arr[j] nhỏ hơn hoặc bằng chốt, nó sẽ hoán đổi arr[j] với phần tử tại i+1 và tăng i.
Cuối cùng, nó hoán đổi phần tử chốt (arr[high]) với phần tử tại i+1, đặt chốt vào đúng vị trí giữa các phần tử nhỏ hơn và lớn hơn nó.
Hàm quickSort là hàm đệ quy chuẩn, gọi partition và sau đó gọi đệ quy cho hai mảng con.

Với dữ liệu đã sắp xếp (tăng hoặc giảm), hàm partition này sẽ luôn đặt chốt ở một đầu của mảng con, dẫn đến phân hoạch mất cân bằng và hiệu suất O(n^2).

2. Dữ liệu chứa nhiều phần tử trùng lặp

Khi mảng chứa nhiều phần tử có giá trị giống nhau, Quick Sort với phân hoạch 2 chiều (như ví dụ trên) cũng có thể gặp vấn đề.

Ví dụ: [3, 1, 4, 1, 5, 9, 2, 6, 5, 3, 5]

Nếu bạn chọn chốt là 5. Với phân hoạch 2 chiều chuẩn, tất cả các số 5 sẽ được đặt vào cùng một phía của chốt (hoặc lộn xộn ở cả hai phía, nhưng vẫn nằm trong các mảng con đệ quy).

Giả sử phân hoạch đưa tất cả các phần tử <= chốt về bên trái và > chốt về bên phải. Nếu chốt là một số có nhiều bản sao, và nó là giá trị phổ biến nhất, thì mảng con bên trái có thể rất lớn, chứa tất cả các số nhỏ hơn và bằng chốt, trong khi mảng con bên phải lại rất nhỏ.
Hoặc tệ hơn, nếu tất cả các phần tử trong mảng là giống hệt nhau (ví dụ: [5, 5, 5, 5, 5]). Với phân hoạch 2 chiều chuẩn, chọn 5 làm chốt, tất cả các phần tử khác đều bằng chốt. Tùy thuộc vào logic cụ thể (ví dụ: <= chốt), tất cả các phần tử còn lại có thể bị đẩy vào một mảng con (kích thước n-1), dẫn đến O(n^2) giống như trường hợp mảng đã sắp xếp.

Vấn đề chính là các phần tử bằng chốt vẫn nằm trong các mảng con cần xử lý đệ quy. Khi có nhiều phần tử bằng chốt, kích thước của các mảng con đệ quy không giảm đủ nhanh.

Giải Pháp: Phân hoạch 3 chiều (Three-Way Partitioning)

Để xử lý hiệu quả dữ liệu chứa nhiều phần tử trùng lặp (và cả mảng đã sắp xếp), chúng ta có thể sử dụng kỹ thuật phân hoạch 3 chiều. Kỹ thuật này chia mảng thành ba phần:

Các phần tử nhỏ hơn phần tử chốt (< pivot).
Các phần tử bằng phần tử chốt (= pivot).
Các phần tử lớn hơn phần tử chốt (> pivot).

Sau bước phân hoạch, các phần tử bằng chốt đã nằm đúng vị trí cuối cùng của chúng và không cần xử lý đệ quy nữa. Điều này giúp giảm kích thước của các mảng con đệ quy một cách đáng kể, đặc biệt khi có nhiều phần tử trùng lặp hoặc khi mảng đã sắp xếp (vì trong mảng đã sắp xếp, chọn chốt là một giá trị, sẽ có nhiều giá trị khác bằng hoặc rất gần giá trị đó).

Kỹ thuật phân hoạch 3 chiều thường được gọi là Dutch National Flag Problem (Bài toán lá cờ Hà Lan) vì nó giống việc sắp xếp ba màu (đỏ, trắng, xanh) của lá cờ Hà Lan.

Hãy xem code C++ cho Quick Sort sử dụng phân hoạch 3 chiều:

#include <iostream>
#include <vector>
#include <algorithm>

// Hàm phân hoạch 3 chiều
// Chia mảng thành 3 phần: < pivot, = pivot, > pivot
void partition_three_way(std::vector<int>& arr, int low, int high, int& i, int& j) {
    // i và j sẽ là các chỉ số đánh dấu ranh giới của vùng = pivot
    // arr[low...i-1] < pivot
    // arr[i...j] = pivot
    // arr[j+1...high] > pivot

    // Chọn phần tử đầu tiên làm chốt (để đơn giản, có thể dùng median-of-three tốt hơn)
    int pivot = arr[low];

    // low là chỉ mục bắt đầu của vùng < pivot (hoặc = pivot)
    // high là chỉ mục kết thúc của vùng > pivot (hoặc = pivot)
    // i là chỉ mục kết thúc của vùng < pivot (điểm cuối của phần tử nhỏ hơn)
    // j là chỉ mục bắt đầu của vùng > pivot (điểm đầu của phần tử lớn hơn)

    // Khởi tạo các chỉ số
    i = low; // ranh giới trên của vùng < pivot
    j = high; // ranh giới dưới của vùng > pivot
    int mid = low; // chỉ mục hiện tại đang xét

    while (mid <= j) {
        if (arr[mid] < pivot) {
            // Nếu phần tử hiện tại < pivot, đổi chỗ với phần tử ở i,
            // và mở rộng vùng < pivot về bên phải (tăng i)
            // và tiếp tục xét phần tử tiếp theo ở mid
            std::swap(arr[i], arr[mid]);
            i++;
            mid++;
        } else if (arr[mid] > pivot) {
            // Nếu phần tử hiện tại > pivot, đổi chỗ với phần tử ở j,
            // và mở rộng vùng > pivot về bên trái (giảm j)
            // CHÚ Ý: Không tăng mid, vì phần tử mới đổi chỗ vào mid cần được xét tiếp
            std::swap(arr[mid], arr[j]);
            j--;
        } else {
            // Nếu phần tử hiện tại == pivot, nó đã nằm đúng vị trí trung gian.
            // Chỉ cần chuyển sang xét phần tử tiếp theo.
            mid++;
        }
    }
    // Sau vòng lặp, arr[low...i-1] < pivot, arr[i...j] = pivot, arr[j+1...high] > pivot
    // i và j là các chỉ số cần thiết để gọi đệ quy
}


// Hàm Quick Sort sử dụng phân hoạch 3 chiều
void quickSort_three_way(std::vector<int>& arr, int low, int high) {
    if (low >= high) {
        // Trường hợp cơ bản: mảng con có 0 hoặc 1 phần tử
        return;
    }

    int i, j; // Các chỉ số sẽ được trả về từ partition_three_way
    partition_three_way(arr, low, high, i, j);

    // Đệ quy cho vùng < pivot (nếu có)
    quickSort_three_way(arr, low, i - 1);

    // Đệ quy cho vùng > pivot (nếu có)
    quickSort_three_way(arr, j + 1, high);

    // Vùng = pivot (từ i đến j) đã nằm đúng vị trí và không cần xử lý đệ quy
}

// Hàm in vector (giữ nguyên từ ví dụ trước)
void printVector(const std::vector<int>& arr) {
    for (int x : arr) {
        std::cout << x << " ";
    }
    std::cout << std::endl;
}


int main() {
    // Ví dụ với dữ liệu có nhiều phần tử trùng lặp
    std::vector<int> duplicate_data = {3, 1, 4, 1, 5, 9, 2, 6, 5, 3, 5, 8, 9, 7, 9, 3, 2, 4, 6, 8};
    std::cout << "Mang ban dau (nhieu phan tu trung lap): ";
    printVector(duplicate_data);
    quickSort_three_way(duplicate_data, 0, duplicate_data.size() - 1);
    std::cout << "Mang sau Quick Sort 3-way: ";
    printVector(duplicate_data); // Kết quả đúng, performance O(n log n)

    std::cout << "\n--------------------\n";

    // Ví dụ với dữ liệu đã sắp xếp tăng dần (kiểm tra lại performance)
    std::vector<int> sorted_data_3way = {1, 2, 3, 4, 5, 6, 7, 8, 9, 10};
    std::cout << "Mang ban dau (da sap xep) voi Quick Sort 3-way: ";
    printVector(sorted_data_3way);
    quickSort_three_way(sorted_data_3way, 0, sorted_data_3way.size() - 1);
    std::cout << "Mang sau Quick Sort 3-way: ";
    printVector(sorted_data_3way); // Kết quả đúng, performance O(n log n)

     std::cout << "\n--------------------\n";

    // Ví dụ với dữ liệu gom nhóm (nhiều giá trị giống nhau liền kề)
    std::vector<int> clustered_data = {5, 5, 5, 2, 2, 2, 8, 8, 8, 5, 5, 2, 8, 8};
    std::cout << "Mang ban dau (gom nhom): ";
    printVector(clustered_data);
    quickSort_three_way(clustered_data, 0, clustered_data.size() - 1);
    std::cout << "Mang sau Quick Sort 3-way: ";
    printVector(clustered_data); // Kết quả đúng, performance O(n log n)


    return 0;
}

Giải thích code phân hoạch 3 chiều (partition_three_way) và quickSort_three_way:

Hàm partition_three_way nhận mảng, phạm vi [low, high], và hai tham chiếu i, j. Nó sẽ sắp xếp lại mảng con và trả về các chỉ số i và j sao cho:
- arr[low...i-1] chứa các phần tử < pivot.
- arr[i...j] chứa các phần tử = pivot.
- arr[j+1...high] chứa các phần tử > pivot.
Nó sử dụng ba con trỏ (chỉ mục):
- low: Ban đầu là chỉ mục bắt đầu của mảng con, sau khi phân hoạch nó đánh dấu ranh giới dưới của vùng < pivot.
- high: Ban đầu là chỉ mục kết thúc của mảng con, sau khi phân hoạch nó đánh dấu ranh giới trên của vùng > pivot.
- mid: Duyệt qua mảng con, từ low đến high.
Vòng lặp while (mid <= j) xử lý các phần tử:
- Nếu arr[mid] < pivot: Hoán đổi arr[mid] với arr[i], tăng cả i và mid. (Đưa phần tử nhỏ hơn về đầu, di chuyển ranh giới vùng < pivot).
- Nếu arr[mid] > pivot: Hoán đổi arr[mid] với arr[j], giảm j. (Đưa phần tử lớn hơn về cuối, di chuyển ranh giới vùng > pivot). Không tăng mid vì phần tử mới được hoán đổi vào vị trí mid cần được kiểm tra lại.
- Nếu arr[mid] == pivot: Chỉ cần tăng mid. Phần tử này đã nằm đúng vị trí trung gian.
Hàm quickSort_three_way sau khi gọi partition_three_way, sẽ nhận được các chỉ số i và j. Nó chỉ gọi đệ quy cho hai mảng con không chứa các phần tử bằng chốt: [low, i-1] (các phần tử < pivot) và [j+1, high] (các phần tử > pivot).

Tại sao phân hoạch 3 chiều hoạt động tốt hơn?

Với dữ liệu có nhiều phần tử trùng lặp hoặc dữ liệu đã sắp xếp (khi chọn chốt là một phần tử có nhiều bản sao hoặc giá trị gần đó), phân hoạch 3 chiều loại bỏ toàn bộ khối phần tử bằng chốt khỏi các cuộc gọi đệ quy tiếp theo. Điều này đảm bảo rằng kích thước của các mảng con đệ quy giảm đi ít nhất là số lượng phần tử bằng chốt, giúp duy trì độ sâu cây đệ quy gần với O(log n) và giữ hiệu suất trung bình là O(n log n) ngay cả trong các trường hợp đặc biệt này.

Các Trường Hợp Dữ liệu Đặc biệt Khác (và Cách Phân hoạch 3 chiều xử lý)

Dữ liệu chỉ chứa một giá trị duy nhất: Ví dụ: [7, 7, 7, 7, 7]. Phân hoạch 2 chiều đơn giản (như ví dụ 1) có thể dẫn đến O(n^2). Phân hoạch 3 chiều, chọn 7 làm chốt, sẽ đặt tất cả các số 7 vào vùng giữa và không cần gọi đệ quy nữa. Thời gian sẽ là O(n) cho bước phân hoạch. Đây là hiệu suất tối ưu cho trường hợp này.
Dữ liệu có phạm vi giá trị rất nhỏ: Ví dụ: [1, 0, 1, 2, 0, 1, 0, 2, 2, 1]. Tương tự trường hợp nhiều trùng lặp, phân hoạch 3 chiều sẽ hoạt động hiệu quả hơn.

Các Chiến Lược Chọn Chốt Khác

Ngoài việc sử dụng phân hoạch 3 chiều, việc chọn chốt thông minh cũng giúp tránh kịch bản O(n^2), đặc biệt là với phân hoạch 2 chiều truyền thống:

Chọn chốt ngẫu nhiên (Random Pivot): Thay vì luôn chọn phần tử đầu hoặc cuối, chọn một chỉ mục ngẫu nhiên trong phạm vi [low, high] và hoán đổi nó với arr[low] (hoặc arr[high]) trước khi thực hiện phân hoạch. Điều này làm cho xác suất gặp kịch bản xấu nhất trở nên rất thấp trong thực tế, dù về mặt lý thuyết vẫn tồn tại.
Chọn chốt là trung vị của ba phần tử (Median-of-Three): Chọn 3 phần tử (ví dụ: đầu, giữa, cuối của mảng con), tìm giá trị trung vị của chúng và sử dụng giá trị đó làm chốt (hoán đổi nó vào vị trí đầu hoặc cuối). Cách này có xu hướng chọn được chốt gần với trung vị thực sự của mảng con hơn, giúp phân hoạch cân bằng hơn.

Kết hợp chiến lược chọn chốt tốt (như Median-of-Three hoặc ngẫu nhiên) với phân hoạch 3 chiều tạo ra một phiên bản Quick Sort rất mạnh mẽ và ổn định, có hiệu suất O(n log n) trong hầu hết các trường hợp, bao gồm cả những trường hợp dữ liệu đặc biệt mà Quick Sort gốc gặp khó khăn.

Bài tập ví dụ:

Tính đặc biệt của dãy số

Trong một cuộc phiêu lưu tại lâu đài cổ, FullHouse Dev đã khám phá ra một căn phòng bí ẩn chứa đầy những con số. Họ nhận ra rằng để mở được cánh cửa tiếp theo, họ cần phải giải quyết một bài toán liên quan đến tính đặc biệt của dãy số này.

Bài toán

Bạn được cho một dãy số \(A\) có độ dài \(N\) và một số \(K\). Một số \(X\) được gọi là đặc biệt nếu tồn tại một dãy con liên tiếp chứa đúng \(K\) số lớn hơn \(X\). Tính đặc biệt của dãy số là tổng của tất cả các số đặc biệt có trong dãy. Nhiệm vụ của FullHouse Dev là xác định tính đặc biệt của dãy số đã cho.

INPUT FORMAT:

Dòng đầu tiên: Hai số nguyên \(N\) và \(K\)
Dòng thứ hai: \(N\) số nguyên biểu diễn các phần tử của dãy số

OUTPUT FORMAT:

Một số nguyên duy nhất biểu diễn tính đặc biệt của dãy số

Ràng buộc:

\(1 \leq N \leq 10^5\)
\(1 \leq K \leq N\)
\(1 \leq A[i] \leq 10^9\) với mọi chỉ số \(i\) của mảng

Ví dụ

INPUT

5 2
4 3 2 7 8

OUTPUT

Giải thích

Tính đặc biệt của dãy số là 9.

Với \(X = 2\), dãy con thỏa mãn là [4, 3]
Với \(X = 3\), dãy con thỏa mãn là [7, 8]
Với \(X = 4\), dãy con thỏa mãn là [7, 8]
Với \(X \geq 5\), không tồn tại dãy con thỏa mãn

Vậy tổng các số đặc biệt là: 2 + 3 + 4 = 9

Sau khi giải quyết bài toán này, FullHouse Dev đã tìm ra chìa khóa để mở cánh cửa tiếp theo trong lâu đài, tiến gần hơn đến kho báu cuối cùng. Tuyệt vời! Bài toán này kết hợp nhiều kỹ thuật cơ bản trong CTDL&GT. Dưới đây là hướng dẫn giải ngắn gọn bằng C++ mà không đưa ra code hoàn chỉnh:

Phân tích bài toán:

Định nghĩa "số đặc biệt X": Một số X được gọi là đặc biệt nếu tồn tại một dãy con liên tiếp trong mảng A chứa đúng K số lớn hơn X.
Tính đặc biệt của dãy số: Là tổng của tất cả các số X đặc biệt.
Ràng buộc: N nhỏ (10^5), A[i] lớn (10^9). Điều này gợi ý rằng độ phức tạp của giải pháp không nên phụ thuộc quá nhiều vào giá trị của A[i], mà nên phụ thuộc vào N.

Quan sát từ ví dụ:

Ví dụ cho thấy các số đặc biệt là 2, 3, 4. Tổng là 9.
Số 2, 3, 4 đều là các giá trị có trong mảng A. Các số khác >= 5 (ví dụ 5, 6) không được coi là đặc biệt trong giải thích của ví dụ, mặc dù có thể tìm thấy dãy con thỏa mãn điều kiện ([7, 8] chứa đúng 2 số > 5 và > 6).
Điều này gợi ý rằng, có thể (dựa trên ví dụ), chỉ các giá trị có trong mảng A mới có thể là số đặc biệt. Nếu đúng như vậy, ta chỉ cần kiểm tra các giá trị này.

Hướng tiếp cận:

Giả sử rằng chỉ các giá trị V có trong mảng A mới có thể là số đặc biệt.

Tìm các giá trị ứng viên: Lấy tất cả các giá trị duy nhất (distinct) từ mảng A.
Kiểm tra từng giá trị ứng viên: Đối với mỗi giá trị duy nhất V lấy từ A, kiểm tra xem nó có phải là số đặc biệt hay không.
Tính tổng: Nếu V là số đặc biệt, cộng V vào tổng cuối cùng.

Làm thế nào để kiểm tra xem một giá trị V có phải là số đặc biệt không?

V là số đặc biệt nếu tồn tại một dãy con liên tiếp trong A chứa đúng K số lớn hơn V.

Để kiểm tra điều này hiệu quả:

Chuyển đổi mảng: Tạo một mảng nhị phân B cùng kích thước với A. B[i] = 1 nếu A[i] > V, và B[i] = 0 nếu A[i] <= V.
Đếm dãy con: Bài toán trở thành: Đếm số lượng dãy con liên tiếp trong mảng nhị phân B có tổng (số lượng số 1) bằng đúng K.
Điều kiện đặc biệt: Nếu số lượng dãy con như vậy lớn hơn 0, thì V là số đặc biệt.

Làm thế nào để đếm số lượng dãy con có tổng bằng K trong mảng nhị phân B?

Đây là một bài toán con kinh điển có thể giải quyết bằng tiền tố tích lũy (prefix sums) và sử dụng map (hoặc hash map) để đếm tần suất.

Tính tiền tố tích lũy: Tạo mảng tiền tố P, trong đó P[i] là tổng các phần tử từ B[0] đến B[i-1] (với P[0]=0). Tổng của dãy con B[l..r] là P[r+1] - P[l].
Sử dụng Map: Ta cần tìm số cặp chỉ số (l, r) với 0 <= l <= r < N sao cho P[r+1] - P[l] = K. Tương đương với P[l] = P[r+1] - K.
Thuật toán đếm: Duyệt qua mảng tiền tố P từ i=1 đến N. Với mỗi P[i] (tương ứng với tiền tố đến chỉ số i-1 của B), ta cần biết có bao nhiêu chỉ số j < i mà P[j] bằng P[i] - K. Sử dụng một map để lưu trữ tần suất xuất hiện của các giá trị trong mảng tiền tố P đã duyệt qua.
- Khởi tạo count = 0, map<long long, int> freq.
- freq[0] = 1 (cho trường hợp P[0]).
- Duyệt i từ 1 đến N:
  - Giá trị tiền tố hiện tại là P[i].
  - Giá trị tiền tố cần tìm là P[i] - K.
  - Nếu map chứa khóa P[i] - K, cộng freq[P[i]-K] vào count.
  - Tăng tần suất của P[i] trong map: freq[P[i]]++.
count lúc này là số lượng dãy con có tổng đúng bằng K.

Tổng hợp thuật toán:

Đọc N, K và mảng A.
Lấy các giá trị duy nhất từ A, lưu vào một vector (có thể sắp xếp cho tiện, nhưng không bắt buộc cho cách này).
Khởi tạo long long total_special_sum = 0;.
Với mỗi giá trị duy nhất V trong danh sách các giá trị duy nhất: a. Tạo mảng nhị phân B có kích thước N. Với mỗi i từ 0 đến N-1, B[i] = (A[i] > V) ? 1 : 0;. b. Sử dụng thuật toán tiền tố tích lũy + map để đếm số lượng dãy con liên tiếp trong B có tổng bằng K. Lưu kết quả vào num_segments_exactly_K. c. Nếu num_segments_exactly_K > 0, cộng V vào total_special_sum.
In ra total_special_sum.

Độ phức tạp:

Lấy các giá trị duy nhất: O(N log N) nếu sắp xếp, hoặc O(N) trung bình với hash set.
Số lượng giá trị duy nhất có thể lên tới N.
Với mỗi giá trị duy nhất:
- Tạo mảng nhị phân: O(N).
- Đếm dãy con tổng K bằng tiền tố + map: O(N) trung bình (với std::unordered_map) hoặc O(N log N) (với std::map).
Tổng độ phức tạp: O(N Số lượng giá trị duy nhất log N) hoặc O(N * Số lượng giá trị duy nhất) trung bình. Trong trường hợp xấu nhất, số lượng giá trị duy nhất là N, dẫn đến O(N^2 log N) hoặc O(N^2) trung bình. Với N=10^5, O(N^2) là quá chậm. Tuy nhiên, có thể các testcase không đạt đến trường hợp xấu nhất này, hoặc có một sự hiểu lầm nhỏ về định nghĩa khiến giải pháp này đúng với ví dụ và đủ nhanh. Dựa trên ví dụ, đây là hướng giải có khả năng cao nhất.

Lưu ý:

Tổng các số đặc biệt có thể lớn, nên sử dụng kiểu dữ liệu long long cho total_special_sum.
Key của map (P[i] - K) có thể âm, nhưng vì chúng là hiệu của các tiền tố (có giá trị từ 0 đến N), chúng sẽ nằm trong khoảng [-N, N]. std::map hoặc std::unordered_map đều xử lý được key âm.

Làm thêm nhiều bài tập miễn phí tại đây

Comments

There are no comments at the moment.