Tạo database đúng chuẩn utf8 unicode trong MySQL / MariaDB


Khi tạo CSDL, có rất nhiều chuẩn mà MySQL / MariaDB gọi là collation như hình bên dưới:

Vậy để tạo database đúng collation được khuyến khích trong các dự án phần mềm sử dụng hệ quản trị CSDL MySQL / MariaDB là gì? Đó là: utf8mb4_unicode_ci

Tạo database với collation utf8mb4_unicode_ci trong MySQL / MariaDB

Để tạo database đầu tiên chúng ta cần kết nối tới MySQL / MariaDB Server

sudo mysql -u root -p

Sau đó sử dụng lệnh sql sau để tạo database:

CREATE DATABASE <my_database> CHARACTER SET utf8mb4 COLLATE utf8mb4_unicode_ci;

Trong đó: <my_database>: là tên của CSDL

VD:

MariaDB [(none)]> CREATE DATABASE vinasupport CHARACTER SET utf8mb4 COLLATE utf8mb4_unicode_ci;

Kiểm tra collation của database

Sau khi tạo xong database, các bạn muốn kiểm tra collation của database chúng ta sử dụng câu lệnh SQL sau:

MariaDB [(none)]> use vinasupport;
MariaDB [vinasupport]> SELECT @@character_set_database, @@collation_database;

Kết quả sẽ được giống như là:

Vì sao nên sử dụng utf8mb4_unicode_ci để tạo database trong MySQL / MariaDB?

Lý do thì vô vàn lắm, mình sẽ liệt ra những ưu điểm như sau:

  • utf8mb4_unicode_ci được dựa trên tiêu chuẩn Unicode để sắp xếp và so sánh, sắp xếp chính xác trong một phạm vi ngôn ngữ rất rộng.
  • utf8mb4_unicode_ci  sử dụng các quy tắc Unicode để sắp xếp và so sánh, sử dụng một thuật toán khá phức tạp để sắp xếp chính xác trong một loạt các ngôn ngữ và khi sử dụng một loạt các ký tự đặc biệt. Các quy tắc này cần phải tính đến các quy ước cụ thể về ngôn ngữ; không phải ai cũng sắp xếp các nhân vật của mình theo cái mà chúng ta gọi là “thứ tự chữ cái”.

Nguồn: vinasupport.com

             
SHARE

Bài viết liên quan

mode_edit Bình luận của bạn

Email của bạn sẽ không được hiển thị công khai. Các trường bắt buộc được đánh dấu *

account_circle
web