Đến với bài viết thứ tư trong chuyên mục Regular Expression chúng ta sẽ tìm hiểu về phương thức Split() cũng như các đặc tính của phương thức này. Là một trong các hàm hỗ trợ của Regular Expression, Split() có chức năng chia/ tách văn bản ban đầu thành nhiều văn bản con dựa trên những điều kiện trong chuỗi mẫu partern. Để trích xuất nội dung từ 1 đoạn văn bản (nói chính xác là trích xuất từ trong văn bản) ta thường xem xét những ký tự xung quanh từ cần tách có những đặc điểm gì đáng chú ý để có thể dùng làm cơ sở chia tách; Ví dụ tách tất cả các từ thì đối tượng để tách là các khoảng trắng.
1. Phương thức Split
Ví dụ bên dưới đầu tiên ta có 1 string mẫu vói nội dung là thứ tự các chuyên mục trong một website,; Vấn đề cần thực hiện là lấy chính xác tên của các chuyên mục. Ta thấy rằng giữa các chuyên mục được ngăn cách bởi chuỗi ” >> “. Đối số của Split() bao gồm: Chuỗi ban đầu và partern dùng để chia tách. Kết quả trả về là danh sách các chuỗi con thỏa mãn điều kiện của partern.
2. Ví dụ tiếp theo về phương thức Split
Trong ví dụ thứ 2 này, giả sữ ban đầu ta có 1 string chứa tên …..
