Loại bỏ dữ liệu trùng nhau bằng Notepad ++

Xóa các hàng trùng nhau trên notepad ++ thiệt dễ dàng chỉ với 1 vài thao tác đơn giản. Đôi khi bạn cần loại bỏ các dữ liệu trùng nhau trong nội dung văn bản. Có 2 cách cho bạn sử dụng đó là dùng Replace và TextFX.

Tham khảo thêm: Hướng dẫn thủ thuật dùng notepad ++

Cách 1: Dùng TextFX Characters

Để remove dữ liệu trùng nhau trong Notepad ++ chúng ta cần Install một plugin đó là TextFX Characters bằng cách:

Plugins -> Plugin Manager -> Show Plugin Manager -> Available tab -> TextFX -> Install

Sau khi cài đặt xong khởi động lại Notepad ++.

Hãy đảm bảo rằng “Sort outputs only unique…” đã được check. Kiểm tra trong TextFX -> TextFX Tools

notepad

Sau đó bôi đen toàn bộ văn bản (Ctrl + A) -> TextFX -> TextFX Tools -> Click vào “Sort lines case sensitive” hoặc “Sort lines case insensitive”.

Cách 2: Dùng trực tiếp Replace

Kể từ phiên bản 6.0 trở đi người dùng có thể trực tiếp loại bỏ các dòng trùng nhau bằng regex của notepad++.

(.*?)$\s+?^(?=.*^\1$)

Chỉnh như cấu hình bên dưới.

remove_duplicate

 

Bonus: Xóa dòng ít hơn 40 kí tự

Tìm và thay thế cụm từ sau:

^.{0,40}(\r\n?|\n|$)

Thêm vào cuối dòng thì

Find What: $ --> Replace With: "Nội dung cần thêm"

nhớ check vào Regular exprission

Done!

 

Leave a Reply

Your email address will not be published. Required fields are marked *