Cập nhật xác thực GitHub sử dụng Token trên macOS (thay thế cho mật khẩu)

Gần đây, GitHub đã chính thức ngừng cho phép sử dụng mật khẩu để checkin, checkout. Dưới đây là các bước cập nhật sử dụng Token thay thế cho mật khẩu trên macOS. 

Xem tiếp >> “Cập nhật xác thực GitHub sử dụng Token trên macOS (thay thế cho mật khẩu)”

Proxies tốt nhất cho Web Scraping

Web scraping là gì?

Web scraping, web harvesting, or web data extraction là việc thu thập dữ liệu được sử dụng để trích xuất dữ liệu từ các trang web. Phần mềm web scraping có thể truy cập trực tiếp vào Web bằng Giao thức HTTP hoặc thông qua trình duyệt web. 

Xem tiếp >> “Proxies tốt nhất cho Web Scraping”

Phần mềm lọc dữ liệu Instagram

Phần mềm lọc dữ liệu Instagram (Instagram scraper) là phần mềm cho hệ điều hành Windows cho phép lọc tìm kiếm các bài post theo từ khoá, location, hashtag, số người follow.

Xem tiếp >> “Phần mềm lọc dữ liệu Instagram”

Scrapy chạy nối tiếp các spider

Với Scrapy, chúng ta có thể có nhiều spider trong một dự án. Bài viết dưới đây hướng dẫn các chạy nối tiếp các spider trong một dự án.

Xem tiếp >> “Scrapy chạy nối tiếp các spider”

Scrapy – Vấn đề tràn bộ nhớ khi start_requests với số urls quá lớn

Nếu spider của bạn có số urls khi start_requests quá lớn (>100.000 urls) có thể gây ra các vấn đề về bộ nhớ. Để giải quyết vấn đề này, chúng ta có thể start_requests với số lượng ít url và tiếp tục bổ sung request cho spider về sau.

Xem tiếp >> “Scrapy – Vấn đề tràn bộ nhớ khi start_requests với số urls quá lớn”

Python upload FTP

Python, upload FTP

Làm thế nào để upload lên FTP bằng mã nguồn Python? Trong bài viết này sẽ chia sẻ với các bạn mã nguồn upload FTP. Xem tiếp >> “Python, upload FTP”