Từ Filecoin, Arweave đến Walrus, Shelby: Quá trình phát triển và triển vọng tương lai của Phi tập trung lưu trữ
Lưu trữ từng là một trong những lĩnh vực nóng của ngành blockchain. Filecoin, như một dự án hàng đầu trong vòng thị trường tăng giá trước đó, đã có lúc đạt giá trị thị trường hơn một tỷ đô la. Arweave, đối thủ cạnh tranh với Filecoin, đã lấy lưu trữ vĩnh viễn làm điểm bán hàng, với giá trị thị trường cao nhất đạt 3,5 tỷ đô la. Tuy nhiên, khi tính khả dụng của lưu trữ dữ liệu lạnh bị nghi ngờ, triển vọng phát triển của lưu trữ phi tập trung cũng bị đặt dấu hỏi. Gần đây, sự xuất hiện của Walrus đã mang lại sự chú ý mới cho lĩnh vực lưu trữ đã im ắng từ lâu, trong khi dự án Shelby do Aptos và Jump Crypto hợp tác ra mắt, đang cố gắng đạt được những đột phá mới trong lĩnh vực lưu trữ dữ liệu nóng. Bài viết này sẽ bắt đầu từ quá trình phát triển của một vài dự án tiêu biểu này, phân tích con đường tiến hóa của lưu trữ phi tập trung, và thảo luận về triển vọng phát triển trong tương lai.
FIL: Bản chất đồng tiền khai thác dưới lớp áo lưu trữ
Filecoin là một trong những dự án blockchain nổi bật trong giai đoạn đầu, với định hướng phát triển xoay quanh Phi tập trung. Filecoin cố gắng chuyển đổi từ lưu trữ tập trung sang lưu trữ phi tập trung, nhưng trong quá trình này, những đánh đổi để đạt được phi tập trung cũng đã trở thành những điểm đau mà các dự án sau này cố gắng giải quyết.
IPFS: Kiến trúc Phi tập trung, nhưng bị hạn chế bởi nút thắt trong truyền tải
IPFS( Hệ thống tệp vũ trụ) ra mắt vào năm 2015, nhằm mục đích cách mạng hóa giao thức HTTP truyền thống thông qua địa chỉ hóa nội dung. Tuy nhiên, nhược điểm lớn nhất của IPFS là tốc độ truy xuất rất chậm. Trong thời đại mà các nhà cung cấp dịch vụ dữ liệu truyền thống có thể đạt được phản hồi trong mili giây, việc truy xuất một tệp từ IPFS vẫn mất hàng chục giây, điều này khiến nó khó có thể được áp dụng trong thực tế.
IPFS chủ yếu phù hợp với "dữ liệu lạnh", tức là nội dung tĩnh không thường xuyên thay đổi. Nhưng trong việc xử lý dữ liệu nóng, như trang web động, trò chơi trực tuyến hoặc ứng dụng AI, giao thức P2P không có lợi thế rõ rệt so với CDN truyền thống.
Mặc dù IPFS không phải là blockchain, nhưng thiết kế đồ thị có hướng không chu kỳ (DAG) mà nó áp dụng rất phù hợp với nhiều chuỗi công cộng và giao thức Web3, làm cho nó trở thành khung xây dựng cơ sở hạ tầng cho blockchain.
Logic của đồng tiền khai thác dưới lớp lưu trữ
Trong mô hình kinh tế token của Filecoin có ba vai trò chính: Người dùng trả phí để lưu trữ dữ liệu; Thợ đào lưu trữ nhận được phần thưởng token vì đã lưu trữ dữ liệu của người dùng; Thợ đào truy xuất cung cấp dữ liệu khi người dùng cần và nhận được phần thưởng.
Mô hình này tồn tại không gian tiềm ẩn cho hành vi xấu. Các thợ mỏ lưu trữ có thể lấp đầy dữ liệu rác sau khi cung cấp không gian lưu trữ để nhận thưởng. Do những dữ liệu rác này không được truy xuất, ngay cả khi mất đi cũng sẽ không kích hoạt cơ chế phạt. Điều này cho phép các thợ mỏ lưu trữ có thể xóa dữ liệu rác và lặp lại quy trình này. Đồng thuận chứng minh sao chép của Filecoin chỉ có thể đảm bảo rằng dữ liệu của người dùng không bị xóa trái phép, nhưng không thể ngăn chặn các thợ mỏ lấp đầy dữ liệu rác.
Việc vận hành của Filecoin phần lớn phụ thuộc vào sự đầu tư liên tục của các thợ mỏ vào kinh tế token, chứ không phải dựa trên nhu cầu thực sự của người dùng cuối đối với lưu trữ phân tán. Mặc dù dự án vẫn đang tiếp tục phát triển, nhưng ở giai đoạn hiện tại, việc xây dựng hệ sinh thái của Filecoin phù hợp hơn với định nghĩa "logic thợ đào" hơn là "ứng dụng thúc đẩy" cho các dự án lưu trữ.
Arweave: Thành công nhờ chủ nghĩa dài hạn, thất bại vì chủ nghĩa dài hạn
Nếu nói rằng mục tiêu thiết kế của Filecoin là xây dựng một "đám mây dữ liệu" phi tập trung có thể khuyến khích và có thể chứng minh, thì Arweave lại đi theo một hướng cực đoan khác trong việc lưu trữ: cung cấp khả năng lưu trữ vĩnh viễn cho dữ liệu. Arweave không cố gắng xây dựng một nền tảng tính toán phân tán, toàn bộ hệ thống của nó xoay quanh một giả thuyết cốt lõi - dữ liệu quan trọng nên được lưu trữ một lần và mãi mãi tồn tại trên mạng. Chủ nghĩa dài hạn cực đoan này khiến Arweave khác biệt hoàn toàn với Filecoin từ cơ chế đến mô hình khuyến khích, từ yêu cầu phần cứng đến góc độ kể chuyện.
Arweave lấy Bitcoin làm đối tượng học tập, cố gắng tối ưu hóa mạng lưu trữ vĩnh viễn của mình trong những chu kỳ dài tính bằng năm. Arweave không quan tâm đến tiếp thị, cũng không quan tâm đến đối thủ và xu hướng phát triển của thị trường. Nó chỉ đơn giản là tiếp tục tiến lên trên con đường lặp lại kiến trúc mạng, ngay cả khi không ai quan tâm, cũng không bận tâm, bởi vì đó chính là bản chất của đội ngũ phát triển Arweave: chủ nghĩa dài hạn. Nhờ vào chủ nghĩa dài hạn, Arweave đã được hâm mộ nồng nhiệt trong đợt bull market trước; cũng chính vì chủ nghĩa dài hạn, ngay cả khi rơi xuống đáy, Arweave vẫn có thể trụ vững qua vài vòng bull và bear. Chỉ có điều tương lai của lưu trữ phi tập trung có chỗ đứng cho Arweave hay không? Giá trị tồn tại của lưu trữ vĩnh viễn chỉ có thể được chứng minh qua thời gian.
Mạng chính Arweave từ phiên bản 1.5 đến phiên bản 2.9 gần đây, mặc dù đã mất đi sức nóng thảo luận trên thị trường, nhưng vẫn đang nỗ lực để cho một phạm vi rộng lớn hơn các thợ đào tham gia vào mạng với chi phí tối thiểu, và khuyến khích thợ đào tối đa hóa việc lưu trữ dữ liệu, giúp tăng cường tính bền vững của toàn bộ mạng. Arweave đã chọn hướng đi bảo thủ khi biết rõ mình không phù hợp với sở thích của thị trường, không ôm trọn cộng đồng thợ đào, hệ sinh thái hoàn toàn đình trệ, nâng cấp mạng chính với chi phí tối thiểu, liên tục giảm bớt rào cản phần cứng mà không làm tổn hại đến an ninh mạng.
Tóm tắt con đường nâng cấp từ 1.5-2.9
Phiên bản Arweave 1.5 đã lộ ra lỗ hổng cho phép thợ đào dựa vào việc xếp chồng GPU thay vì lưu trữ thực tế để tối ưu hóa tỷ lệ tạo khối. Để kiềm chế xu hướng này, phiên bản 1.7 đã giới thiệu thuật toán RandomX, hạn chế việc sử dụng sức mạnh tính toán chuyên dụng, thay vào đó yêu cầu CPU chung tham gia vào việc đào, từ đó làm suy yếu sự tập trung sức mạnh tính toán.
Trong phiên bản 2.0, Arweave áp dụng SPoA, chuyển chứng minh dữ liệu thành cấu trúc cây Merkle với đường dẫn đơn giản, và giới thiệu giao dịch định dạng 2 để giảm tải đồng bộ. Kiến trúc này đã giảm áp lực băng thông mạng, làm tăng khả năng hợp tác của các nút một cách đáng kể. Tuy nhiên, một số thợ mỏ vẫn có thể tránh trách nhiệm giữ dữ liệu thực tế thông qua chiến lược bể lưu trữ tốc độ cao tập trung.
Để khắc phục sự thiên lệch này, 2.4 đã ra mắt cơ chế SPoRA, giới thiệu chỉ mục toàn cầu và truy cập ngẫu nhiên bằng hàm băm chậm, yêu cầu thợ mỏ phải thực sự nắm giữ các khối dữ liệu để tham gia vào việc tạo khối hiệu quả, từ đó làm suy yếu hiệu ứng chồng chất sức mạnh tính toán từ cơ chế. Kết quả là, các thợ mỏ bắt đầu chú ý đến tốc độ truy cập lưu trữ, thúc đẩy việc ứng dụng SSD và thiết bị đọc ghi tốc độ cao. 2.6 giới thiệu chuỗi băm để kiểm soát nhịp độ tạo khối, cân bằng lợi ích biên của thiết bị hiệu suất cao, cung cấp không gian tham gia công bằng cho các thợ mỏ nhỏ và vừa.
Các phiên bản tiếp theo sẽ tăng cường khả năng hợp tác mạng và đa dạng hóa lưu trữ: 2.7 tăng cường khai thác hợp tác và cơ chế pool, nâng cao sức cạnh tranh của các thợ mỏ nhỏ; 2.8 ra mắt cơ chế đóng gói phức hợp, cho phép các thiết bị lớn với tốc độ thấp tham gia linh hoạt; 2.9 thì áp dụng quy trình đóng gói mới theo định dạng replica_2_9, nâng cao đáng kể hiệu suất và giảm sự phụ thuộc vào tính toán, hoàn thành mô hình khai thác hướng dữ liệu.
Tổng thể mà nói, lộ trình nâng cấp của Arweave rõ ràng thể hiện chiến lược dài hạn hướng đến lưu trữ: trong khi liên tục chống lại xu hướng tập trung sức mạnh tính toán, vẫn giảm thiểu rào cản tham gia, đảm bảo khả năng vận hành lâu dài của giao thức.
Walrus: Ôm ấp dữ liệu nóng là sự thổi phồng hay ẩn chứa điều gì?
Thiết kế của Walrus hoàn toàn khác với Filecoin và Arweave. Điểm khởi đầu của Filecoin là xây dựng một hệ thống lưu trữ phi tập trung có thể xác minh, với cái giá là lưu trữ dữ liệu lạnh; Điểm khởi đầu của Arweave là tạo ra một thư viện Alexandria trên chuỗi có thể lưu trữ dữ liệu vĩnh viễn, với cái giá là quá ít trường hợp sử dụng; Điểm khởi đầu của Walrus là tối ưu hóa chi phí lưu trữ cho giao thức lưu trữ dữ liệu nóng.
Ma cải biến mã sửa lỗi: Đổi mới chi phí hay chỉ là rượu cũ trong chai mới?
Trong thiết kế chi phí lưu trữ, Walrus cho rằng chi phí lưu trữ của FIL và Arweave là không hợp lý. Cả hai đều áp dụng kiến trúc sao chép hoàn toàn, với lợi thế chính là mỗi nút đều giữ bản sao hoàn chỉnh, có khả năng chống lỗi mạnh mẽ và tính độc lập giữa các nút. Kiến trúc này đảm bảo rằng ngay cả khi một số nút ngoại tuyến, mạng vẫn có tính khả dụng của dữ liệu. Tuy nhiên, điều này cũng có nghĩa là hệ thống cần có sự dư thừa bản sao để duy trì tính mạnh mẽ, từ đó làm tăng chi phí lưu trữ. Đặc biệt trong thiết kế của Arweave, cơ chế đồng thuận bản thân khuyến khích các nút lưu trữ dư thừa, nhằm tăng cường an toàn dữ liệu. So với đó, FIL có tính linh hoạt hơn trong việc kiểm soát chi phí, nhưng cái giá phải trả là một số lưu trữ chi phí thấp có thể có nguy cơ mất dữ liệu cao hơn. Walrus cố gắng tìm kiếm sự cân bằng giữa hai bên, cơ chế của nó kiểm soát chi phí sao chép trong khi tăng cường tính khả dụng thông qua phương pháp dư thừa có cấu trúc, từ đó thiết lập một con đường thỏa hiệp mới giữa khả năng có được dữ liệu và hiệu quả chi phí.
Công nghệ Redstuff do Walrus tự phát triển là công nghệ chủ chốt để giảm thiểu độ dư thừa của nút, nó có nguồn gốc từ mã Reed-Solomon ( RS ). Mã RS là một thuật toán mã sửa lỗi rất truyền thống, mã sửa lỗi là một kỹ thuật cho phép nhân đôi tập dữ liệu bằng cách thêm các đoạn dư thừa ( erasure code ), có thể được sử dụng để tái tạo dữ liệu gốc. Từ CD-ROM đến thông tin liên lạc vệ tinh và mã QR, nó thường được sử dụng trong cuộc sống hàng ngày.
Mã sửa lỗi cho phép người dùng lấy một khối, ví dụ như có kích thước 1MB, sau đó "mở rộng" nó thành 2MB, trong đó 1MB bổ sung được gọi là dữ liệu đặc biệt của mã sửa lỗi. Nếu bất kỳ byte nào trong khối bị mất, người dùng có thể dễ dàng khôi phục những byte này thông qua mã. Ngay cả khi một khối lên đến 1MB bị mất, toàn bộ khối vẫn có thể được khôi phục. Công nghệ tương tự cũng cho phép máy tính đọc tất cả dữ liệu trên CD-ROM, ngay cả khi nó đã bị hỏng.
Hiện tại, mã RS là mã được sử dụng phổ biến nhất. Cách thực hiện là bắt đầu từ k khối thông tin, xây dựng đa thức liên quan và đánh giá nó tại các tọa độ x khác nhau để thu được các khối mã. Sử dụng mã sửa lỗi RS, khả năng mất một khối dữ liệu lớn do lấy mẫu ngẫu nhiên là rất nhỏ.
Điểm đặc biệt nhất của thuật toán mã hóa RedStuff là gì? Bằng cách cải tiến thuật toán mã hóa sửa lỗi, Walrus có thể nhanh chóng và đáng tin cậy mã hóa các khối dữ liệu phi cấu trúc thành các phân đoạn nhỏ hơn, những phân đoạn này sẽ được lưu trữ phân tán trong một mạng lưới nút lưu trữ. Ngay cả khi mất đến hai phần ba số phân đoạn, vẫn có thể sử dụng một phần phân đoạn để nhanh chóng tái cấu trúc lại khối dữ liệu gốc. Điều này trở nên khả thi trong khi giữ cho hệ số sao chép chỉ từ 4 đến 5 lần.
Do đó, việc định nghĩa Walrus là một giao thức phục hồi và dư thừa nhẹ được thiết kế lại xoay quanh bối cảnh Phi tập trung là hợp lý. So với mã sửa lỗi truyền thống ( như Reed-Solomon ), RedStuff không còn theo đuổi sự nhất quán toán học nghiêm ngặt, mà thay vào đó thực hiện sự cân nhắc thực tế đối với phân phối dữ liệu, xác minh lưu trữ và chi phí tính toán. Mô hình này từ bỏ cơ chế giải mã tức thì cần thiết cho việc lập lịch tập trung, thay vào đó thông qua việc xác minh Proof trên chuỗi để kiểm tra xem các nút có lưu trữ bản sao dữ liệu cụ thể hay không, từ đó thích ứng với cấu trúc mạng động và biên hóa hơn.
Cốt lõi thiết kế của RedStuff là chia dữ liệu thành hai loại: lát chính và lát phụ. Lát chính được sử dụng để phục hồi dữ liệu gốc, việc tạo ra và phân phối của nó bị ràng buộc nghiêm ngặt, ngưỡng phục hồi là f+1, và cần có 2f+1 chữ ký làm chứng nhận khả dụng; lát phụ được tạo ra thông qua các phép toán đơn giản như kết hợp XOR, có tác dụng cung cấp khả năng chịu lỗi linh hoạt, nâng cao độ bền của toàn bộ hệ thống. Cấu trúc này về bản chất đã giảm yêu cầu về tính nhất quán của dữ liệu - cho phép các nút khác nhau lưu trữ các phiên bản dữ liệu khác nhau trong thời gian ngắn, nhấn mạnh "tính nhất quán cuối cùng" như một con đường thực hành. Mặc dù tương tự như yêu cầu lỏng lẻo đối với các khối hồi cứu trong các hệ thống như Arweave, đã đạt được một số hiệu quả trong việc giảm tải cho mạng, nhưng đồng thời cũng làm yếu đi sự đảm bảo về khả dụng và tính toàn vẹn của dữ liệu ngay lập tức.
Điều không thể bỏ qua là, mặc dù RedStuff đã đạt được lưu trữ hiệu quả trong môi trường có hiệu suất tính toán thấp và băng thông thấp, nhưng về bản chất nó vẫn thuộc về một "biến thể" của hệ thống mã sửa lỗi. Nó hy sinh một phần tính xác định khi đọc dữ liệu để đổi lấy việc kiểm soát chi phí và khả năng mở rộng trong môi trường phi tập trung. Tuy nhiên, ở cấp độ ứng dụng, liệu kiến trúc này có thể hỗ trợ cho các tình huống dữ liệu quy mô lớn và tương tác tần suất cao vẫn còn chờ xem. Hơn nữa, RedStuff thực sự chưa vượt qua được thách thức về tính toán mã mã sửa lỗi lâu dài, mà là thông qua chiến lược cấu trúc để tránh các điểm liên kết cao trong kiến trúc truyền thống, và tính đổi mới của nó chủ yếu thể hiện ở mặt tối ưu hóa kết hợp trong kỹ thuật, chứ không phải là sự đột phá ở cấp độ thuật toán cơ bản.
Do đó, RedStuff giống như một "sự cải tiến hợp lý" đối với môi trường thực tế lưu trữ phi tập trung hiện tại. Nó thực sự mang lại cải tiến về chi phí dư thừa và tải trọng vận hành, cho phép các thiết bị biên và nút không hiệu suất cao tham gia vào các nhiệm vụ lưu trữ dữ liệu. Nhưng trong các tình huống kinh doanh yêu cầu ứng dụng quy mô lớn, thích ứng tính toán tổng quát và yêu cầu nhất quán cao hơn, ranh giới khả năng của nó vẫn khá rõ ràng. Điều này khiến cho sự đổi mới của Walrus giống như một sự cải tạo thích ứng của hệ thống công nghệ hiện có, chứ không phải là một bước đột phá quyết định thúc đẩy sự chuyển giao mô hình lưu trữ phi tập trung.
Sui và Walrus: Chuỗi công khai hiệu suất cao có thể thúc đẩy ứng dụng lưu trữ
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
14 thích
Phần thưởng
14
4
Chia sẻ
Bình luận
0/400
MEVHunterLucky
· 07-07 06:06
Hả, vẫn đang đầu tư vào lĩnh vực lưu trữ sao?
Xem bản gốcTrả lời0
OnchainHolmes
· 07-07 06:06
Fil ngay cả lưu trữ lạnh cũng không hoạt động, sản phẩm mới có khả thi không?
Xem bản gốcTrả lời0
ProxyCollector
· 07-07 05:52
Lĩnh vực lưu trữ cũng chỉ có vậy thôi.
Xem bản gốcTrả lời0
MondayYoloFridayCry
· 07-07 05:44
Dữ liệu lạnh lưu trữ trong thế giới tiền điện tử thật là một khối u độc.
Sự tiến hóa của lưu trữ phi tập trung: từ FIL đến Walrus - cuộc cách mạng công nghệ và triển vọng tương lai
Từ Filecoin, Arweave đến Walrus, Shelby: Quá trình phát triển và triển vọng tương lai của Phi tập trung lưu trữ
Lưu trữ từng là một trong những lĩnh vực nóng của ngành blockchain. Filecoin, như một dự án hàng đầu trong vòng thị trường tăng giá trước đó, đã có lúc đạt giá trị thị trường hơn một tỷ đô la. Arweave, đối thủ cạnh tranh với Filecoin, đã lấy lưu trữ vĩnh viễn làm điểm bán hàng, với giá trị thị trường cao nhất đạt 3,5 tỷ đô la. Tuy nhiên, khi tính khả dụng của lưu trữ dữ liệu lạnh bị nghi ngờ, triển vọng phát triển của lưu trữ phi tập trung cũng bị đặt dấu hỏi. Gần đây, sự xuất hiện của Walrus đã mang lại sự chú ý mới cho lĩnh vực lưu trữ đã im ắng từ lâu, trong khi dự án Shelby do Aptos và Jump Crypto hợp tác ra mắt, đang cố gắng đạt được những đột phá mới trong lĩnh vực lưu trữ dữ liệu nóng. Bài viết này sẽ bắt đầu từ quá trình phát triển của một vài dự án tiêu biểu này, phân tích con đường tiến hóa của lưu trữ phi tập trung, và thảo luận về triển vọng phát triển trong tương lai.
FIL: Bản chất đồng tiền khai thác dưới lớp áo lưu trữ
Filecoin là một trong những dự án blockchain nổi bật trong giai đoạn đầu, với định hướng phát triển xoay quanh Phi tập trung. Filecoin cố gắng chuyển đổi từ lưu trữ tập trung sang lưu trữ phi tập trung, nhưng trong quá trình này, những đánh đổi để đạt được phi tập trung cũng đã trở thành những điểm đau mà các dự án sau này cố gắng giải quyết.
IPFS: Kiến trúc Phi tập trung, nhưng bị hạn chế bởi nút thắt trong truyền tải
IPFS( Hệ thống tệp vũ trụ) ra mắt vào năm 2015, nhằm mục đích cách mạng hóa giao thức HTTP truyền thống thông qua địa chỉ hóa nội dung. Tuy nhiên, nhược điểm lớn nhất của IPFS là tốc độ truy xuất rất chậm. Trong thời đại mà các nhà cung cấp dịch vụ dữ liệu truyền thống có thể đạt được phản hồi trong mili giây, việc truy xuất một tệp từ IPFS vẫn mất hàng chục giây, điều này khiến nó khó có thể được áp dụng trong thực tế.
IPFS chủ yếu phù hợp với "dữ liệu lạnh", tức là nội dung tĩnh không thường xuyên thay đổi. Nhưng trong việc xử lý dữ liệu nóng, như trang web động, trò chơi trực tuyến hoặc ứng dụng AI, giao thức P2P không có lợi thế rõ rệt so với CDN truyền thống.
Mặc dù IPFS không phải là blockchain, nhưng thiết kế đồ thị có hướng không chu kỳ (DAG) mà nó áp dụng rất phù hợp với nhiều chuỗi công cộng và giao thức Web3, làm cho nó trở thành khung xây dựng cơ sở hạ tầng cho blockchain.
Logic của đồng tiền khai thác dưới lớp lưu trữ
Trong mô hình kinh tế token của Filecoin có ba vai trò chính: Người dùng trả phí để lưu trữ dữ liệu; Thợ đào lưu trữ nhận được phần thưởng token vì đã lưu trữ dữ liệu của người dùng; Thợ đào truy xuất cung cấp dữ liệu khi người dùng cần và nhận được phần thưởng.
Mô hình này tồn tại không gian tiềm ẩn cho hành vi xấu. Các thợ mỏ lưu trữ có thể lấp đầy dữ liệu rác sau khi cung cấp không gian lưu trữ để nhận thưởng. Do những dữ liệu rác này không được truy xuất, ngay cả khi mất đi cũng sẽ không kích hoạt cơ chế phạt. Điều này cho phép các thợ mỏ lưu trữ có thể xóa dữ liệu rác và lặp lại quy trình này. Đồng thuận chứng minh sao chép của Filecoin chỉ có thể đảm bảo rằng dữ liệu của người dùng không bị xóa trái phép, nhưng không thể ngăn chặn các thợ mỏ lấp đầy dữ liệu rác.
Việc vận hành của Filecoin phần lớn phụ thuộc vào sự đầu tư liên tục của các thợ mỏ vào kinh tế token, chứ không phải dựa trên nhu cầu thực sự của người dùng cuối đối với lưu trữ phân tán. Mặc dù dự án vẫn đang tiếp tục phát triển, nhưng ở giai đoạn hiện tại, việc xây dựng hệ sinh thái của Filecoin phù hợp hơn với định nghĩa "logic thợ đào" hơn là "ứng dụng thúc đẩy" cho các dự án lưu trữ.
Arweave: Thành công nhờ chủ nghĩa dài hạn, thất bại vì chủ nghĩa dài hạn
Nếu nói rằng mục tiêu thiết kế của Filecoin là xây dựng một "đám mây dữ liệu" phi tập trung có thể khuyến khích và có thể chứng minh, thì Arweave lại đi theo một hướng cực đoan khác trong việc lưu trữ: cung cấp khả năng lưu trữ vĩnh viễn cho dữ liệu. Arweave không cố gắng xây dựng một nền tảng tính toán phân tán, toàn bộ hệ thống của nó xoay quanh một giả thuyết cốt lõi - dữ liệu quan trọng nên được lưu trữ một lần và mãi mãi tồn tại trên mạng. Chủ nghĩa dài hạn cực đoan này khiến Arweave khác biệt hoàn toàn với Filecoin từ cơ chế đến mô hình khuyến khích, từ yêu cầu phần cứng đến góc độ kể chuyện.
Arweave lấy Bitcoin làm đối tượng học tập, cố gắng tối ưu hóa mạng lưu trữ vĩnh viễn của mình trong những chu kỳ dài tính bằng năm. Arweave không quan tâm đến tiếp thị, cũng không quan tâm đến đối thủ và xu hướng phát triển của thị trường. Nó chỉ đơn giản là tiếp tục tiến lên trên con đường lặp lại kiến trúc mạng, ngay cả khi không ai quan tâm, cũng không bận tâm, bởi vì đó chính là bản chất của đội ngũ phát triển Arweave: chủ nghĩa dài hạn. Nhờ vào chủ nghĩa dài hạn, Arweave đã được hâm mộ nồng nhiệt trong đợt bull market trước; cũng chính vì chủ nghĩa dài hạn, ngay cả khi rơi xuống đáy, Arweave vẫn có thể trụ vững qua vài vòng bull và bear. Chỉ có điều tương lai của lưu trữ phi tập trung có chỗ đứng cho Arweave hay không? Giá trị tồn tại của lưu trữ vĩnh viễn chỉ có thể được chứng minh qua thời gian.
Mạng chính Arweave từ phiên bản 1.5 đến phiên bản 2.9 gần đây, mặc dù đã mất đi sức nóng thảo luận trên thị trường, nhưng vẫn đang nỗ lực để cho một phạm vi rộng lớn hơn các thợ đào tham gia vào mạng với chi phí tối thiểu, và khuyến khích thợ đào tối đa hóa việc lưu trữ dữ liệu, giúp tăng cường tính bền vững của toàn bộ mạng. Arweave đã chọn hướng đi bảo thủ khi biết rõ mình không phù hợp với sở thích của thị trường, không ôm trọn cộng đồng thợ đào, hệ sinh thái hoàn toàn đình trệ, nâng cấp mạng chính với chi phí tối thiểu, liên tục giảm bớt rào cản phần cứng mà không làm tổn hại đến an ninh mạng.
Tóm tắt con đường nâng cấp từ 1.5-2.9
Phiên bản Arweave 1.5 đã lộ ra lỗ hổng cho phép thợ đào dựa vào việc xếp chồng GPU thay vì lưu trữ thực tế để tối ưu hóa tỷ lệ tạo khối. Để kiềm chế xu hướng này, phiên bản 1.7 đã giới thiệu thuật toán RandomX, hạn chế việc sử dụng sức mạnh tính toán chuyên dụng, thay vào đó yêu cầu CPU chung tham gia vào việc đào, từ đó làm suy yếu sự tập trung sức mạnh tính toán.
Trong phiên bản 2.0, Arweave áp dụng SPoA, chuyển chứng minh dữ liệu thành cấu trúc cây Merkle với đường dẫn đơn giản, và giới thiệu giao dịch định dạng 2 để giảm tải đồng bộ. Kiến trúc này đã giảm áp lực băng thông mạng, làm tăng khả năng hợp tác của các nút một cách đáng kể. Tuy nhiên, một số thợ mỏ vẫn có thể tránh trách nhiệm giữ dữ liệu thực tế thông qua chiến lược bể lưu trữ tốc độ cao tập trung.
Để khắc phục sự thiên lệch này, 2.4 đã ra mắt cơ chế SPoRA, giới thiệu chỉ mục toàn cầu và truy cập ngẫu nhiên bằng hàm băm chậm, yêu cầu thợ mỏ phải thực sự nắm giữ các khối dữ liệu để tham gia vào việc tạo khối hiệu quả, từ đó làm suy yếu hiệu ứng chồng chất sức mạnh tính toán từ cơ chế. Kết quả là, các thợ mỏ bắt đầu chú ý đến tốc độ truy cập lưu trữ, thúc đẩy việc ứng dụng SSD và thiết bị đọc ghi tốc độ cao. 2.6 giới thiệu chuỗi băm để kiểm soát nhịp độ tạo khối, cân bằng lợi ích biên của thiết bị hiệu suất cao, cung cấp không gian tham gia công bằng cho các thợ mỏ nhỏ và vừa.
Các phiên bản tiếp theo sẽ tăng cường khả năng hợp tác mạng và đa dạng hóa lưu trữ: 2.7 tăng cường khai thác hợp tác và cơ chế pool, nâng cao sức cạnh tranh của các thợ mỏ nhỏ; 2.8 ra mắt cơ chế đóng gói phức hợp, cho phép các thiết bị lớn với tốc độ thấp tham gia linh hoạt; 2.9 thì áp dụng quy trình đóng gói mới theo định dạng replica_2_9, nâng cao đáng kể hiệu suất và giảm sự phụ thuộc vào tính toán, hoàn thành mô hình khai thác hướng dữ liệu.
Tổng thể mà nói, lộ trình nâng cấp của Arweave rõ ràng thể hiện chiến lược dài hạn hướng đến lưu trữ: trong khi liên tục chống lại xu hướng tập trung sức mạnh tính toán, vẫn giảm thiểu rào cản tham gia, đảm bảo khả năng vận hành lâu dài của giao thức.
Walrus: Ôm ấp dữ liệu nóng là sự thổi phồng hay ẩn chứa điều gì?
Thiết kế của Walrus hoàn toàn khác với Filecoin và Arweave. Điểm khởi đầu của Filecoin là xây dựng một hệ thống lưu trữ phi tập trung có thể xác minh, với cái giá là lưu trữ dữ liệu lạnh; Điểm khởi đầu của Arweave là tạo ra một thư viện Alexandria trên chuỗi có thể lưu trữ dữ liệu vĩnh viễn, với cái giá là quá ít trường hợp sử dụng; Điểm khởi đầu của Walrus là tối ưu hóa chi phí lưu trữ cho giao thức lưu trữ dữ liệu nóng.
Ma cải biến mã sửa lỗi: Đổi mới chi phí hay chỉ là rượu cũ trong chai mới?
Trong thiết kế chi phí lưu trữ, Walrus cho rằng chi phí lưu trữ của FIL và Arweave là không hợp lý. Cả hai đều áp dụng kiến trúc sao chép hoàn toàn, với lợi thế chính là mỗi nút đều giữ bản sao hoàn chỉnh, có khả năng chống lỗi mạnh mẽ và tính độc lập giữa các nút. Kiến trúc này đảm bảo rằng ngay cả khi một số nút ngoại tuyến, mạng vẫn có tính khả dụng của dữ liệu. Tuy nhiên, điều này cũng có nghĩa là hệ thống cần có sự dư thừa bản sao để duy trì tính mạnh mẽ, từ đó làm tăng chi phí lưu trữ. Đặc biệt trong thiết kế của Arweave, cơ chế đồng thuận bản thân khuyến khích các nút lưu trữ dư thừa, nhằm tăng cường an toàn dữ liệu. So với đó, FIL có tính linh hoạt hơn trong việc kiểm soát chi phí, nhưng cái giá phải trả là một số lưu trữ chi phí thấp có thể có nguy cơ mất dữ liệu cao hơn. Walrus cố gắng tìm kiếm sự cân bằng giữa hai bên, cơ chế của nó kiểm soát chi phí sao chép trong khi tăng cường tính khả dụng thông qua phương pháp dư thừa có cấu trúc, từ đó thiết lập một con đường thỏa hiệp mới giữa khả năng có được dữ liệu và hiệu quả chi phí.
Công nghệ Redstuff do Walrus tự phát triển là công nghệ chủ chốt để giảm thiểu độ dư thừa của nút, nó có nguồn gốc từ mã Reed-Solomon ( RS ). Mã RS là một thuật toán mã sửa lỗi rất truyền thống, mã sửa lỗi là một kỹ thuật cho phép nhân đôi tập dữ liệu bằng cách thêm các đoạn dư thừa ( erasure code ), có thể được sử dụng để tái tạo dữ liệu gốc. Từ CD-ROM đến thông tin liên lạc vệ tinh và mã QR, nó thường được sử dụng trong cuộc sống hàng ngày.
Mã sửa lỗi cho phép người dùng lấy một khối, ví dụ như có kích thước 1MB, sau đó "mở rộng" nó thành 2MB, trong đó 1MB bổ sung được gọi là dữ liệu đặc biệt của mã sửa lỗi. Nếu bất kỳ byte nào trong khối bị mất, người dùng có thể dễ dàng khôi phục những byte này thông qua mã. Ngay cả khi một khối lên đến 1MB bị mất, toàn bộ khối vẫn có thể được khôi phục. Công nghệ tương tự cũng cho phép máy tính đọc tất cả dữ liệu trên CD-ROM, ngay cả khi nó đã bị hỏng.
Hiện tại, mã RS là mã được sử dụng phổ biến nhất. Cách thực hiện là bắt đầu từ k khối thông tin, xây dựng đa thức liên quan và đánh giá nó tại các tọa độ x khác nhau để thu được các khối mã. Sử dụng mã sửa lỗi RS, khả năng mất một khối dữ liệu lớn do lấy mẫu ngẫu nhiên là rất nhỏ.
Điểm đặc biệt nhất của thuật toán mã hóa RedStuff là gì? Bằng cách cải tiến thuật toán mã hóa sửa lỗi, Walrus có thể nhanh chóng và đáng tin cậy mã hóa các khối dữ liệu phi cấu trúc thành các phân đoạn nhỏ hơn, những phân đoạn này sẽ được lưu trữ phân tán trong một mạng lưới nút lưu trữ. Ngay cả khi mất đến hai phần ba số phân đoạn, vẫn có thể sử dụng một phần phân đoạn để nhanh chóng tái cấu trúc lại khối dữ liệu gốc. Điều này trở nên khả thi trong khi giữ cho hệ số sao chép chỉ từ 4 đến 5 lần.
Do đó, việc định nghĩa Walrus là một giao thức phục hồi và dư thừa nhẹ được thiết kế lại xoay quanh bối cảnh Phi tập trung là hợp lý. So với mã sửa lỗi truyền thống ( như Reed-Solomon ), RedStuff không còn theo đuổi sự nhất quán toán học nghiêm ngặt, mà thay vào đó thực hiện sự cân nhắc thực tế đối với phân phối dữ liệu, xác minh lưu trữ và chi phí tính toán. Mô hình này từ bỏ cơ chế giải mã tức thì cần thiết cho việc lập lịch tập trung, thay vào đó thông qua việc xác minh Proof trên chuỗi để kiểm tra xem các nút có lưu trữ bản sao dữ liệu cụ thể hay không, từ đó thích ứng với cấu trúc mạng động và biên hóa hơn.
Cốt lõi thiết kế của RedStuff là chia dữ liệu thành hai loại: lát chính và lát phụ. Lát chính được sử dụng để phục hồi dữ liệu gốc, việc tạo ra và phân phối của nó bị ràng buộc nghiêm ngặt, ngưỡng phục hồi là f+1, và cần có 2f+1 chữ ký làm chứng nhận khả dụng; lát phụ được tạo ra thông qua các phép toán đơn giản như kết hợp XOR, có tác dụng cung cấp khả năng chịu lỗi linh hoạt, nâng cao độ bền của toàn bộ hệ thống. Cấu trúc này về bản chất đã giảm yêu cầu về tính nhất quán của dữ liệu - cho phép các nút khác nhau lưu trữ các phiên bản dữ liệu khác nhau trong thời gian ngắn, nhấn mạnh "tính nhất quán cuối cùng" như một con đường thực hành. Mặc dù tương tự như yêu cầu lỏng lẻo đối với các khối hồi cứu trong các hệ thống như Arweave, đã đạt được một số hiệu quả trong việc giảm tải cho mạng, nhưng đồng thời cũng làm yếu đi sự đảm bảo về khả dụng và tính toàn vẹn của dữ liệu ngay lập tức.
Điều không thể bỏ qua là, mặc dù RedStuff đã đạt được lưu trữ hiệu quả trong môi trường có hiệu suất tính toán thấp và băng thông thấp, nhưng về bản chất nó vẫn thuộc về một "biến thể" của hệ thống mã sửa lỗi. Nó hy sinh một phần tính xác định khi đọc dữ liệu để đổi lấy việc kiểm soát chi phí và khả năng mở rộng trong môi trường phi tập trung. Tuy nhiên, ở cấp độ ứng dụng, liệu kiến trúc này có thể hỗ trợ cho các tình huống dữ liệu quy mô lớn và tương tác tần suất cao vẫn còn chờ xem. Hơn nữa, RedStuff thực sự chưa vượt qua được thách thức về tính toán mã mã sửa lỗi lâu dài, mà là thông qua chiến lược cấu trúc để tránh các điểm liên kết cao trong kiến trúc truyền thống, và tính đổi mới của nó chủ yếu thể hiện ở mặt tối ưu hóa kết hợp trong kỹ thuật, chứ không phải là sự đột phá ở cấp độ thuật toán cơ bản.
Do đó, RedStuff giống như một "sự cải tiến hợp lý" đối với môi trường thực tế lưu trữ phi tập trung hiện tại. Nó thực sự mang lại cải tiến về chi phí dư thừa và tải trọng vận hành, cho phép các thiết bị biên và nút không hiệu suất cao tham gia vào các nhiệm vụ lưu trữ dữ liệu. Nhưng trong các tình huống kinh doanh yêu cầu ứng dụng quy mô lớn, thích ứng tính toán tổng quát và yêu cầu nhất quán cao hơn, ranh giới khả năng của nó vẫn khá rõ ràng. Điều này khiến cho sự đổi mới của Walrus giống như một sự cải tạo thích ứng của hệ thống công nghệ hiện có, chứ không phải là một bước đột phá quyết định thúc đẩy sự chuyển giao mô hình lưu trữ phi tập trung.
Sui và Walrus: Chuỗi công khai hiệu suất cao có thể thúc đẩy ứng dụng lưu trữ