Un análisis profundo de la disponibilidad de datos en Filecoin
Nota del editor: Este artículo es una reimpresión del contenido original publicado por Turan Vural Yuki Yuminaga de Fenbushi Capital el 5 de abril de 2024. Fundada en 2015, Fenbushi Capital es la empresa de gestión de activos blockchain líder en Asia con 10 billones de TWD en activos bajo gestión. La empresa tiene como objetivo desempeñar un papel importante en la configuración del futuro de la tecnología blockchain en una variedad de industrias a través de la investigación y la inversión. Este artículo es un ejemplo de estos esfuerzos y representa las opiniones independientes de estos autores, quienes han acordado publicarlas aquí.
La disponibilidad de datos (DA) es una tecnología fundamental para el escalamiento de Ethereum que permite a los nodos verificar de manera eficiente que los datos están disponibles para la red sin alojar los datos en cuestión. Esto es fundamental para crear de manera eficiente el escalamiento continuo y otras formas de escalamiento vertical, lo que permite que los nodos de ejecución se aseguren de que los datos de las transacciones estén disponibles durante la liquidación. Esto también es fundamental para la fragmentación y otras formas de escalamiento horizontal (actualizaciones futuras planificadas para la red Ethereum), ya que los nodos deben demostrar que los datos de las transacciones (o blobs) almacenados en un fragmento de red están realmente disponibles para la red.
Recientemente se han discutido y lanzado varias soluciones DA (por ejemplo, Celestia, EigenDA, Avail), todas las cuales apuntan a proporcionar una infraestructura segura y de alto rendimiento para que las aplicaciones publiquen DA.
La ventaja de una solución DA externa sobre las L1 como Ethereum es que proporciona un portador económico y de alto rendimiento para los datos en cadena. Las soluciones DA suelen constar de sus propias cadenas públicas diseñadas para permitir un almacenamiento económico y sin permisos. Incluso con modificaciones, alojar datos de forma nativa desde la cadena de bloques sigue siendo extremadamente ineficiente.
Teniendo en cuenta esto, nos parece muy intuitivo explorar soluciones de optimización del almacenamiento como Filecoin como base para la capa DA. Filecoin utiliza su cadena de bloques para coordinar las transacciones de almacenamiento entre los usuarios y los proveedores de almacenamiento, pero permite que los datos se almacenen fuera de la cadena.
En esta publicación, investigamos la viabilidad de una solución DA construida sobre una red de almacenamiento descentralizada (DSN). Consideramos específicamente Filecoin, ya que es la DSN más adoptada hasta la fecha. Describimos las oportunidades que traería una solución de este tipo y los desafíos que habría que superar para construirla.
La capa DA proporciona las siguientes funciones a los servicios que dependen de ella:
1. Seguridad del usuario :Ningún nodo puede estar seguro de que los datos no disponibles estén disponibles.
2. Seguridad global :Todos los nodos, excepto unos pocos, están de acuerdo sobre la disponibilidad o indisponibilidad de los datos.
3. Capacidades eficientes de recuperación de datos.
Todo esto debe hacerse de manera eficiente para permitir la escalabilidad. La capa DA proporciona un mayor rendimiento a un menor costo en los tres puntos anteriores. Por ejemplo, cualquier nodo puede solicitar una copia completa de los datos para demostrar la custodia, pero esto es ineficiente. Al proporcionar un sistema que proporciona los tres puntos anteriores, implementamos una capa DA que proporciona la seguridad necesaria para que L2 se coordine con L1 y proporciona un límite inferior más fuerte en presencia de una mayoría maliciosa.
Alojamiento de datos
Los datos publicados en una solución DA tienen una vida útil válida: lo suficientemente larga como para resolver una disputa o verificar una transición de estado. Los datos de transacciones solo deben estar disponibles el tiempo suficiente para verificar una transición de estado correcta o para brindarle a un validador la oportunidad suficiente de construir una prueba de fraude. Al momento de escribir este artículo, los calldata de Ethereum son la solución más utilizada para proyectos que necesitan disponibilidad de datos (rollups).
Verificación eficiente de datos
El muestreo de disponibilidad de datos (DAS) es un enfoque estándar para resolver el problema de DA. Tiene el beneficio de seguridad adicional de mejorar la capacidad de los actores de la red para verificar la información de estado de sus pares. Sin embargo, depende de los nodos para realizar el muestreo: responder a las solicitudes de DAS es necesario para garantizar que las transacciones extraídas no sean rechazadas, pero los nodos no tienen incentivos positivos o negativos para solicitar muestras. Desde la perspectiva del nodo de muestra solicitante, no existe una penalización negativa por no realizar DAS. Por ejemplo, Celestia proporciona la primera y única implementación de cliente ligero que realiza DAS, lo que proporciona a los usuarios supuestos de seguridad más sólidos y reduce los costos de verificación de datos.
Acceso eficiente
DA debe proporcionar un acceso eficiente a los datos para los proyectos que lo utilizan. Un DA lento puede convertirse en un cuello de botella para los servicios que dependen de él, lo que provoca ineficiencias en el mejor de los casos y errores del sistema en el peor.
Red de almacenamiento descentralizada
La red de almacenamiento descentralizada (DSN, como se describe en el informe técnico de Filecoin) es una red sin permisos de proveedores de almacenamiento que brindan servicios de almacenamiento a los usuarios de la red. De manera informal, permite que los proveedores de almacenamiento independientes coordinen transacciones de almacenamiento con los usuarios que necesitan servicios de almacenamiento y brinda almacenamiento de datos económico y resistente a los usuarios que buscan servicios de almacenamiento económicos. Esto se coordina a través de una cadena de bloques que registra las transacciones de almacenamiento y admite la ejecución de contratos inteligentes.
El esquema DSN es una tupla de tres protocolos: Put, Get y Manage. Esta tupla tiene propiedades como garantías de tolerancia a fallas e incentivos de participación.
Poner(datos) → clave
Para almacenar datos bajo una clave única, el cliente realiza una operación Put. Para ello, especifica el período durante el cual se almacenarán los datos en la red, la cantidad de copias de los datos que se almacenarán para redundancia y un precio negociado con el proveedor de almacenamiento.
Obtener(clave) → datos
El cliente ejecuta Get para recuperar los datos almacenados bajo la clave.
Administrar
Los participantes de la red invocan el protocolo de gestión para coordinar el espacio de almacenamiento y los servicios proporcionados por los proveedores y para corregir errores. En el caso de Filecoin, esto se gestiona a través de la cadena de bloques. La cadena de bloques registra las transacciones de datos entre los usuarios y los proveedores de datos y prueba que los datos se almacenan correctamente, lo que garantiza que las transacciones de datos se mantengan. Las pruebas de que los datos se almacenan correctamente se demuestran mediante la publicación de pruebas generadas por los proveedores de datos en respuesta a los desafíos de la red. Los errores de almacenamiento ocurren cuando los proveedores de almacenamiento no generan pruebas de replicación o pruebas de espacio-tiempo de manera oportuna como lo requiere el protocolo de gestión, lo que da como resultado que se reduzca la participación de los proveedores de almacenamiento. Si varios proveedores alojan copias de los datos en la red, las transacciones se pueden reparar por sí solas al encontrar nuevos proveedores de almacenamiento para completar la transacción de almacenamiento.
Oportunidades DSN
Lo que el proyecto DA ha hecho hasta ahora es transformar las cadenas de bloques en plataformas de almacenamiento en caliente. Dado que DSN está optimizado para el almacenamiento, en lugar de transformar las cadenas de bloques en plataformas de almacenamiento, podemos simplemente transformar las plataformas de almacenamiento en plataformas que proporcionen disponibilidad de datos. La garantía proporcionada por los proveedores de almacenamiento en forma de tokens FIL nativos puede proporcionar seguridad criptoeconómica para garantizar el almacenamiento de datos. Finalmente, la programabilidad de las transacciones de almacenamiento puede proporcionar flexibilidad en términos de disponibilidad de datos.
La motivación más fuerte para convertir la funcionalidad de DSN para resolver el problema de DA es reducir el costo de almacenamiento de datos bajo una solución DA. Como se analiza a continuación, el costo de almacenar datos en Filecoin es mucho más barato que almacenar datos en Ethereum. Dado el precio actual de ETH/USD, cuesta más de $3 millones escribir 1 GB de datos de llamadas en Ethereum, y se recorta después de 21 días. Esta tarifa de datos de llamadas puede representar más de la mitad del costo de transacción de la acumulación basada en Ethereum. Sin embargo, 1 GB de almacenamiento en Filecoin cuesta menos de $0.0002 por mes. Asegurar DA a este precio o a cualquier precio similar reducirá los costos de transacción para los usuarios y ayudará a mejorar el rendimiento y la escalabilidad de Web3.
Seguridad económica
En Filecoin, proporcionar espacio de almacenamiento requiere una garantía. Si el proveedor no cumple con la transacción o no respeta las garantías de la red, la garantía se reducirá. Los proveedores de almacenamiento que no brinden servicios se enfrentarán al riesgo de perder su garantía y las ganancias que hayan obtenido.
Ajuste del mecanismo de incentivos
Muchos de los incentivos del protocolo Filecoin se alinean con los objetivos de DA. Filecoin ofrece desincentivos para el comportamiento malicioso o perezoso: durante el consenso, los proveedores de almacenamiento deben proporcionar de manera proactiva pruebas de almacenamiento en forma de pruebas de replicación y pruebas de espacio-tiempo, demostrando continuamente la existencia de almacenamiento sin asumir una mayoría honesta. Si los proveedores de almacenamiento no proporcionan pruebas, serán eliminados, eliminados del consenso y sujetos a otras sanciones. Las soluciones de DA actuales carecen de incentivos para que los nodos realicen DAS y solo pueden depender de un comportamiento altruista temporal para demostrar la DA.
Programabilidad
La capacidad de personalizar las transacciones de datos también hace que DSN sea una plataforma DA atractiva. Las transacciones de datos pueden tener diferentes duraciones, lo que permite a los usuarios de DA basados en DSN pagar solo las tarifas de DA que necesitan, y la tolerancia a fallas también se puede ajustar estableciendo la cantidad de réplicas que se almacenarán en la red. Se admite una mayor personalización a través de contratos inteligentes (actores) en Filecoin, que se ejecutan en FEVM. También promueve el creciente ecosistema de DApps de Filecoin, desde soluciones de almacenamiento que priorizan la computación como Bacalhau hasta soluciones de staking de liquidez y DeFi como Glif. Retriev proporciona recuperación vinculada a incentivos con árbitros con licencia a través de Filecoin Actors. La programabilidad de Filecoins se puede utilizar para personalizar los requisitos de DA requeridos por diferentes soluciones para que las plataformas que dependen de DA no necesiten pagar por más DA de lo que necesitan.
Desafíos de la arquitectura DA basada en DSN
En nuestra investigación, encontramos desafíos importantes que deben superarse antes de crear servicios DA en DSN. Ahora analizaremos la viabilidad de la implementación y nos centraremos en Filecoin.
Prueba de demora
Las pruebas criptográficas de la integridad de las transacciones y los datos almacenados en Filecoin requieren tiempo para demostrarse. Cuando los datos se envían a la red, se dividen en sectores de 32 GB y se encapsulan. La encapsulación de datos es la base de la Prueba de replicación (PoRep), que prueba que un proveedor de almacenamiento almacena una o más copias únicas de los datos, y la Prueba de espacio-tiempo (PoST), que prueba que un proveedor de almacenamiento almacena continuamente una copia única durante toda la transacción de almacenamiento. La encapsulación debe ser computacionalmente costosa para garantizar que los proveedores de almacenamiento no encapsulen los datos a pedido, violando así el PoReP requerido. Cuando el protocolo solicita periódicamente a los proveedores de almacenamiento pruebas de almacenamiento único y continuo, el tiempo de seguridad requerido para la encapsulación debe ser más largo que la ventana de respuesta para que los proveedores de almacenamiento no puedan falsificar temporalmente pruebas o copias. Por lo tanto, los proveedores pueden tardar unas tres horas en encapsular un sector de datos.
Umbral de almacenamiento
Dado que el empaquetado es costoso desde el punto de vista computacional, el tamaño del sector de los datos empaquetados debe ser económicamente viable. Para los proveedores de almacenamiento, el precio del almacenamiento debe justificar sus costos de empaquetado y, de manera similar, el costo de almacenamiento de datos resultante debe ser lo suficientemente bajo (en este caso, alrededor de bloques de 32 GB) para que los usuarios estén dispuestos a almacenar datos en Filecoin. Si bien se pueden empaquetar sectores más pequeños, esto aumentará el precio del almacenamiento para compensar a los proveedores de almacenamiento. Para abordar este problema, los agregadores de datos recopilan bloques de datos más pequeños de los usuarios y los envían a Filecoin como bloques cercanos a los 32 GB. Los agregadores de datos se comprometen con los datos del usuario a través de pruebas de inclusión de segmentos (PoDSI) y CID de subbloques (pCID), donde PoDSI garantiza que los datos del usuario están contenidos en sectores y los pCID se utilizan cuando los usuarios recuperan datos de la red.
Restricciones del consenso
El mecanismo de consenso de Filecoin, Expected Consensus, tiene un tiempo de bloque de 30 segundos y un tiempo de finalidad de varias horas, que puede mejorarse en el futuro cercano (consulte FIP-0086 para conocer la rápida finalidad de Filecoin). Esto generalmente es demasiado lento para soportar el rendimiento de transacciones requerido por la Capa 2, que depende de DA para procesar los datos de las transacciones. El tiempo de bloque de Filecoin está limitado por el piso de hardware de los proveedores de almacenamiento. Cuanto más corto sea el tiempo de bloque, más difícil será para los proveedores de almacenamiento generar y proporcionar pruebas de almacenamiento, y más penalizaciones por error recibirán los proveedores de almacenamiento por no cumplir con la ventana de prueba para almacenar datos correctamente. Para superar este desafío, se pueden usar subredes de Interstellar Consensus (IPC) para acortar los tiempos de consenso. IPC usa un consenso similar a Tendermint y DRAND para la aleatoriedad: en el caso en que DRAND se convierta en un cuello de botella, podremos lograr tiempos de bloque de 3 segundos usando la subred IPC; En el caso de los cuellos de botella de Tendermint, las PoC como Narwhal han logrado tiempos de bloque de cientos de milisegundos.
Velocidad de recuperación
El último obstáculo es la recuperación. De las limitaciones anteriores, podemos inferir que Filecoin es adecuado para el almacenamiento en frío o en caliente. Sin embargo, los datos de DA son importantes y deben admitir aplicaciones de alto rendimiento. La recuperación incentivada es difícil en Filecoin; los datos deben revelarse antes de proporcionarse al usuario, lo que aumenta la latencia. Actualmente, la recuperación rápida se logra a través de acuerdos de nivel de servicio o el almacenamiento de datos no sellados con sectores sellados, ninguno de los cuales es confiable en la arquitectura de aplicaciones seguras y sin permisos de Filecoin. En particular, las pruebas de recuperación pueden garantizar la recuperación a través de FVM, y la recuperación rápida vinculada a incentivos en Filecoin sigue siendo un área para una mayor exploración.
análisis de costos
En esta sección, analizamos los costos de estos factores de diseño. Mostramos el costo de almacenar 32 GB como datos de llamadas de Ethereum, datos de blob de Celestia, datos de blob de EigenDA y sectores en Filecoin (utilizando precios de mercado casi actuales).
El análisis destaca el precio de los calldata de Ethereum: $100 millones por 32 GB de datos. Este precio muestra el costo de seguridad detrás del consenso de Ethereum y se ve afectado por las fluctuaciones en los precios de Ethereum y Gas. La actualización de Dencun introdujo Proto-Danksharding (EIP-4844), introdujo transacciones Blob con un objetivo de 3 blobs por bloque, cada uno de aproximadamente 125 KB de tamaño, e introdujo precios variables de Gas Blob, manteniendo así el número objetivo de blobs por bloque. Esta actualización redujo el costo de Ethereum DA en 1/5: $20 millones por 32 GB de datos blob.
Celestia y EigenDA son mejoras significativas: 32 GB de datos cuestan $8,000 y $26,000 respectivamente. Ambos están sujetos a fluctuaciones de precios del mercado y reflejan el costo de la seguridad de los datos consensuados hasta cierto punto: Celestia usa su token nativo TIA, mientras que EigenDA usa Ether.
En todos los casos anteriores, los datos almacenados no son permanentes. Los datos de llamadas de Ethereum se almacenan durante 3 semanas, los blobs durante 18 días y EigenDA almacena los blobs durante un período predeterminado de 14 días. En la implementación actual de Celestia, los nodos de archivo almacenan datos de blobs de manera indefinida, pero los nodos ligeros solo pueden realizar muestreos durante un máximo de 30 días.
Las dos últimas tablas son una comparación directa entre Filecoin y las soluciones DA actuales. La equivalencia de costos primero enumera el costo de un solo byte de datos en una plataforma determinada y luego muestra la cantidad de bytes de Filecoin que se pueden almacenar en la misma cantidad de tiempo al mismo costo.
Esto sugiere que Filecoin es mucho más económico que las soluciones DA actuales, ya que cuesta solo una fracción de centavo almacenar la misma cantidad de datos en la misma cantidad de tiempo. A diferencia de los nodos de Ethereum y los nodos de otras soluciones DA, los nodos de Filecoin están optimizados para proporcionar servicios de almacenamiento, y su sistema de prueba permite que los nodos prueben el almacenamiento en lugar de replicarlo en todos los nodos de la red. Sin considerar la economía del proveedor de almacenamiento (como el costo de energía de encapsular datos), la sobrecarga básica del proceso de almacenamiento de Filecoin es insignificante. En comparación con Ethereum, esto sugiere que existe una oportunidad de mercado de hasta millones de dólares por GB para los sistemas que pueden proporcionar servicios DA seguros y de alto rendimiento en Filecoin.
Rendimiento
A continuación, consideraremos la capacidad de las soluciones DA y la demanda generada por los principales rollups de Capa 2.
Dado que la cadena de bloques de Filecoin está organizada en conjuntos de datos, con múltiples bloques en cada altura de bloque, la cantidad de transacciones que se pueden realizar no está limitada por el consenso o el tamaño del bloque. La restricción estricta de datos de Filecoin es su capacidad de almacenamiento en toda la red, no la capacidad permitida por el consenso.
Para la demanda diaria de DA, obtenemos datos de Rollups DA and Execution proporcionados por Terry Chung y Wei Dai, que incluyen promedios diarios de 30 días y datos de un solo día de muestreo. De esta manera, podemos considerar la demanda promedio sin ignorar las desviaciones del promedio (por ejemplo, la demanda de Optimisms el 15 de agosto de 2023 fue de aproximadamente 261 000 000 bytes, más de cuatro veces su promedio de 30 días de 64 000 000 bytes).
A partir de esta elección, podemos ver que, si bien existe la oportunidad de reducir los costos de DA, los requisitos de DA deben aumentar significativamente para utilizar de manera efectiva el tamaño del sector de 32 GB de Filecoins. Si bien sería un desperdicio llenar sectores de 32 GB con menos de 32 GB de datos, podemos hacerlo y, al mismo tiempo, obtener ventajas en los costos.
Arquitectura
En esta sección, analizaremos la arquitectura técnica que sería posible si la construyéramos hoy. Analizaremos esta arquitectura en el contexto de una aplicación L2 arbitraria y la cadena L1 a la que sirve la L2. No consideramos a Filecoin como un ejemplo de L1 porque la solución es una solución DA externa, al igual que Celestia y EigenDA.
Componentes
Incluso en un nivel alto, los DA en Filecoin aprovecharán muchas características diferentes del ecosistema Filecoin.
Actas :Los usuarios finales realizan transacciones en una plataforma que requiere DA, que puede ser L2.
Plataformas que utilizan DA :Estas plataformas utilizan DA como un servicio, que puede ser una publicación de datos de transacciones L2 en Filecoin DA o un compromiso con L1 (como Ethereum).
Capa 1 :Se trata de cualquier L1 que contenga compromisos de datos que apunten a una solución DA. Podría ser Ethereum, que admita una L2 que utilice la solución DA de Filecoin.
Agregador :La interfaz de la solución DA basada en Filecoin es un agregador, que es un componente centralizado que recibe datos de transacciones de L2 y otros usuarios de DA y los agrega en sectores de 32 GB que caben en el paquete. Aunque la prueba de concepto simple incluirá un agregador centralizado, las plataformas que utilizan la solución DA también pueden ejecutar sus propios agregadores. Por ejemplo, como dispositivo auxiliar para el clasificador L2, la centralización del agregador es similar a la del clasificador L2 o al descentralizado de EigenDA. Una vez que el agregador compila una carga útil cercana a los 32 GB, celebra un acuerdo de almacenamiento con un proveedor de almacenamiento para almacenar los datos. A los usuarios se les garantiza que sus datos se incluirán en el sector en forma de PoDSI (Prueba de inclusión de segmento de datos), y se utiliza un pCID para identificar sus datos una vez que ingresan a la red. Este pCID se incluirá en el compromiso estatal en L1 para hacer referencia a los datos que respaldan la transacción.
Validadores :Los validadores solicitan datos a los proveedores de almacenamiento para garantizar la integridad de los compromisos estatales y construir pruebas de fraude, que se envían a L1 en caso de fraude demostrable.
Ofertas de almacenamiento :Una vez que el agregador ha compilado una carga útil de cerca de 32 GB, el agregador celebra un acuerdo de almacenamiento con un proveedor de almacenamiento para almacenar los datos.
Publicación de un blob (Put) :Para iniciar una operación Put, el cliente DA envía un blob que contiene los datos de la transacción al agregador. Esto se puede hacer dentro o fuera de la cadena a través de un oráculo de agregación dentro de la cadena. Para confirmar la recepción del blob, el agregador devuelve un PoDSI al cliente, lo que demuestra que su blob está incluido en el sector agregado que se enviará a la subred, junto con un pCID (identificador de contenido de subfragmento). Una vez que el blob está disponible en Filecoin, el cliente y otras partes interesadas lo usarán para hacer referencia al blob.
Las transacciones de datos aparecerán en la cadena en cuestión de minutos después de que se haya realizado la transacción. La mayor barrera para la latencia es el tiempo de encapsulación, que puede tardar hasta tres horas. Esto significa que, aunque la transacción se haya completado y el usuario pueda estar seguro de que los datos aparecerán en la red, no hay forma de garantizar que los datos se puedan consultar hasta que se complete el proceso de encapsulación. El cliente Lotus tiene una función de recuperación rápida, en la que se almacena una copia no encapsulada de los datos junto con la copia encapsulada, y se puede proporcionar tan pronto como los datos no encapsulados se transmitan al proveedor de almacenamiento de datos, siempre que la transacción de recuperación no dependa de la prueba de que los datos encapsulados aparecen en la red. Sin embargo, esta función queda a discreción del proveedor de datos y no está garantizada criptográficamente como parte del protocolo. Para proporcionar garantías de recuperación rápida, se necesitan cambios en los mecanismos de consenso y de penalización/incentivo para hacerla cumplir.
Recuperar un blob (Obtener) :La recuperación es similar a una operación de venta. Se requiere una transacción de recuperación, que aparecerá en la cadena en unos pocos minutos. La latencia de la recuperación dependerá de los términos de la transacción y de si se almacena una copia no sellada de los datos para una recuperación rápida. En el caso de una recuperación rápida, la latencia dependerá de las condiciones de la red. Sin una recuperación rápida, los datos deben ser dessellados antes de ser entregados al cliente, lo que lleva la misma cantidad de tiempo que el sellado, aproximadamente tres horas. Por lo tanto, sin optimización, nuestro tiempo máximo de ida y vuelta es de seis horas, lo que requiere mejoras significativas en los servicios de datos antes de que esto pueda convertirse en un DA viable o un sistema a prueba de fraude.
Prueba DA :La prueba de DA se puede dividir en dos pasos: a través de PoDSI proporcionado al enviar datos al agregador durante el proceso de transacción, y luego a través del compromiso continuo de PoRep y PoST proporcionado por el mecanismo de consenso de Filecoin. Como se mencionó anteriormente, PoRep y PoST brindan garantías planificadas y demostrables para la custodia y persistencia de los datos.
Esta solución hará un uso intensivo de puentes, ya que cualquier cliente que dependa de DA (ya sea que construya pruebas o no) necesitará poder interactuar con Filecoin. Para los pCID incluidos en las transiciones de estado publicadas en L1, los validadores pueden hacer una verificación preliminar para asegurarse de que no se hayan enviado pCID falsos. Hay varias formas de hacer esto, por ejemplo, a través de un Oracle que publique datos de Filecoin en L1 o a través de un validador para verificar que existe una transacción de datos o sector correspondiente al pCID. De manera similar, la verificación de la validez o las pruebas de fraude publicadas en L1 también pueden requerir el uso de un puente para garantizar la validez o el fraude de la prueba. Los puentes disponibles actualmente son Axelar y Celer.
Análisis de seguridad
La integridad de Filecoin se logra reduciendo las garantías. Las garantías se pueden reducir en dos casos: errores de almacenamiento o errores de consenso. Los errores de almacenamiento se refieren a la incapacidad de los proveedores de almacenamiento de proporcionar pruebas (PoRep o PoST) de los datos almacenados, lo que está relacionado con la falta de disponibilidad de datos en nuestro modelo. Los errores de consenso se refieren a un comportamiento malicioso en el consenso, que es el protocolo que administra el libro de transacciones, y FEVM se abstrae del libro de transacciones.
-
Los errores de sector son penalizaciones por no publicar pruebas continuas de almacenamiento. Los proveedores de almacenamiento tienen un período de gracia de un día durante el cual no serán penalizados por errores de almacenamiento. Después de 42 días de un error de sector, el sector será cancelado. Los cargos incurridos se destruyen.
BR(t) = Fracción de recompensa proyectada(t) * Potencia ajustada por calidad del sector
-
La terminación de un sector se produce si un sector ha estado en error durante 42 días o si un proveedor de almacenamiento cancela intencionalmente una transacción. La tarifa de terminación es igual al monto más alto que el sector ganó antes de la terminación, con un límite de 90 días de ingresos. Las tarifas de transacción no pagadas se reembolsan a los usuarios. Las tarifas incurridas se destruyen.
máx(SP(t), BR(Época de inicio, 20 d) + BR(Época de inicio, 1 d) * factorRecompensaDeTerminación * mín(EdadDeSectorEnDías, 140))
-
Al finalizar una transacción, se produce un recorte del actor del mercado de almacenamiento, que es un recorte de la garantía proporcionada por el proveedor de almacenamiento después de la transacción.
La seguridad que ofrece Filecoin es muy diferente a la de otras cadenas de bloques. Si bien los datos de la cadena de bloques suelen estar protegidos mediante consenso, el consenso de Filecoin solo protege el libro de transacciones, no los datos a los que hacen referencia las transacciones. Los datos almacenados en Filecoin deben ser lo suficientemente seguros como para incentivar a los proveedores de almacenamiento a proporcionar almacenamiento. Esto significa que los datos almacenados en Filecoin están protegidos mediante penalizaciones por errores e incentivos comerciales (como la reputación del usuario). En otras palabras, los errores de datos en la cadena de bloques equivalen a violaciones del consenso, que socavan la seguridad de la cadena de bloques o su noción de validez de las transacciones. Filecoin es tolerante a fallos en su almacenamiento de datos y, por lo tanto, solo utiliza el consenso para proteger su libro de transacciones y las actividades relacionadas con las transacciones. El costo para los proveedores de almacenamiento que no cumplen con sus transacciones de datos es una penalización de hasta 90 días de recompensas de almacenamiento y la pérdida de la garantía que proporcionaron para asegurar la transacción.
Por lo tanto, el costo de un ataque de retención de datos por parte de un proveedor de Filecoin es simplemente el costo de oportunidad de la transacción de recuperación. La recuperación de datos en Filecoin depende de tarifas pagadas por los usuarios para incentivar a los proveedores de almacenamiento. Sin embargo, no responder a las solicitudes de recuperación de datos no afecta negativamente a los proveedores de almacenamiento. Para reducir el riesgo de que un solo proveedor de almacenamiento ignore o rechace una transacción de recuperación de datos, los datos en Filecoin pueden ser almacenados por varios proveedores de almacenamiento.
Dado que la seguridad económica detrás de los datos de Filecoin es mucho menor que las soluciones basadas en blockchain, también se debe considerar la protección contra la manipulación de datos. La manipulación de datos está protegida a través del sistema de prueba de Filecoin. Los datos se referencian mediante CID, a través de los cuales la corrupción de datos se puede detectar de inmediato. Por lo tanto, los proveedores de datos no pueden proporcionar datos corruptos, porque es fácil verificar que los datos adquiridos coinciden con el CID solicitado. Los proveedores de datos no pueden almacenar datos corruptos en lugar de datos no corruptos. Al recibir datos del usuario, el proveedor debe proporcionar una prueba de la encapsulación correcta del sector de datos para iniciar una transacción de datos (marque esta opción). Por lo tanto, las transacciones de almacenamiento no se pueden iniciar con datos corruptos. Durante el período de validez de la transacción de almacenamiento, se proporciona PoST para demostrar la autorización de custodia (tenga en cuenta que esto demuestra tanto la custodia del sector de datos encapsulados como la custodia desde el último PoST). Dado que PoST se basa en el sector de encapsulación cuando se genera la prueba, un sector corrupto dará como resultado un PoST falsificado, lo que dará como resultado un sector incorrecto. Por lo tanto, los proveedores de almacenamiento no pueden almacenar ni proporcionar datos corruptos, no pueden recibir recompensas por proporcionar servicios para datos no corruptos y no pueden evitar ser castigados por manipular los datos de los usuarios.
La seguridad se puede mejorar aumentando la garantía que los proveedores de almacenamiento se comprometen con el Actor del Mercado de Almacenamiento, que actualmente está determinada por el proveedor de almacenamiento y el usuario. Si asumimos que esta cantidad de garantía es lo suficientemente alta (por ejemplo, la misma que la garantía de los validadores de Ethereum) para incentivar a los proveedores a no incumplir, entonces podemos imaginar qué más se debe asegurar (aunque esto sería extremadamente ineficiente en términos de capital, ya que esta garantía es necesaria para asegurar cada blob comercializado o sector de blob agregado). Los proveedores de datos ahora pueden optar por hacer que sus datos no estén disponibles hasta 41 días antes de que el Actor del Mercado de Almacenamiento finalice el acuerdo de almacenamiento. Suponiendo que los acuerdos de datos sean cortos, podemos asumir que los datos no estarán disponibles hasta el último día del acuerdo. En ausencia de coordinación por parte de actores maliciosos, esto se puede mitigar replicando entre múltiples proveedores de almacenamiento para que el servicio de datos pueda seguir prestándose.
Podemos pensar en el costo que tendría para un atacante anular el consenso, ya sea aceptando pruebas falsas o reescribiendo el historial del libro mayor para eliminar transacciones del libro de órdenes sin penalizar a los proveedores de almacenamiento responsables. Sin embargo, vale la pena señalar que en el caso de esta violación de seguridad, el atacante puede manipular el libro mayor de Filecoin a voluntad. Un atacante necesitaría tener al menos una participación mayoritaria en la cadena Filecoin para llevar a cabo un ataque de este tipo. La participación está relacionada con el almacenamiento proporcionado a la red, y con la cadena Filecoin actual en 25 EiB (10 ¹⁶ bytes), un actor malicioso necesitaría al menos 12,5 EiB para proporcionar su propia cadena para ganar la regla de elección de bifurcación. Esto se puede mitigar aún más mediante el slashing asociado con los errores de consenso, siendo la penalización la pérdida de todas las garantías y recompensas de bloque en staking, y la suspensión de la participación en el consenso.
Fuera de tema: Prevención de ataques a otras soluciones DA
Si bien el caso anterior demuestra las deficiencias de Filecoin a la hora de proteger los datos de ataques de retención, no es el único ejemplo.
-
Etereum :En términos generales, la única forma de garantizar una respuesta a una solicitud a la red Ethereum es ejecutar un nodo completo. Por lo tanto, un nodo completo no necesita satisfacer solicitudes de recuperación de datos fuera del consenso. Las construcciones como PeerDAS introducen un sistema de puntuación de pares para las respuestas de los nodos a la recuperación de datos, donde los nodos con puntuaciones suficientemente bajas (esencialmente, reputación de DA) pueden aislarse de la red.
-
Celestia Celestia tiene una seguridad por byte más fuerte que la estructura de Filecoin y es resistente a ataques de retención, pero la única forma de aprovechar esta seguridad es alojar un nodo completo. Las solicitudes realizadas a la infraestructura de Celestia que no sean de propiedad y operación interna se revisarán sin penalización.
-
EigenDA :De manera similar a Celestia, cualquier servicio puede ejecutar un nodo de operador EigenDA para garantizar la recuperación de sus propios datos. Por lo tanto, cualquier solicitud de recuperación de datos fuera del protocolo está sujeta a revisión. Tenga en cuenta también que EigenDA tiene un distribuidor centralizado y confiable que es responsable de la codificación de datos, los compromisos de KZG y la distribución de datos, de manera similar a nuestro agregador.
Seguridad de recuperación
La recuperabilidad es necesaria para la DA. Lo ideal sería que las fuerzas del mercado incentivaran a los proveedores de almacenamiento económicamente racionales a aceptar acuerdos de recuperación y competir con otros proveedores para reducir los precios para los usuarios. Suponiendo que esto sea suficiente para que los proveedores de datos ofrezcan servicios de recuperación, es razonable exigir una mayor seguridad dada la importancia de la DA.
Actualmente, no se puede garantizar la recuperación a través de la seguridad económica descrita anteriormente. Esto se debe a que es criptográficamente difícil demostrar de una manera que minimice la confianza que el lado del usuario no recibió los datos (donde el lado del usuario necesita refutar la afirmación de los proveedores de almacenamiento de haber enviado los datos). Para garantizar la seguridad de la recuperación a través de la seguridad económica de Filecoins, se requieren garantías de recuperación nativas del protocolo. Con cambios mínimos en el protocolo, esto significa que la recuperación debe estar asociada con un error de sector o la terminación de la transacción. Retriev es una prueba de concepto que puede proporcionar garantías de recuperación de datos mediante el uso de árbitros confiables para mediar en las disputas de recuperación de datos.
Suplemento: Busque otras soluciones DA
Como se mencionó anteriormente, Filecoin carece de las garantías de recuperación nativas del protocolo necesarias para evitar un comportamiento egoísta por parte del almacenamiento (o de los proveedores de recuperación). En el caso de Ethereum y Celestia, la única forma de garantizar que se puedan leer los datos del protocolo es alojar un nodo completo en el propio servidor o confiar en el acuerdo de nivel de servicio de un proveedor de infraestructura. Como proveedor de almacenamiento de Filecoin, la recuperación garantizada no es trivial. La configuración análoga en Filecoin es convertirse en un proveedor de almacenamiento (con costos de infraestructura significativos) y aceptar con éxito el mismo acuerdo de almacenamiento que un proveedor de almacenamiento publicado por un usuario, momento en el que las personas pagarán para proporcionar almacenamiento para sí mismas.
Análisis de latencia
La latencia de Filecoin está determinada por múltiples factores, como la red, la topología, la configuración del usuario del proveedor de almacenamiento y las capacidades del hardware. Ofrecemos un análisis teórico que analiza estos factores y se basa en el rendimiento que se puede esperar.
Debido al diseño del sistema de prueba de Filecoin y a la falta de incentivos de recuperación, Filecoin no está optimizado para proporcionar una latencia de ida y vuelta de alto rendimiento desde la publicación inicial de los datos hasta la recuperación inicial de los mismos. La recuperación de alto rendimiento en Filecoin es un área activa de investigación que cambia constantemente a medida que los proveedores de almacenamiento mejoran las capacidades y Filecoin presenta nuevas funciones. Definimos "recuperación de ida y vuelta" como el tiempo que transcurre desde el envío de una transacción de datos hasta que se pueden descargar los primeros datos enviados a Filecoin.
Bloquear tiempo
Según el consenso esperado de Filecoin, las transacciones de datos se pueden completar dentro de un tiempo de bloque de 30 segundos. 1 hora es el tiempo de confirmación típico para datos confidenciales en la cadena (como transferencias de monedas).
proceso de datos
Los tiempos de procesamiento de datos varían según el proveedor de almacenamiento y la configuración. Si se utiliza el hardware de un proveedor de almacenamiento estándar, el proceso de encapsulación demora 3 horas. Los proveedores de almacenamiento suelen reducir este tiempo de 3 horas mediante configuraciones especiales de cliente, paralelización e inversión en hardware más potente. Esta variación también afecta la duración de la apertura del sector, que se puede evitar por completo mediante opciones de recuperación rápida en clientes de Filecoin como Lotus. La configuración de recuperación rápida almacena una copia no encapsulada de los datos junto con los datos encapsulados, lo que acelera enormemente los tiempos de recuperación. En base a esto, podemos suponer una latencia en el peor de los casos de 3 horas desde la aceptación de una transacción de datos hasta que los datos estén disponibles en la cadena.
Conclusión y direcciones futuras
En este artículo, se analiza cómo crear una DA utilizando la DSN existente, concretamente Filecoin. Consideramos los requisitos de la DA como un elemento clave de la infraestructura de escalado de Ethereum. Analizamos la viabilidad de crear una DA en una DSN basada en Filecoin y la utilizamos para explorar las oportunidades que las soluciones en Filecoin aportarán al ecosistema Ethereum, o cualquier oportunidad que se beneficie de una capa de DA rentable.
Filecoin demuestra que DSN puede mejorar significativamente la eficiencia del almacenamiento de datos en sistemas descentralizados basados en blockchain, ahorrando $100 millones por cada 32 GB de datos escritos a los precios actuales del mercado. Aunque la demanda de DA aún no es suficiente para llenar un sector de 32 GB, la ventaja de costo de DA permanece si se llenan los sectores vacíos. Aunque la latencia actual de almacenamiento y recuperación en Filecoin no es adecuada para las necesidades de almacenamiento en caliente, las operaciones específicas de los proveedores de almacenamiento pueden proporcionar un rendimiento razonable para garantizar que los datos estén disponibles en 3 horas.
La mayor confianza en los proveedores de almacenamiento de Filecoin se puede ajustar a través de garantías variables, como en EigenDA. Filecoin extiende esta seguridad ajustable para permitir que se almacene una gran cantidad de réplicas en la red, agregando tolerancia a fallas bizantinas ajustable. Para prevenir de manera sólida los ataques de retención de datos, se debe resolver el problema de la recuperación de datos garantizada y de alto rendimiento, pero, como con cualquier otra solución, la única forma de garantizar realmente la recuperabilidad es alojar un nodo en el propio servidor o confiar en el proveedor de infraestructura.
Vemos oportunidades para DA en un mayor desarrollo de PoDSI, que podría (junto con las pruebas actuales de Filecoins) reemplazar a DAS para garantizar la inclusión de datos en sectores sellados más grandes. Dependiendo de la situación, esto podría hacer que la rotación lenta de datos sea tolerable, ya que las pruebas de fraude se pueden emitir en un plazo de 1 día a 1 semana, mientras que DA puede garantizarlas a pedido. PoDSI todavía es una tecnología nueva y está en pleno desarrollo, por lo que aún no sabemos cómo será eficiente PoDSI ni los mecanismos necesarios para construir sistemas en torno a ella. Dado que ya existen soluciones para calcular los datos de Filecoin, puede que no sea descabellado tener soluciones para calcular PoDSI en datos sellados o no sellados.
A medida que evoluciona el espacio DA y Filecoin, nuevas combinaciones de soluciones y tecnologías de apoyo pueden dar lugar a nuevas pruebas de concepto. Como lo demuestra la integración de Solana con la red Filecoin, DSN tiene potencial como tecnología de escalado. El costo del almacenamiento de datos en Filecoin presenta una oportunidad abierta con mucho margen para la optimización. Si bien los desafíos analizados en este artículo se presentan en el contexto del apoyo a DA, sus soluciones definitivas crearán una serie de nuevas herramientas y sistemas fuera de DA.
Los datos del gráfico relevante provienen de las especificaciones de Filecoin, EIP-4844, EigenDA, implementación de Celestia, Celenium, Starboard, file.app, Rollups DA y Execution, así como el precio de mercado aproximado actual.
Este artículo proviene de Internet: Un análisis profundo de la disponibilidad de datos en Filecoin
Relacionado: Con la explosión de la IA, ¿por qué es indispensable la Web3?
Autor original: Teng Yan Traducción original: Luffy, Foresight News Una metáfora que he escuchado es que la IA generativa significa descubrir un nuevo continente en la Tierra con 100 mil millones de personas superinteligentes dispuestas a trabajar gratis. Increíble, ¿no? El siglo XXI será conocido como la era de la inteligencia artificial para la humanidad. Estamos presenciando el desarrollo temprano de una nueva generación de tecnología que cambiará la sociedad más profundamente que el descubrimiento de la electricidad, el aprovechamiento de la energía nuclear o incluso el aprovechamiento del fuego. No me creas, el Rey de Inglaterra dijo esto: ¡Qué época! ¿Quién iba a decir que alimentar un algoritmo con grandes cantidades de datos y superponer enormes recursos informáticos permitiría a la IA desarrollar nuevas capacidades asombrosas? Ahora puede sintetizar, razonar y, de hecho…