Webinar
Eventos ITGLOBAL.COM
Compressão De Dados

Compressão de dados significa a transformação da informação que é realizada para reduzir seu volume. É utilizado para garantir o uso racional dos recursos de hardware que armazenam, processam, transmitem e realizam quaisquer outras operações com informações.

compressão de dados no armazenamento NetApp


saiba mais

O processo de compactação de dados é baseado na eliminação da redundância, característica dos dados intactos (descompactados). O exemplo mais simples de redundância de informações são muitas repetições da mesma palavra no texto.

Para remover esse tipo de redundância, você precisa substituir uma palavra que ocorre com frequência por um link para outro dado codificado e com um volume estritamente especificado.

A redução do “peso” dos dados pode ser alcançada substituindo palavras codificadas por tipos de dados repetidos com muita frequência e códigos longos de dados muito raros (codificação de entropia). Se os dados não tiverem redundância (informações criptografadas, “ruído branco”, sinal curto, etc.), então não será possível compactá-los sem perder informações.

A compactação de dados sem perdas é um processo que permite, se necessário, restaurar completamente as informações originais, pois o volume de informações armazenadas não diminui, apesar da diminuição do espaço que ocupa.

A possibilidade acima pode aparecer se as probabilidades estiverem desigualmente distribuídas nas mensagens. Por exemplo, quando algumas das mensagens que são possíveis em teoria não ocorreram na codificação inicial dessas mensagens.

Algoritmos de Compressão de dados para tipos de dados desconhecidos

Existem 2 métodos principais de compactação de dados que possuem um formato desconhecido:

  1. Cada caractere compactado sucessivo é colocado no buffer de saída em sua forma original ou um grupo de vários caracteres compactados é substituído por uma referência a um grupo semelhante de caracteres codificados. Esse método é usado com mais frequência ao criar software de extração automática.
  2. Para cada sequência de caracteres compactados, as estatísticas (frequência de ocorrência de dados no código) são coletadas uma vez ou constantemente. Com base nessas estatísticas, a probabilidade do valor do próximo caractere codificado (ou sua sequência) é determinada. Em seguida, um dos tipos de codificação de entropia é usado para substituir os tipos de dados que ocorrem com frequência por palavras de código curtas e os raros por outros mais longos.
Usamos cookies para otimizar a funcionalidade do site e aprimorar nossos serviços. Para saber mais, leia nossa Política de Privacidade.
Configurações de cookies
Cookies estritamente necessários
Cookies analíticos