2022

파일을 압축할 때 본문

CS

파일을 압축할 때

__g__ 2022. 6. 16. 09:34

압축

  • 데이터에서 반복되거나 불필요한 부분을 없애 데이터의 양(용량)을 줄이는 방식을 말한다.
  • 저장공간을 절약하거나 데이터 전송시간을 줄일 때 등 사용한다.
  • 데이터 크기를 줄이는 인코딩 과정과 저장된 데이터를 원래 형태로 복원하는 디코딩 과정이 존재한다.
  • 인코딩하기 전의 데이터 크기와 인코딩하고 나서의 데이터 크기의 비율을 압축률이라 한다.
  • 압축 방식에 따라 크게 원본이 유지되는 무손실 압축과 회복 불가능한 손실 압축으로 나눈다.

 

무손실 압축 손실 압축
  • 데이터의 내용을 바꾸지 않고 원래 내용 그대로 디코딩할 수 있는 기술
  • 압축 과정에서 데이터 손실이 전혀 없어 입력 데이터와 복원된 데이터가 완전히 같다.
  • 버린 데이터가 없어 압축 효율은 떨어진다.
  • 의료 영상, 설계도면 등 자료를 손실하면 안 되는 분야에서 응용한다.
  • 일반 압축 포맷은 무손실이라는 말을 생략하고 있다. (zip, RAR, 7z, EGG 등)
  • 알고리즘 : 반복 길이 부호화, 허프만 부호화, 산술 부호화 등 
  •  디코딩한 데이터의 세부적인 디테일을 일부 희생시키는 압축 기술
  • 중복되고 불필요한 데이터를 삭제해 부분적으로 손실이 있다.
  • 불필요한 데이터를 버렸기 때문에 압축 효율이 높다.
  • 사진, 음악, 동영상 등 주로 멀티미디어 데이터에서 인간이 지각하기 힘든 범위의 데이터를 버리고 압축한다.
  • 동영상(.avi), 이미지(.jpg), 음성(.mp3) 같은 확장자들은 손실 압축된 파일들이다.
  • 알고리즘 : 절단 부호화, 벡터 양자화, 손실 예측 부호화, 변환 부호화 등 
 

 

 

허프만 코딩(Huffman coding)

허프만 부호화 또는 허프만 코딩(Huffman coding)은 입력 파일의 문자 빈도 수를 가지고 최소힙을 이용하여 파일을 압축하는 과정이다. 허프만 코드(이진코드)는 Unix에서 파일압축에 사용되고, JPEG

velog.io

 

 

 

이미지 압축방식 이해하기(bmp, jpeg, jpg, png, svg) - dydtjr1128's Blog

Image compression 1. Intro 이미지 압축 방식을 이해하기 앞서 이해해야 할 몇가지가 있다. Lossy vs Lossless Indexed...

dydtjr1128.github.io

 

'CS' 카테고리의 다른 글

URL  (0) 2022.06.23
파일 시스템과 블록  (0) 2022.06.09
프로그래밍 언어  (0) 2022.06.02
15. 캐시가 뭔가요?  (0) 2022.05.26
79.곳곳에 도사리는 위험 (보안 위협)  (0) 2022.05.20
Comments