파이썬, 데이터분석실무

용량단위(파일 크기), 진수표기, 진수변환, 비정형데이터, LTV 고객생애가치 개념정리

구리Guri 2018. 10. 20. 23:54

파일 크기 File Size 용량단위

Bit 0,1
Byte 
KB  KiloByte
MB MegaByte
GB GigaByte 
TB  TeraByte 
PB  PetaByte 
EB  ExaByte
ZB  ZetaByte 
YB  YottaByte

대학 다닐 때만 해도 PB까지 들었었는데, 그새 또 새로운 개념이 나왔다
끊임없이 발전하다보니 역시 공부를 게을리하면 안되는 분야...



binary                  2진수
decimal                10진수
Octal                    8진수
Hexadecimal         16진수



  0 0 0 0 0 0 0 0  
  1 1 1 1 1 1 1 1  
                 
                 
  97                
   
  2 2 2 2 2 2 2 2  
  128 64 32 16 8 4 2 1  
                   
  0 1 1 0 0 0 0 1 이진수
                   
0 0 1 1 0 0 0 0 1  
4 2 1 4 2 1 4 2 1  
    1   4     1   8진수
                   
  0 1 1 0 0 0 0 1  
  8 4 2 1 8 4 2 1  
                   
      6       1   16진수





IO(입출력) 장치
-표준 입출력장치 (키보드,모니터)

스트림(stream) : 입력장치 - 입력스트림 - 프로그램(처리) - 출력스트림 - 출력 장치

floating 부동 소수점
3.4 = 34 * 10의 -1승



구조화된 데이터
비정형 데이터 = 텍스트,음악,동영상 = 언스트럭쳐데이터

데이터베이스 = 데이터 스토리지



LTV 고객생애가치 = 한 고객이 회사와 계약을 맺고, 서비스를 받고, 언제까지 이 서비스를 받을 것인가, 이탈할 것인가  (예측)
고객세분화
데이터를 가지고 모델을 만들어냄, 예측.
카드회사 -> 고객의 사용처,사용액 분석, 보험사기 등 분석
선거 -> SNS 등의 사람들의 선거 관련 말(단어)을 분석 (텍스트마이닝) 선거후보자의 긍정적인 반응, 부정적인 반응(pros,cons 단어사전을 이용해)

회사 -> 제품에 대한 부정적인 반응, 긍정적인 반응