학교공부 10

Rstudio 설치 후 csv 깨졌을때

https://sodayeong.tistory.com/23 [웹 크롤링] 로케일에 대한 이해 로케일(Locale)이란? 국가마다 서로 다른 문화를 가지고 있다 보니, 시간과 숫자등 표시하는 방법 등에서 상당한 차이를 보입니다. 따라서 운영체제(OS)는 국가마다 서로 다른 로케일을 제공하고 sodayeong.tistory.com > localeToCharset() [1] "CP949" // 한국인코딩 방식인지 확인하기 > Sys.getlocale() [1] "LC_COLLATE=Korean_Korea.949;LC_CTYPE=Korean_Korea.949;LC_MONETARY=Korean_Korea.949;LC_NUMERIC=C;LC_TIME=Korean_Korea.949" cp949가아니면 한국어로된 모든..

학교공부/R 2022.03.11

R프로그래밍 기초

Hello World 출력방법 : print("Hello World") 다양한 함수 두개의 인자가 필요한 함수 rep() 어떠한 값을 몇번 반복해 백터 타입의 시퀀스로 반환하라는 의미 rep(x="배고파",times=5) plot() : 좌표를 찍는 함수 ex) plot(10,10) runit() : 여러개의 점을 랜덤으로 찍는 함수 R은 변수라는 말대신 객체라는 단어를 사용한다 객체에 값 선언하는 방법 ex) object1 object1 계산하는방법 : command 창에 바로 계산시킬수있음 >1+2 [1] 3 결과가나옴 paste() : 여러객체를 합쳐서 보여준는 함수 객체에는 수치값 문자열 Boolean값등을 입력할 수도있음 >paste(object1,object2) >"문자열 데이터" R의 최소 ..

학교공부/R 2022.03.11

Data Modeling

MongoDB에서 논리적 구조를 설계할 때 고려해야 할 Data Modeling의 주요 특징 MongoDB는 데이터와 프로세스 모두가 설계의 중심임 파일 시스템을 이용한 데이터 저장기술은 기업의 업무적 프로세스 중심으로 데이터를 해석하고 구조를 설계하는 방법 데이터베이스 관리 시스템을 이용한 방법은 기업에서 발생하는 데이터를 중심으로 분석, 설계하는 방법 NoSQL 기술에서는 기업의 업무적 프로세스와 데이터 모두를 설계의 중심으로 둠으로 유연한 데이터 구조를 설계할 수 있고 관리할 수 있음 Rich Document Structure를 제공함 관계형 데이터베이스는 데이터의 중복을 제거하고 무결성을 보장하기 위한 설계 방법으로 정규화된 설계 기법을 사용 •데이터 구조의 복잡성, 구현 단계에서 발생하는 과도한..

학교공부/Nosql 2022.02.01

인덱스 사용자관리

인덱스 일반적으로 DBMS에서 인덱스를 사용하는 이유는 빠른 데이터 검색을 수행하기 위함으로 MongoDB도 동일한 목적으로 사용됨 db.emplotees.getIndexes() //모든인덱스 호출 db.employees.dropIndex({ename:1}) //해당인덱스 삭제함 MongoDB에서 인덱스의 주요 특징 MongoDB에서 대소문자를 엄격히 구분함 Collection의 충분한 EXTENT 크기를 설정해야 하는 것처럼 충분한 인덱스 EXTENT 크기를 설정해야 함 SORT() 절과 LIMIT() 절은 함께 적절하게 사용하는 것이 불필요한 데이터 검색을 피할 수 있기 때문에 성능 향상에 도움이 될 수 있음 Single-key 인덱스와 Compound key 인덱스 다중키 인덱스 점 연산자를 이용하..

학교공부/Nosql 2022.02.01

MongoDB - aggregation FrameWork

MongoDB는 수집 및 저장된 데이터로부터 빠른 읽기를 통한 데이터의 분석 및 가공 처리를 위한 기능들을 제공함 Aggregation Framework MongoDB와 Hadoop의 MapReduce를 통한 데이터 추출 방법이 가지고 있는 과다한 프로그래밍을 통한 비용과 시간 낭비문제를 최소화 시키고 최소한의 코딩과 빠른 읽기 작업을 가능하게 만든 빅데이터 추출 기능 MapReduce Map 함수와 Reduce 함수를 이용하여 JavaScript 형태로 제공되는 문법을 통해 컬렉션 내의 데이터를 빠르게 읽고 가공 처리할 수 있는 기능 Aggregation Framework의 주요 특징 빅데이터의 추출에 최적화 되어 만들어진 기능 Aggragation Framework를 실행하면 내부적으로 MongoDB..

학교공부/Nosql 2022.02.01

MongoDB

cmd 창열기 mkdir test //메모리 영역과 파일영역 그리고 프로세스 영역을 활성화하기 위해 데이터가 저장될 물리적인 경로를 생성 mongod --version //몽고 버전 확인하기 옵션에 대쉬 2번 몽고DB를 시작할때 사용되는 서버 프로그램인 mongod.exe를 실행함 옵션에 적용된 --dbpath와 경로명은 데이터가 저장될 물리적인 경로임 mogod --dbpath c:\mongod\test //몽고DB 인스턴스 활성화 c:\mongod\bin > mongo // 몽고에 접속하는 client shell program 에러없이 prompt가 나타나면 정상접속 ex) mongoDB Enterprise help // mongo shell 상태에서 실행할수있는 help 명령어임 show dbs /..

학교공부/Nosql 2022.01.31

NoSql

단어적 의미는 "SQL"이 아니라는 의미 관계형 데이터베이스가 아닌 SQL임 NoSQL의 장점 -클라우드 컴퓨터 환경에 적합 - 유연한 데이터 모델 비정형 데이터 구조 설계로 설계비용이 감소 관계형 데이터베이스의 Relationship과 Join 구조를 Linking과 Embeded로 구현하여 성능이빠름 -Big Data 처리에 효과 Memory Mapping 기능을 통해 Read/Write가 빠름 일반적인 OS와 Hardware 에 구축할 수 있음 MongoDB javascript의 형태를 근거로 하는 JSon 타입으로 데이터를 저장관리 예) {ename: "parksu"} 데이터를 표현할때는 괄호를 열고 필드명과 콜론(:) 그리고 데이터값을 표현하고 작성이 완료되면 괄호를 닫는다 Replicar(복제..

학교공부/Nosql 2022.01.31