전체 글

Java를 배우다보면 Scanner라는 입력 방식을 배우게된다. Scanner 말고도 BufferedReader라는 입출력 방식이 있는데 BufferdReader에 대해 정리해보겠다. BufferdReader :Scanner과 유사하다. Bufferedwriter :System.out.println();과 유사하다. BufferdReader 사용법 BufferedReader bf = new BufferedReader(new InputStreamReader(System.in)); //선언 String s = bf.readLine(); //String int i = Integer.parseInt(bf.readLine()); //Int readLine(): 데이터 라인 단위로 읽기 가능 Scanner처럼 공백..
기본작업과정 1. 저장소 생성 2. 파일 생성 / 추가 3. 파일 수정 4. 수정 내역을 저장소에 제출 목표 명령어 설명 저장소 생성 git init 실행한 위치를 Git 저장소로 초기 저장소에 파일 추가 git add 파일이름 해당 파일을 Git이 추적할 수 있도록 저장소에 추가 저장소에 수정 내역 제출 git commit 변경된 파일을 저장소에 출력 저장소 상태 확인 = git status 현재 저장소 의 상태를 출력 1. 저장소 생성 mkdir : 디렉토리 만들기 cd : 디렉토리로 이동 git init : 저장소 초기화 2. 첫 커밋: 파일 생성 start notepad test.txt : txt 파일 만들기 cat test.txt : txt 파일 확인 git status : 저장소 상태 확인 -..
Summary Inflation 2022년 6월 물가상승률이 7%로 피크를 찍었지만 2023년 1월 기준 5.4%로 하락한 상태 그러나 FOMC의 목표치인 2%보다는 높으므로 현재도 높은 상태를 유지하는 것을 알 수 있다. 💡왜 떨어졌는가 ⇒ 공급망 병목 현상의 완화 우크라이나-러시아 전쟁으로 석유값이 오르면서 원자재값이 오르게 되었다. 이로 인해 작년 공급망 병목현상이 인플레이션상승률에 많은 기여 The labor market 노동 시장의 경우 실업률이 최저 수준이며 극도로 긴박한 상태를 유지 중이다. 💡노동 시장이 타이트하다 ⇒ 고용이 엄청나게 활발하게 진행되고 있다. 즉, 실업률이 아주 낮은 상태이다. 💡생산성 증가 추세가 우세하다 ⇒ 경기가 아직 활발하다(고용이 건전할 수록 경기는 활발) Econ..
머신러닝 학습절차: 문제정의 → 데이터전처리 → 학습 → 평가 1. 문제정의 내가 해결하고자 하는 문제가 무엇인지 이해하고, 어떤 목표를 달성하고 싶은지 정의하는 단계 지도학습은 학습데이터에 레이블이 있는 형태로 진행한다. 레이블값이 범주형 데이터, 즉 A타입, B타입, C타입 같이 범주로 구성되어있고 범주형 데이터를 예측하기 위한 문제를 ‘분류 문제’라고 한다. 💡 특히 범주 유형이 성공/실패 같이 두가지만 존재하는 문제를 “이진분류”라고 한다. 레이블 값이 범주형 데이터가 아닌 연속된 실수형인 지도학습의 유형을 ‘회귀 문제’라고 한다. 부동산 가격, 주식 가격등 수치를 예측하는 문제는 회귀 문제로 정의하고 머신러닝을 수행한다. 비지도학습은 지도학습과 다르게 학습 데이터에 레이블이 존재하지 않는다. 분..
분류의 성능 평가 지표 정확도 오차행렬 정밀도 제햔울 F1 스코어 ROC AUC 1. 정확도 정확도는 실제 데이터에서 예측 데이터가 얼마나 같은지를 판단하는 지표 불균형한 데이터의 경우에는 정확도는 적합한 평가 지표가 아니다. 2. 오차행렬 오차행렬은 학습된 분류모델이 예측을 수행하면 얼마나 헷갈리고 있는 지도 함께 보여주는 지표 이진분류의 예측 오류가 얼마인지와 어떠한 유형의 오류가 발생하고 있는지도 보여준다. 정확도 =예측결과와 실제 값이 동일한 건수 / 전체 데이터의 수 ㅇ (TN + TP) / (TN + FP + FN +TP) 3. 정밀도와 재현율 정밀도와 재현율은 Positive 데이터 세트의 예측 성능에 좀 더 초점을 맞춘 성과지표이다. 정밀도 = TP / (FP + TP) 재현율 = TP /..
머신러닝에서 Train 데이터와 Test 데이터는 모델의 학습과 성능 평가를 위해 사용되는 데이터 세트이다. Train 데이터 Train 데이터는 머신러닝 모델을 학습시키는 데 사용되는 데이터 세트이다. Train 데이터에는 입력 변수(Features)와 해당하는 정답(Label 또는 Target)이 함께 포함된다. 모델은 Train 데이터를 사용하여 입력 변수와 정답 간의 관계를 학습하여 최적의 예측 모델을 생성한다. 일반적으로 Train 데이터는 전체 데이터의 일부분으로 구성됩니다. 보통 70-80% 정도의 데이터를 Train 데이터로 사용한다. Test 데이터 Test 데이터는 학습된 머신러닝 모델의 성능을 평가하기 위해 사용되는 데이터 세트이다. Test 데이터에는 입력 변수(Features)만 ..
1. 머신러닝 컴퓨터가 데이터에서 패턴이나 규칙을 스스로 학습하여 예측이나 결정을 할 수 있는 알고리즘 기술의 집합 2. 데이터 정보의 집합으로 숫자, 텍스트, 이미지, 비디오 등으로 구성 될 수 있다. 머신러닝 모델은 데이터를 기반으로 학습하고 예측을 수행한다. 3. 모델 데이터로부터 학습된 알고리즘 또는 수학적인 함수이다. 모델은 입력된 특성을 기반으로 예측을 수행하거나 패터능ㄹ 발견한다. 4. 특성(Feature) 머신러닝 모델에 입력되는 변수들을 의미한다. 독립변수, 설명변수로 불리기도 한다. ex) 주택 가격을 예측하는 모델에서는 주택의 크기, 위치 등이 특성이 될 수 있다. => 모델은 이러한 특성을 사용하여 target변수를 예측하려고 한다. 5. 레이블(Lable) 머신러닝 모델이 학습할 ..
내 한계는 여기까지였다... 짧게 코드 쓰고 싶었는데 생각보다 잘 안됨 다시 풀고 생각정리한거 기록용으로 작성한다. def solution(n): list = [] n = str(n) for i in n: list.append(i) list.sort(reverse=True) result = ''.join(list) return int(result) 1. 빈리스트 만들기 2. int 타입 n을 str로 바꾸고 다시 n에 대입 3. for 문으로 빈 리스트에 하나씩 대입하기 4. 리스트가지고 정렬 5. 리스트에 있는걸 다시 join을 이용하여 str로 바꿔주기 6. 마지막 출력은 int형으로 => 한번에 할 수 있는 코드를 좀 돌아서 짠거 같기도 def solution(n): new_list = list(s..
프로그래머스 풀다가 join 쓰는 방법이 있길래 몰랐던 내용이여서 이김에 join함수를 정리해보았다. 파이썬의 join() 함수는 문자열, 리스트, 튜플 등의 iterable 객체를 하나의 문자열로 이어주는 역할을 한다. join()함수는 문자열(str)의 메서드로 제공하며 "구분자".join(리스트 또는 튜플 또는 문자열) 형식으로 사용한다. - "구분자": 이어지는 요소들 사이에 삽입될 문자열을 의미한다. (생략 가능) 생략한다면 기본값으로 빈 문자열(")이 사용된다. join()함수는 파이썬에서 문자열, 리스트, 튜플 등의 iterable 객체를 다룰 때 매우 유용하게 사용된다. my_list = ['apple', 'banana', 'orange'] result_str = ', '.join(my_l..
1. 넘파이 ● 리스트의 요소로 다른 리스트를 포함시키는 구조 => 2차원 배열 my_list_2 = [[10,20,30],[40,50,60]] 파이썬 리스트로 3개의 요소를 가친 1차원 배열을 2개 쌓은 예 2*3크기라고 이야기하며 2개의 행과 3개의 열 존재 [[10,20,30], [40,50,60]] ● 2차원 배열의 요소를 선택할 때 -> 2개 대괄호 사용 - 첫번째 대괄호: 행의 인덱스 - 두번째 대괄호: 열의 인덱스 print(my_list_2[1][1]) 50 두번째 열의 두번째 행을 선택했기 때문에 50출력 #넘파이는 파이썬 리스트처럼 문자열과 숫자 담을 수 없다 2. 맷플롯립 표준 그래프 패키지 별칭으로 plt를 사용 (1) 선그래프 그리기 선그래프를 그릴려면 x축 값과 y축 값을 지정해..
상관계수: 두 변수 간의 관계 정도를 측정하는 방법중 하나 피어슨 상관 계수 ● 피어슨 상관 계수는 선형 상관 관계를 측정합니다. 즉, 두 변수 간의 관계가 직선으로 나타낼 수 있는 경우 사용할 수 있습니다. ● 피어슨 상관 계수는 -1부터 1까지의 값을 가집니다. 1에 가까울수록 양의 상관 관계가 강하며, -1에 가까울수록 음의 상관 관계가 강합니다. 0은 두 변수 간에 상관 관계가 없음을 나타냅니다. ● 피어슨 상관 계수는 두 변수 모두 정규 분포를 따를 때 가장 잘 작동합니다. 또한, 이상치(outlier)가 존재할 경우에는 상관 관계를 왜곡할 수 있으므로 이를 제거하거나 대체하는 등의 전처리가 필요 할 수 있습니다. 피어슨 상관 계수 구하기 1. 두 변수의 공분산 구하기 2. 두 변수의 표준편차 ..
kiwiio_v
개발하는 키-위🥝