반응형

1. numpy 자료형

    ① 종류

        - i : integer

        - u : unsigned integer

        - f : single precision float

        - d : double precision float

        - b : bool

        - D : complex

        - S : string

        - U : Unicode

 

    ② 정수형 (int : integer)

        - 부호 있는 정수형 : int8, int16, int32, int 64

        - 부호 없는 정수형 : uint8, uint16, uint32, uint64

 

    ③ 복소수 (complex)

        - complex64 : 개의 32bit float형으로 실수와 허수부 구성

        - complex128 : 개의 64bit float형으로 실수와 허수부 구성

 

    ④ 특징

        - numpy 배열의 모든 요소는 동일한 자료형으로 구성된다.

        - 각각의 자료형은 다른 자료형으로 변환할 있는 함수를 제공한다.

        - 복소수를 정수 또는 실수형으로 변환할 없다.

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
# .int_()
 
>>> a = np.int_( [12345] )
>>> a
array([12345])
 
>>> type(a)
<class 'numpy.ndarray'>
 
>>> a.dtype
dtype('int32')
 
# _를 하지않고 하면
>>> b = np.int( [12345] )
Traceback (most recent call last):
  File "<pyshell#21>", line 1in <module>
    b = np.int( [12345] )
TypeError: int() argument must be a string, a bytes-like object or a number, not 'list'
 
cs

 

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
# .int()
 
# int 사용이 안되는건 아님.
>>> b = np.int(190)
>>> b
190
 
>>> type(b)
<class'int'>
 
>>> b.dtype
Traceback (most recent call last):
  File "<pyshell#32>", line 1in <module>
    b.dtype
AttributeError: 'int' object has no attribute 'dtype'
 
>>> c = int(111)
>>> c
111
 
>>> type(c)
<class 'int'>
 
>>> c.dtype
Traceback (most recent call last):
  File "<pyshell#39>", line 1in <module>
    c.dtype
AttributeError: 'int' object has no attribute 'dtype'
 
cs

 

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
# .float_()
 
# float_로 실수 지정
>>> x = np.float_(4)
>>> x
4.0
 
>>> x.dtype
dtype('float64')
 
# float32로 지정
>>> x = np.float32(99)
>>> x
99.0
 
>>> x.dtype
dtype('float32')
 
>>> type(x)
<class 'numpy.float32'>
 
 
# float_ 배열 생성
>>> ar = np.float_( [12345] )
>>> ar
array([1.2.3.4.5.])
 
>>> ar.dtype
dtype('float64')
 
>>> ar = np.float( [12345] )
Traceback (most recent call last):
  File "<pyshell#39>", line 1in <module>
    ar = np.float( [12345] )
TypeError: float() argument must be a string or a number, not 'list'
 
cs

 

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
# dtype=np.데이터타입
 
# 타입 지정1
>>> ar1 = np.arange( 10, dtype=np.uint8 )
>>> ar1
array([0123456789], dtype=uint8)
 
>>> ar1.dtype
dtype('uint8')
 
# 타입 지정2
>>> ar2 = np.arange( 10, dtype="uint8" )
>>> ar2
array([0123456789], dtype=uint8)
 
>>> ar2.dtype
dtype('uint8')
 
# 타입 지정3
>>> ar3 = np.arange( 10, dtype='u' )
Traceback (most recent call last):
TypeError: data type "u" not understood
 
>>> ar3 = np.arange( 10, dtype='u8' )
>>> ar3
array([0123456789], dtype=uint64)
 
>>> ar3.dtype
dtype('uint64')
 
>>> ar3 = np.arange( 10, dtype='u4' )
>>> ar3
array([0123456789], dtype=uint32)
 
>>> ar3 = np.arange( 10, dtype='u2' )
>>> ar3
array([0123456789], dtype=uint16)
 
>>> ar3 = np.arange( 10, dtype='u1' )
>>> ar3
array([0123456789], dtype=uint8)
 
>>> ar3 = np.arange( 10, dtype='<u1' )
>>> ar3
array([0123456789], dtype=uint8)
>>> ar3 = np.arange( 10, dtype='>u1' )
>>> ar3
array([0123456789], dtype=uint8)
 
cs

 

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
# 자료형 확인 - np.issubdtype
>>> ar = np.arange( 10, dtype=np.uint32 )
>>> ar
array([0123456789], dtype=uint32)
 
>>> ar1 = ar.astype( np.float64 )
>>> ar1
array([0.1.2.3.4.5.6.7.8.9.])
 
>>> ar1.dtype
dtype('float64')
 
>>> ar
array([0123456789], dtype=uint32)
 
>>> ar1
array([0.1.2.3.4.5.6.7.8.9.])
 
>>> np.issubdtype( ar.dtype, np.integer )
True
 
>>> np.issubdtype( ar.dtype, np.float )
Warning (from warnings module):
  File "<pyshell#260>", line 1
In future, it will be treated as `np.float64 == np.dtype(float).type`.
False
 
>>> np.issubdtype( ar.dtype, np.floating )
False
 
cs

 

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
# int, float, str 자료형 변환
>>> ar = np.arange( 10, dtype=np.uint8 )
>>> ar
array([0123456789], dtype=uint8)
 
>>> ar.dtype
dtype('uint8')
 
>>> ar1 = ar.astype( int )
>>> ar1
array([0123456789])
 
>>> ar1.dtype
dtype('int32')
 
>>> ar2 = ar.astype( float )
>>> ar2
array([0.1.2.3.4.5.6.7.8.9.])
 
>>> ar2.dtype
dtype('float64')
cs

 

2. 인덱싱: 배열 요소 참조

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
# 기본 인덱싱
>>> ar = np.arange(10)
>>> ar
array([0123456789])
>>> 
>>> ar[ 4 : 7 ]
array([456])
 
# 범위를 지정한 요소들의 값을 한번에 변경.
>>> ar[ 4:7 ] = 0
>>> ar
array([0123000789])
 
# [ : ]
>>> ar[ : ]
array([0123000789])
 
cs

 

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
# 2차원 배열 부터는 조금 헤갈림.
# 1차원 배열과는 달리 , 좌우로 행, 열로 분리.
>>> arar = np.array( [[123], [456], [789]] )
>>> arar
array([[123],
       [456],
       [789]])
 
>>> ar25size = np.arange(126).reshape(55)
>>> ar25size
array([[ 1,  2,  3,  4,  5],
       [ 6,  7,  8,  910],
       [1112131415],
       [1617181920],
       [2122232425]])
 
# 3행(인덱스)만 출력하는 방법
>>> ar25size[ 3, : ]
array([1617181920])
 
>>> print( ar25size[ 3, : ] )
[16 17 18 19 20]
 
>>> ar25size[ 3,  ]
array([1617181920])
 
cs

 

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
# 24를 출력하시오?
# 13을 출력하시오?
>>> ar25size
array([[ 1,  2,  3,  4,  5],
       [ 6,  7,  8,  910],
       [1112131415],
       [1617181920],
       [2122232425]])
 
>>> ar25size[ 43 ]
24
 
>>> ar25size[ 22 ]
13
 
# 17, 18, 19를 출력하시오?
# 22, 23을 출력하시오?
>>> ar25size
array([[ 1,  2,  3,  4,  5],
       [ 6,  7,  8,  910],
       [1112131415],
       [1617181920],
       [2122232425]])
 
>>> ar25size[ 31:4 ]
array([171819])
 
>>> ar25size[ 41:3 ]
array([2223])
 
cs

 

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
# 2행만 출력하시오?  11 12 13 14 15
>>> ar25size
array([[ 1,  2,  3,  4,  5],
       [ 6,  7,  8,  910],
       [1112131415],
       [1617181920],
       [2122232425]])
 
>>> ar25size[ 2 : 3 ]
array([[1112131415]])
 
# 2, 3행 두행을 출력하시오?
>>> ar25size[ 2 : 4 ]
array([[1112131415],
       [1617181920]])
 
# 2, 3, 4행을 출력하시오?
>>> ar25size[ 2 : 5 ] 
array([[1112131415],
       [1617181920],
       [2122232425]])
 
>>> ar25size[ 2 :   ] #이것도 위와 동일!
 
cs

 

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
# 4행만 출력하시오? (다양한 방법으로 출력)
>>> ar25size
array([[ 1,  2,  3,  4,  5],
       [ 6,  7,  8,  910],
       [1112131415],
       [1617181920],
       [2122232425]])
 
>>> ar25size[ 4 ]
array([2122232425])
 
>>> ar25size[ 4, : ]
array([2122232425])
 
>>> ar25size[ 4,  ]
array([2122232425])
 
>>> ar25size[ -1 ]
array([2122232425])
 
>>> ar25size[ -1, : ]
array([2122232425])
 
>>> ar25size[ -1,  ]
array([2122232425])
cs

 

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
# 역인덱스
>>> ar25size
array([[ 1,  2,  3,  4,  5],
       [ 6,  7,  8,  910],
       [1112131415],
       [1617181920],
       [2122232425]])
 
>>> ar25size[ -1 ]
array([2122232425])
 
>>> ar25size[ -2 ]
array([1617181920])
 
>>> ar25size[ -3 ]
array([1112131415])
 
>>> ar25size[ -4 ]
array([ 6,  7,  8,  910])
 
>>> ar25size[ -5 ]
array([12345])
 
cs

 

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
# 열(Column) 기준으로 인덱싱
# 각 행의 2열 값만 출력하시오?
# 3, 8, 13, 18, 23
>>> ar25size
array([[ 1,  2,  3,  4,  5],
       [ 6,  7,  8,  910],
       [1112131415],
       [1617181920],
       [2122232425]])
 
>>> ar25size[ : , 2 ]
array([ 3,  8131823])
 
>>> ar25size[    , 2 ]
SyntaxError: invalid syntax
 
# 각 행의 4열 값만 출력하시오?
>>> ar25size[ : , 4 ]
array([ 510152025])
 
>>> ar25size[ : , -1 ]
array([ 510152025])
 
cs

 

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
# 열(Column) 기준 역인덱싱
>>> ar25size
array([[ 1,  2,  3,  4,  5],
       [ 6,  7,  8,  910],
       [1112131415],
       [1617181920],
       [2122232425]])
 
>>> ar25size[ : , -1 ]
array([ 510152025])
 
>>> ar25size[ : , -2 ]
array([ 4,  9141924])
 
>>> ar25size[ : , -3 ]
array([ 3,  8131823])
 
>>> ar25size[ : , -4 ]
array([ 2,  7121722])
 
>>> ar25size[ : , -5 ]
array([ 1,  6111621])
 
cs

 

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
# 3미만인 열(인덱스)의 값을 출력?
# 먼저 배열에서 어떤 부분을 출력하는지 파악!
>>> ar25size
array([[ 1,  2,  3,  4,  5],
       [ 6,  7,  8,  910],
       [1112131415],
       [1617181920],
       [2122232425]])
 
>>> ar25size[  : ,  :3 ] #미만은 3이 포함 안됨.
array([[ 1,  2,  3],
       [ 6,  7,  8],
       [111213],
       [161718],
       [212223]])
cs

 

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
# 3미만인 열(인덱스)의 값을 출력?
# 먼저 배열에서 어떤 부분을 출력하는지 파악!
>>> ar25size
array([[ 1,  2,  3,  4,  5],
       [ 6,  7,  8,  910],
       [1112131415],
       [1617181920],
       [2122232425]])
 
>>> ar25size[  : ,  :3 ] #미만은 3이 포함 안됨.
array([[ 1,  2,  3],
       [ 6,  7,  8],
       [111213],
       [161718],
       [212223]])
cs

 

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
# 2, 3, 4, 7, 8, 9 값을 0으로 채우시오?
>>> ar25size
array([[ 1,  2,  3,  4,  5],
       [ 6,  7,  8,  910],
       [1112131415],
       [1617181920],
       [2122232425]])
 
 
# 먼저 해당 부분만 출력.
>>> ar25size[   :2   ,   1:4   ]
array([[234],
       [789]])
 
# 그리고 0으로 입력.
>>> ar25size[ :2 , 1:-1 ] = 0
>>> ar25size
array([[ 1,  0,  0,  0,  5],
       [ 6,  0,  0,  010],
       [1112131415],
       [1617181920],
       [2122232425]])
cs

 

3. View

    ① 개요

        - 기본적인 인덱싱으로 넘파이 배열에 대한 (View) 만들 있다.

        - ‘뷰’란 원본 배열의 일부분에 접근하기 위해서 만든 하나의 작은 배열 개념으로 보면 된다.

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
# [][] 방법으로 색인
 
>>> ar30size
array([[ 1,  2,  3,  4,  5,  6],
       [ 7,  8,  9101112],
       [131415161718],
       [192021222324],
       [252627282930]])
 
>>> ar30size[0]
array([123456])
 
>>> ar30size[2]
array([131415161718])
 
>>> ar30size[4]
array([252627282930])
 
>>> ar30size[-1]
array([252627282930])
 
>>> ar30size[4][4]
29
cs

 

        - 메모리상에 위한 원본 배열의 사본을 만들지 않기 때문에자체는 아무리 많이 만들어도 괜찮다.

        - 자체를 만든 정도의 메모리 사용량만 늘어날 뿐이다.

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
# # [][] 방법으로 8~12 요소들만 출력하시오?
 
>>> ar25size
array([[ 1,  2,  3,  4,  5,  6],
       [ 7,  8,  9101112],
       [131415161718],
       [192021222324],
       [252627282930]])
 
>>> ar25size[ 1 ][ 1: ]
array([ 8,  9101112])
 
>>> ar25size[ -1 ][ 2:5 ] #27 28 29
array([272829])
 
cs

 

        - ‘뷰’를 통해서 원본 배열의 일부분을 수정하게 되면 원본에도 영향을 끼치기 때문에 원본의 요소도 변경된다는 것을 주의하자!

        - 따라서 단순히 어떤 원본 배열의 일부분을 보기(=접근하기, 참조하기)위한 뿐이다. 라는 생각을 잊지말자!

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
# a 변수에 담아서 값을 변경해보시오?
>>> ar30size
array([[ 1,  2,  3,  4,  5,  6],
       [ 7,  8,  9101112],
       [131415161718],
       [192021222324],
       [252627282930]])
 
 
>>> a = ar25size[-1][ 2:5 ]
>>> a
array([272829])
 
>>> a[-1= 0
>>> a
array([2728,  0])
 
>>> ar30size
array([[ 1,  2,  3,  4,  5,  6],
       [ 7,  8,  9101112],
       [131415161718],
       [192021222324],
       [25262728,  030]])
cs

 

4. numpy 고유 인덱싱 방법

    ① 개념

        - 예를 들어, [ 1, 1: ] 같이 배열 요소에 접근하는 방식이 넘파이 고유 인덱싱 방식이다.

        - 파이썬 중첩 리스트에서는 이와 같은 방식으로 요소에 접근하면 에러가 발생한다.

1
2
3
4
5
6
7
8
9
>>> ar30size
array([[ 1,  2,  3,  4,  5,  6],
       [ 7,  8,  9101112],
       [131415161718],
       [192021222324],
       [25262728,  030]])
 
>>> ar30size[ 11: ]
array([ 8,  9101112])
cs

 

        - 파이썬 배열 접근과 넘파이가 지정된 요소에 접근하는 방식을 구별하여 사용한다.

        -  넘파이 고유 인덱싱 방식이 빠르기 때문에 가능한 넘파이 고유 방식을 사용한다.

1
2
3
4
5
6
7
8
9
10
11
12
>>> ar2d_np = np.array( [[12345], [678910]] )
 
>>> ar2d_np
array([[ 1,  2,  3,  4,  5],
       [ 6,  7,  8,  910]])
 
>>> ar2d_np = np.array( [[12345], [678910]] )
 
>>> ar2d_np
array([[ 1,  2,  3,  4,  5],
       [ 6,  7,  8,  910]])
 
cs

 

 

    ② 짝수 또는 홀수 행렬 출력

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
# for문을 이용하여 홀수행만 출력
>>> ar30size = np.arange(131).reshape(56)
>>> ar30size
array([[ 1,  2,  3,  4,  5,  6],
       [ 7,  8,  9101112],
       [131415161718],
       [192021222324],
       [252627282930]])
 
>>> for i in range(5):    # 5 대신 ar30size[ ar30size.shape[0] ]
    if i % 2 == 0:
       print( ar30size[i] )
 
[1 2 3 4 5 6]
[13 14 15 16 17 18]
[25 26 27 28 29 30]
 
cs

 

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
# for문을 이용하여 홀수열만 출력
>>> ar30size = np.arange(131).reshape(56)
>>> ar30size
array([[ 1,  2,  3,  4,  5,  6],
       [ 7,  8,  9101112],
       [131415161718],
       [192021222324],
       [252627282930]])
 
>>> for i in range(5):            # 5 대신 ar30size[ ar30size.shape[0] ]
    for j in range(6):         # 6 대신 ar30size[ ar30size.shape[1] ]
        if j % 2 == 0:
            print( ar30size[i][j], end=‘ ‘ )
    print()
 
1 3 5 
7 9 11 
13 15 17 
19 21 23 
25 27 29
 
cs

 

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
# for문 대신 numpy 방식으로 출력
 
>>> ar30size
array([[ 1,  2,  3,  4,  5,  6],
       [ 7,  8,  9101112],
       [131415161718],
       [192021222324],
       [252627282930]])
 
# 홀수 행만 출력
>>> ar30size[ : : 2 ]
array([[ 1,  2,  3,  4,  5,  6],
       [131415161718],
[252627282930]])
 
# 짝수 행만 출력
>>> ar30size[ 1 :  : 2 ]
array([[ 7,  8,  9101112],
       [192021222324]])
 
>>> ar30size[ : : 3 ]
array([[ 1,  2,  3,  4,  5,  6],
       [192021222324]])
 
cs

 

5. Broadcasting

    ① 개요

        - umpy에서는 형상(모양) 다른 배열간의 연산을 효율적으로 그리고 빠르게 처리하기 위해서 형상(모양) 맞춰서 연산시키려 한다.

        - 이러한 것을 배열 연산을 위한확장이라고 표현하며 브로드캐스팅 처리라고 한다.

        - , 넘파이 내부에서 형상(모양) 다른 배열간의 효율적인 연산을 처리하기 위해서 배열의 형상(모양) 확장시키는 것이다.

 

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
# ndarray에 스칼라(상수) 3 값 더하기
>>> a = np.array( [12345] )
>>> a
array([12345])
 
>>> a.ndim
1
 
>>> a.shape
(5,)
 
>>> a.size
5
 
# a 배열에 스칼라 3을 더하면?
>>> a + 3
array([45678])
 
# 이런 연산이 가능한 이유는
# 넘파이에서 '브로드캐스팅' 처리하여 이러한 계산을 가능하도록 해주기 때문이다.
# '브로드캐스팅'은 넘파이 모듈 내부에서 자동으로 수행되어, 
# 스칼라 3은 넘파이 내부에서 np.array([3, 3, 3, 3, 3])로 확장되어 계산된다.
 
cs

 

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
# 넘파이는 형상이 다르면 연산이 오류가 발생한다.
>>> a = np.array( [12345] )
>>> b = np.array( [123] )
 
>>> a
array([12345])
 
>>> b
array([123])
 
>>> a + b
Traceback (most recent call last):
  File "<pyshell#116>", line 1in <module>
    a + b
ValueError: operands could not be broadcast together with shapes (5,) (3,) 
 
# 앞서의 스칼라 연산하고는 다르게 오류가 발생했다.
# 그럼 스칼라 연산을 다시 해보자.
>>> a + 1
array([23456])
 
>>> b + 2
array([345])
cs

 

    ② 규칙

        - 스칼라 값과의 연산은 브로드캐스팅이 가능하다.

        - 차원이 같거나 어느 한쪽의 배열 크기가 1 경우(행이든 열이든) 브로드캐스팅이 가능하다.

        - 차원에 대해 (Axis) 길이가 동일하다면 브로드캐스팅이 가능하다.

1
2
3
4
5
6
7
8
9
10
>>> a = np.ones( (44) )
>>> b = np.arange(4)
 
>>> # a + b 연산 결과는?
>>> a + b
array([[1.2.3.4.],
       [1.2.3.4.],
       [1.2.3.4.],
       [1.2.3.4.]])
 
cs

 

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
# 브로드캐스팅 기본개념 이해2
>>> a = np.arange(5).reshape(51)
>>> b = np.arange(5)
 
>>> a
array([[0],
       [1],
       [2],
       [3],
       [4]])
 
>>> b
array([01234])
 
>>> a + b
array([[01234],
       [12345],
       [23456],
       [34567],
      [45678]])
cs

 

 

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
# 브로드캐스팅 기본개념 이해3
>>> a = np.arange(5).reshape(51)
>>> b = np.arange(3)
 
>>> a
array([[0],
       [1],
       [2],
       [3],
       [4]])
 
>>> b
array([01234])
>>> 
>>> a + b
 
cs

 

6. indexing, slicing

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
>>> a = np.array( [123456789] )
>>> a
array([123456789])
 
>>> a[ 4 : 8 ]
array([5678])
 
>>> a[ 5 : -1 ]
array([678])
 
>>> a[ 1 : 4 : 2 ]
array([24])
 
>>> a[ 3 : 8 : 2 ]
array([468])
cs

 

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
>>> a = np.arange(110).reshape(33)
>>> a
array([[123],
       [456],
       [789]])
 
 
>>> a[0]
array([123])
 
>>> a[1]
array([456])
 
>>> a[2]
array([789])
 
>>> a[0][1]
2
 
>>> a[2][2]
9
cs

 

7. 3차원 배열

1
2
3
4
5
6
7
8
9
10
11
12
13
# 3차원 배열 생성
>>> a = np.array([[[1234],[1234],[1234]],[[1234],[1234],[1234]]])
 
>>> a
array([[[1234],
         [1234],
         [1234]],
        [[1234],
         [1234],
         [1234]]])
 
>>> a.shape
(234)
cs

 

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
# 3차원 배열 인덱싱
 
>>> a = np.arange(27).reshape(333)
 
>>> a
array([[[ 0,  1,  2],
         [ 3,  4,  5],
         [ 6,  7,  8]],
        [[ 91011],
         [121314],
         [151617]],
        [[181920],
         [212223],
         [242526]]])
 
>>> a[0]
array([[012],
       [345],
       [678]])
 
 
>>> a[02]
array([678])
 
 
>>> a[02-1]
8
cs

 

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
# 3차원 배열 슬라이싱
 
>>> a
array([[[ 0,  1,  2],
         [ 3,  4,  5],
         [ 6,  7,  8]],
        [[ 91011],
         [121314],
         [151617]],
        [[181920],
         [212223],
         [242526]]])
 
>>> a[ -1-1, :2 ]
array([2425])
cs

 

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
# 3차원 배열 슬라이싱
>>> a = np.arange(151).reshape( _______________ )
 
>>> a
array([[[ 1,  2,  3,  4,  5],
        [ 6,  7,  8,  910],
        [1112131415],
        [1617181920],
        [2122232425]],
       [[2627282930],
        [3132333435],
        [3637383940],
        [4142434445],
        [4647484950]]])
 
>>>_________________________________________
array([[373839],
       [424344],
       [474849]])
cs

 

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
# (문제) 2차원 배열과 3차원 배열을 각각 arange()로 생성한 후 각 요소들의 값을 for문으로 출력하시오? 이때, 2차원 배열의 요소 수는 25개로 하고 3차원 배열의 요소 수는 60개로 한다.
 
>>> ar2d = np.arange( 126 ).reshape( 55 )
 
>>> ar2d
array([[ 1,  2,  3,  4,  5],
       [ 6,  7,  8,  910],
       [1112131415],
       [1617181920],
       [2122232425]])
 
>>> for x_ in range(05):
    for y_ in range(05):
        ar2d[x_][y_] = a[x_][y_]
        print( ar2d[x_][y_], end='\t' )
    print()
cs

 

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
>>> ar3d = np.arange( 1 , 61 ).reshape( 345 )
>>> ar3d
array([[[ 1,  2,  3,  4,  5],
         [ 6,  7,  8,  910],
         [1112131415],
         [1617181920]],
        [[2122232425],
         [2627282930],
         [3132333435],
         [3637383940]],
        [[4142434445],
         [4647484950],
         [5152535455],
         [5657585960]]])
 
for x_ in range(03):
    for y_ in range(04):
        for z_ in range(05):
         ar3d[x_][y_][z_] = ar3d[x_][y_][z_]
         print( ar3d[x_][y_][z_], end='\t' )
 print()
    print()
cs

 

반응형
반응형

1. 시험환경

    · AWS EC2 Ubuntu Linux

        - t2.large

        - AMI-ID: ami-09a7535106fbd42d5 (ubuntu/images/hvm-ssd/ubuntu-jammy-22.04-amd64-server-20240301)

 

2. 목적

    · Langchain 관련 라이브러리를 설치한다.

    · OpenAI의 API와 연동하여 Langchain 기초 사용법을 학습한다.

 

3. 적용

    ① 테스트를 위한 라이브러리를 설치한다.

        - $ sudo apt install python3-pip

        - $ pip install langchain
        - $ pip install langchain-openai
        - $ pip install bs4
        - $ pip install sentence-transformers
        - $ pip install faiss-cpu

 

     OpenAI의 API 키를 이용하여 질문하고 응답 결과를 확인한다.

        - 코드)

 

        - 결과)

 

     PromptTemplate 클래스를 사용하여 동적으로 프롬프트(질문)를 생성한다.

        - 코드)

 

        - 결과)

 

     동적으로 생성한 프롬프트(질문)를 OpenAI에게 질문하고 이에 대한 응답을 확인한다.

        - 코드)

 

        - 결과)

 

     ConversationChain을 사용하여 두 입력에 대한 대화 예측을 수행하고 그 결과를 출력한다.

        - 코드)

 

        - 결과)

 

     로드한 특정 문서를 1000자 단위로 나누고, 분할된 chunk의 갯수 및 첫 번째 chunk를 출력한다.

        - 코드)

 

        - 결과)

 

    과정에서 수행한 결과(chunk)를 요약하여 출력하는 코드가 추가되었다.

        - 코드)

 

        - 결과)

 

     HuggingFace 임베딩을 기반으로 데이터 벡터화 및 FAISS 인덱싱 시스템을 통해 이를 저장한다.

        - 코드)

 

        - 결과)

 

     벡터 스토어를 활용하여 최근 이슈에 대한 쿼리를 실행하고, 결과를 확인한다.
        - 코드)

 

        - 결과)  Chat GTP3는 2024년 4월 기준(러시아 대통령 선거) 정보를 갖고 있지 않다.

 

반응형
반응형

1. 시험환경

    ˙ 윈도우

    ˙ python, venv, pip

 

2. 목적

    ˙ 프로젝트 별 패키지 버전을 관리 하기 위해 파이썬 가상화 환경에서 개발한다.

    ˙ venv 관련 명령어 및 패키지 관리법에 대하여 알아보자.

 

3. 적용

    ① 파이썬이 설치되어 있어야 한다.

        - 참고 : https://languagestory.tistory.com/31

 

Window 파이썬(python) 설치하기

1. 시험환경 ˙ 윈도우 ˙ 파이썬 2. 목적 ˙ 윈도우 운영체제에서 파이썬을 설치한다. 3. 적용 ① 파이썬 공식 사이트에 접속하여 "Downloads" 메뉴를 클릭한다. - https://www.python.org/ ② 설치 프로그램이

languagestory.tistory.com

 

    ② 생성 : 가상환경을 생성하면 "가상환경-이름"으로 하위폴더가 생성된다.

        - python -m venv [가상환경-이름]

        - 보통, [가상환경-이름].venv로 지정하는 것이 관례이다.

 

    ③ 활성화 : 커맨드라인 맨 왼쪽에 (가상환경-이름)이 붙는 것을 확인하면 활성화 모드로 진입한다.

        - [가상환경-이름]/Scripts/activate.bat

 

    ④ 활성화 모드에서 "deactivate" 명령어를 입력하면 비활성화 된다.

 

    ⑤ 가상환경 내에서 패키지 설치/삭제

        - 가상환경 활성화 상태에서 "pip install" 명령어로 패키지 설치
        - 가상환경 활성화 상태에서 "pip uninstall" 명령어로 패키지 삭제

        - 가상환경 생성 폴더 내에서 작업한 것에 유의한다.

 

    ⑥ 설치 패키지를 확인하고 다른 환경에서도 동일한 패키지를 일괄 설치할 경우의 명령어를 실행한다.

        - pip freeze
        - pip freeze > requirements.txt
        - pip install -r requirements.txt

가상환경에서 설치한 패키지만 포함

 

     가상환경 및 관련 패키지 삭제

        - 폴더를 삭제한다 :  [가상환경-이름] 폴더

 

반응형

+ Recent posts