본문 바로가기
코드/python

파이썬 딕셔너리 ( Dictionnary) 관련

by WeZZ 2011. 12. 31.

‘사람’을 예로 들면 누구든지 “이름” = “홍길동”, “생일” = “몇 월 몇 일” 등으로 구분할 수 있다. 파이썬은 영리하게도 이러한 대응관계를 자료형으로 만들었다. 이것은 요즘 나오는 대부분의 언어들도 갖고 있는 자료형으로 Associative array, Hash라고도 불린다.

딕셔너리란 단어 그대로 해석하면 사전이란 뜻이다. 즉, people 이란 단어에 ‘사람’, baseball 이라는 단어에 ‘야구’라는 뜻이 부합되듯이 딕셔너리는 Key와 Value라는 것을 한 쌍으로 갖는 자료형이다. 위의 예에서 보면 Key가 'baseball'이라면 Value는 '야구'가 될 것이다.

딕셔너리는 리스트나 터플처럼 순차적으로(sequential) 해당 요소 값을 구하지 않고 key를 통해 value를 얻는다. 딕셔너리의 가장 큰 특징이라면 key로 value를 얻어낸다는 점이다. baseball이란 단어의 뜻을 찾기 위해서 사전의 내용을 순차적으로 모두 검색하는 것이 아니라 baseball이라는 단어가 있는 곳만을 펼쳐보는 것이다.


딕셔너리는 어떻게 생겼을까?

다음은 기본적인 딕셔너리의 모습이다.

{Key1:Value1, Key2:Value2, Key3:Value3,,,,}

즉, Key와 Value쌍들이 여러개가 '{'과 '}'으로 둘러싸이고 각각의 요소는 Key : Value형태로 이루어져 있고 쉼표(',')로 구분되어져 있음을 볼 수 이다.


다음의 딕셔너리 예를 보도록 하자.

>>> dic = {'name':'pey', 'phone':'0119993323', 'birth': '1118'}

위에서 key는 각각 ‘name’, ‘phone’, ‘birth’이고 그에 해당하는 value는 ‘pey’, ‘0119993323’, ‘1118’이 된다. 


이것을 보기 좋게 테이블로 만들어 보았다.

<딕셔너리 dic의 정보>

key value
name pey
phone 01199993323
birth 1118

 

>>> a = {1: 'hi'}

위의 예는 Key로 정수값 1을 Value로 'hi'란 문자열을 사용한 예이다.
 

>>> a = { 'a': [1,2,3]}

또한 위의 예처럼 Value에 리스트도 넣을 수 있다.


딕셔너리 사용하기

딕셔너리는 주로 어떤 것을 표현하는 데 쓸 수 있을까? 라는 의문이 들 것이다. 4명의 사람이 있는데 각각의 사람의 특기를 표현할 수 있는 좋은 방법에 대해서 생각해 보자. 리스트나 문자열로는 표현하기가 상당히 까다로울 것이다. 하지만 파이썬의 딕셔너리를 사용한다면 위의 상황을 표현하는 것은 정말 쉽다.


다음의 예를 보자.

{“홍길동”:“칼싸움”, “임꺽정”:“주먹질”, “김두한”:“발길질”, “귀도”:“파이썬”}

사람이름과 특기를 한쌍으로 하는 딕셔너리이다. 정말 간편하지 않은가? 지금껏 우리는 딕셔너리를 만드는 방법에 대해서만 살펴 보았는데 이것들을 제대로 활용하기 위해서 알아야 할 것들이 있다. 그것들에 대해서 알아보도록 하자.


Key이용하여 Value얻기

다음의 예를 따라해 보도록 하자.

>>> grade = {'pey': 10, 'julliet': 99}
>>> grade['pey']
10
>>> grade['julliet']
99

리스트나 터플이나 문자열은 요소값을 얻어내기 위해서 인덱싱이나 슬라이싱이라는 기법을 사용했지만 딕셔너리는 단 한가지의 방법만이 있을 뿐이다. 바로 Key를 이용해서 Value를 얻어내는 방법이다. 위의 예에서처럼 Value를 얻기 위해서는 "딕셔너리변수[Key]"와 같이 하여 Value를 얻을 수 있다.


몇가지 예를 더 보도록 하자.

>>> a = {1:'a', 2:'b'}
>>> a[1]
'a'
>>> a[2]
'b'

먼저 a라는 변수에 {1:'a', 2:'b'}라는 딕셔너리를 대입하였다. 위의 예에서 보듯이 a[1]은 'a'라는 값을 돌려준다. 여기서 a[1]이 의미하는 것은 리스트나 터플의 a[1]과는 아주 다른 것이다. 여기서 [ ] 안의 숫자 1은 몇번째 요소를 뜻하는 것이 아니라 Key에 해당하는 1을 나타낸다. 딕셔너리는 리스트나 터플의 인덱싱 방법이란 것이 존재하지 않는다. 따라서 a[1]은 딕셔너리 {1:'a', 2:'b'}에서 Key가 1인것의 Value인 'a'를 돌려주게 된다. a[2] 역시 마찬가지이다.
 

>>> a = {'a':1, 'b':2}
>>> a['a']
1
>>> a['b']
2 

이번에는 a라는 변수에 위에서 사용했던 딕셔너리의 Key와 Value를 뒤집어 놓은 딕셔너리를 대입해 보았다. 역시 a['a'], a['b']처럼 Key를 이용해서 Value를 얻을 수 있다. 이상 정리해 보면 딕셔너리 a 는 a[Key] 처럼 해서 Key에 해당하는 Value를 얻을 수 있다.


다음은 위에서 한번 언급했던 딕셔너리인데 Key를 이용하여 Value를 얻는 방법을 잘 보여주고 있다.

>>> dic = {'name':'pey', 'phone':'0119993323', 'birth': '1118'}
>>> dic['name']
'pey'
>>> dic['phone']
'0119993323'
>>> dic['birth']
'1118' 


딕셔너리 쌍 추가, 삭제하기

딕셔너리 쌍을 추가하는 방법은 Key를 이용해 Value를 호출했던 것처럼 새로운 Key에 Value를 설정하면 바로 딕셔너리에 추가된다. 예 1부터 예 3까지는 딕셔너리를 추가하는 예를 보여준다. 딕셔너리는 순서를 따지지 않는다. 예에서 알 수 있듯이 추가되는 순서는 원칙이 없다. 중요한 것은 “무엇이 추가되었는가” 이다.


다음의 예를 함께 따라해 보자.

예 1) 딕셔너리 쌍 추가1

>>> a = {1: 'a'}
>>> a[2] = 'b'
>>> a
{2: 'b', 1: 'a'}

{1: 'a'}라는 딕셔너리에 a[2] = 'b'와 같이 사용해서 2 : 'b' 라는 딕셔너리 쌍을 추가하였다.


예 2) 딕셔너리 쌍 추가2

>>> a['name'] = 'pey'
{'name':'pey', 2: 'b', 1: 'a'} 

딕셔너리 a에 'name': 'pey'라는 쌍을 추가한 모습이다.


예 3) 딕셔너리 쌍 추가3

>>> a[3] = [1,2,3]
{'name': 'pey', 3: [1, 2, 3], 2: 'b', 1: 'a'} 

Key는 3 Value는 [1, 2, 3]을 가지는 한 쌍을 또 추가하였다.


예 4) 딕셔너리 요소 삭제 1

>>> del a[1]
>>> a
{'name': 'pey', 3: [1, 2, 3], 2: 'b'} 

예 4는 딕셔너리의 요소를 지우는 방법을 보여준다. del a[key]하면 그에 해당하는 key:value 쌍이 삭제된다.


딕셔너리 주의사항

딕셔너리를 만들때 주의해야 할 사항은 Key는 고유한 값이므로 중복되는 값을 설정해 놓으면 하나를 제외한 나머지의 것들은 무시된다는 점이다. 다음 예에서 보듯이 Key가 동일한 것이 존재할 경우 1:'a'라는 쌍이 무시된다. 이때 꼭 딕셔너리를 만들 때 앞에 썼던 것이 무시되는 것은 아니고 어떤 것이 무시될지는 예측이 불가능하다. 결론은 중복되는 Key를 사용하지 말라는 것이다.

>>> a = {1:'a', 1:'b'}
>>>{1: 'b'}

이렇게 중복되었을 때 한 개를 제외한 나머지의 Key:Value값이 무시되는 이유는 딕셔너리는 Key를 통해서 Value를 얻게 되는데 만약 동일한 Key가 존재 한다면 어떤 Key에 해당하는 Value를 불러야 할지 알 수가 없기 때문이다.

또 한 가지 주의해야 할 사항으로는 Key에 리스트는 쓸 수가 없다는 것이다. 하지만 터플은 Key로 쓸 수가 있다. 딕셔너리의 Key로 쓸 수 있고 없고의 구별은 Key가 변하는 값인지 변하지 않는 값인지에 달려 있다. 리스트를 Key로 사용한다면 그 값이 변할 수 있기 때문에 리스트를 Key로 쓸 수 없는 것이다. 아래 예처럼 리스트를 Key로 설정하면 TypeError가 난다.

>>> a = {[1,2] : 'hi'}
Traceback (most recent call last):
File "", line 1, in ?
TypeError: unhashable type 

따라서 딕셔너리의 Key를 딕셔너리로 할 수 없음은 당연한 얘기가 될 것이다. Value에는 변하는 값이든 변하지 않는 값이든 상관없이 아무 값이나 넣을 수 있다.


딕셔너리 관련함수

딕셔너리를 자유자재로 사용하기 위해 딕셔너리가 자체적으로 가지고 있는 관련 함수들을 사용해 보도록 하자.


Key리스트 만들기(keys)
 

>>> a = {'name': 'pey', 'phone': '0119993323', 'birth': '1118'}
>>> a.keys()
['birth', 'name', 'phone']

a.keys()는 딕셔너리 a의 Key만을 모아서 리스트로 만든다. 만들어진 리스트 요소들의 순서는 일정한 규칙이 있는 것이 아니라 상황에 따라서 바뀌게 된다. 따라서 독자의 결과값과 위의 예제의 결과값인 ['birth', 'name', 'phone']순서는 바뀔 수도 있다. 딕셔너리는 Key로 value를 찾기 때문에 그 순서는 상관하지 않는다.


Value리스트 만들기 (values)

>>> a.values()
['1118', 'pey', '0119993323']

마찬가지 방법으로 value만을 얻고 싶다면 a.values()처럼 values 함수를 사용하면 된다.


Key, Value 쌍 얻기(items)

>>> a.items()
[('birth', '1118'), ('name', 'pey'), ('phone', '011993323')]

items 함수는 key와 value의 쌍을 터플로 묶은 값을 리스트로 돌려준다.


Key: Value 쌍 모두 지우기(clear)

>>> a.clear()
>>> a
{}

clear() 함수는 딕셔너리 안의 모든 요소를 삭제한다. 위에서 보듯이 빈 리스트가 [] 빈 터플이 ()인 것과 마찬가지로 빈 딕셔너리도 {}과 같이 표현된다.


Key로 Value얻기 (get)

>>> a = {'name':'pey', 'phone':'0119993323', 'birth': '1118'}
>>> a.get('name')
'pey'
>>> a.get('phone')
'0119993323' 

get(x) 함수는 x 라는 key에 대응되는 value를 돌려준다. 앞서 살펴 보았듯이 a.get('name')은 a['name']처럼 사용하는 것과 완전히 동일한 결과값을 돌려 받는다. 어떤 것을 사용하는가는 독자의 선택이다.


해당 Key가 있는지 조사 (has_key)

>>> a = {'name':'pey', 'phone':'0119993323', 'birth': '1118'}
>>> a.has_key('name')
True
>>> a.has_key('email')
False

a.has_key(x) 함수는 딕셔너리 a에 x라는 key가 존재하는지의 참, 거짓을 판단하여 존재하면 1을 존재하지 않는다면 0을 반환한다.

 


위에서 살펴본 딕셔너리 관련 함수를 정리하여 표로 만들어 보았다.

딕셔너리의 관련 함수 (여기서 a라는 변수는 임의로 설정한 딕셔너리 변수이다.)

함수 설명
a.keys() 딕셔너리 a의 Key들을 모아놓은 리스트를 돌려준다.
a.values() 딕셔너리 a의 Value들을 모아놓은 리스트를 돌려준다.
a.items() 딕셔너리 a의 (Key, Value)쌍의 터플을 모아놓은 리스트를 돌려준다.
a.clear() 딕셔너리 a의 모든 Key:Value 쌍들을 삭제한다.
a.get(x) 딕셔너리 a의 Key가 x인 것의 Value를 돌려준다.
a.has_key(x) 딕셔너리 a에 x라는 Key가 있는지 조사하여 참, 거짓을 돌려준다.


이상과 같이 파이썬에서 사용되는 가장 기본이 되는 자료형인 숫자, 문자열, 리스트, 터플, 딕셔너리에 대해서 알아 보았다. 여기까지 잘 따라온 독자라면 파이썬에 대해서 대략 50% 정도 습득했다고 보아도 된다. 그만큼 위에서 언급한 자료형들은 중요하기 때문이다. 책에 있는 예제들만 따라하지 말고 직접 여러 가지 예들을 만들어 보고 테스트해 가며 반복해서 위의 자료형들에 익숙해지기를 당부한다. 왜냐하면 자료형은 프로그램의 근간이 되기 때문에 확실하게 해 놓지 않으면 좋은 프로그램을 만들 수 없기 때문이다.

출처 : http://codejob.co.kr/docs/page/32/