shoo. 2023. 9. 10. 21:48

Pandas์˜ loc๋Š” ๋ ˆ์ด๋ธ” ๊ธฐ๋ฐ˜ ๋ฐ์ดํ„ฐ ์„ ํƒ ๋ฐฉ๋ฒ•์„ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค. ์ฆ‰, ์ธ๋ฑ์Šค์˜ ์ด๋ฆ„์ด๋‚˜ ์—ด ๋ ˆ์ด๋ธ”๋กœ ๋ฐ์ดํ„ฐ๋ฅผ ์„ ํƒํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.

๊ธฐ๋ณธ ํ˜•ํƒœ   DataFrame.loc[<row_selection>, <column_selection>]

<row_selection>: ์„ ํƒํ•˜๋ ค๋Š” ํ–‰์„ ์ง€์ •ํ•ฉ๋‹ˆ๋‹ค. ์ด๋Š” ๋‹จ์ผ ๋ ˆ์ด๋ธ”, ๋ ˆ์ด๋ธ” ๋ฆฌ์ŠคํŠธ, ๋ ˆ์ด๋ธ” ์Šฌ๋ผ์ด์‹ฑ, ๋ถˆ๋ฆฌ์–ธ ๋ฐฐ์—ด ๋“ฑ ๋‹ค์–‘ํ•œ ํ˜•ํƒœ๊ฐ€ ๋  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.
<column_selection>: ์„ ํƒํ•˜๋ ค๋Š” ์—ด์„ ์ง€์ •ํ•ฉ๋‹ˆ๋‹ค. ์ด๋„ ๋งˆ์ฐฌ๊ฐ€์ง€๋กœ ๋‹จ์ผ ๋ ˆ์ด๋ธ”, ๋ ˆ์ด๋ธ” ๋ฆฌ์ŠคํŠธ, ๋ ˆ์ด๋ธ” ์Šฌ๋ผ์ด์‹ฑ ๋“ฑ์œผ๋กœ ์ง€์ •๋ฉ๋‹ˆ๋‹ค.

 

# 'A' ์—ด ์„ ํƒ
df.loc[:, 'A']

# 'A'์™€ 'B'์—ด ์„ ํƒ
df.loc[:, ['A', 'B']]

# ์ธ๋ฑ์Šค 0๋ถ€ํ„ฐ 2๊นŒ์ง€ ํ–‰๊ณผ ๋ชจ๋“  ์—ด ์„ ํƒ
df.loc[0:2,:]

# ์กฐ๊ฑด์— ๋”ฐ๋ฅธ ํ–‰๊ณผ ๋ชจ๋“  ์—ด ์„ ํƒ (์˜ˆ: A์—ด ๊ฐ’ > 5)
df.loc[df['A'] > 5,:]

 

1. ์ฃผ์–ด์ง„ ๋ฐ์ดํ„ฐ์—์„œ A๊ฐ€ B๋ณด๋‹ค ํฐ ์ผ€์ด์Šค์˜ ๋ฐ์ดํ„ฐ๋ฅผ ๊ฐ€์ ธ์˜ค๊ธฐ

โ€‹

๋ฐ์ดํ„ฐ ์ด๋ฆ„์€ results

์˜ค๋‹ต์€ results['A' > 'B']

โ€‹

์ •๋‹ต

 
 results[results['A'] > results['B']]

 

2. ์œ„ ๊ฒฐ๊ณผ์—์„œ 'set'์˜ ์ปฌ๋Ÿผ ๊ฐ’์„ ์ถœ๋ ฅํ•˜๊ธฐ

โ€‹

๋‚˜์˜ ์˜ค๋‹ต results[results['A'] > results['B'].'set']

โ€‹

์ •๋‹ต

 
results.loc[results['A'] > results['B'], 'set']