programing

Pandas Dataframe에서 dtype을 객체로 사용하는 열을 문자열로 변환하는 방법

megabox 2023. 6. 13. 22:10
반응형

Pandas Dataframe에서 dtype을 객체로 사용하는 열을 문자열로 변환하는 방법

panda 데이터 프레임에 CSV 파일을 읽어들이면 각 열은 고유한 데이터 유형으로 캐스팅됩니다.개체로 변환된 열이 있습니다.이 열에 대해 값 분할 및 목록 작성과 같은 문자열 작업을 수행하려고 합니다.그러나 dtype이 object이기 때문에 이러한 작업은 불가능합니다.컬럼의 모든 항목을 객체가 아닌 문자열로 변환하는 방법을 알려주실 수 있나요?

저는 여러 가지 방법을 시도했지만 아무 것도 되지 않았습니다.type, str(), to_string 등을 사용했습니다.

a=lambda x: str(x).split(',')
df['column'].apply(a)

또는

df['column'].astype(str)

문자열 데이터 유형은 가변 길이를 가지므로 기본적으로 객체 dtype으로 저장됩니다.문자열 유형으로 저장하려는 경우 다음과 같은 작업을 수행할 수 있습니다.

df['column'] = df['column'].astype('|S80') #where the max length is set at 80 bytes,

또는 그 대신에

df['column'] = df['column'].astype('|S') # which will by default set the length to the max len it encounters

열에 다시 할당해 보셨습니까?

df['column'] = df['column'].astype('str') 

질문을 참조하면 판다 데이터 프레임은 문자열에 대한 포인터를 저장하므로 '객체' 유형입니다.문서에 따르면 다음을 시도할 수 있습니다.

df['column_new'] = df['column'].str.split(',') 

질문에 직접 대답하지는 않지만 다른 사람에게 도움이 될 수 있습니다.

라는 칼럼이 있습니다.Volume두 가지 모두를 가지다-(잘못된/NaN) 및 형식이 지정된 숫자,

df['Volume'] = df['Volume'].astype('str')
df['Volume'] = df['Volume'].str.replace(',', '')
df['Volume'] = pd.to_numeric(df['Volume'], errors='coerce')

str.replace에 적용하기 위해서는 string에 캐스팅이 필요합니다.

판다.시리즈.스트럴리플레이스.
pandas.to _http://numeric

사용해 볼 수 있습니다.df['column'].str.문자열 함수를 사용합니다.판다 문서에는 스플릿과 같은 문서가 포함되어 있습니다.

언급URL : https://stackoverflow.com/questions/33957720/how-to-convert-column-with-dtype-as-object-to-string-in-pandas-dataframe

반응형