Pandas Dataframe에서 dtype을 객체로 사용하는 열을 문자열로 변환하는 방법
panda 데이터 프레임에 CSV 파일을 읽어들이면 각 열은 고유한 데이터 유형으로 캐스팅됩니다.개체로 변환된 열이 있습니다.이 열에 대해 값 분할 및 목록 작성과 같은 문자열 작업을 수행하려고 합니다.그러나 dtype이 object이기 때문에 이러한 작업은 불가능합니다.컬럼의 모든 항목을 객체가 아닌 문자열로 변환하는 방법을 알려주실 수 있나요?
저는 여러 가지 방법을 시도했지만 아무 것도 되지 않았습니다.type, str(), to_string 등을 사용했습니다.
a=lambda x: str(x).split(',')
df['column'].apply(a)
또는
df['column'].astype(str)
문자열 데이터 유형은 가변 길이를 가지므로 기본적으로 객체 dtype으로 저장됩니다.문자열 유형으로 저장하려는 경우 다음과 같은 작업을 수행할 수 있습니다.
df['column'] = df['column'].astype('|S80') #where the max length is set at 80 bytes,
또는 그 대신에
df['column'] = df['column'].astype('|S') # which will by default set the length to the max len it encounters
열에 다시 할당해 보셨습니까?
df['column'] = df['column'].astype('str')
이 질문을 참조하면 판다 데이터 프레임은 문자열에 대한 포인터를 저장하므로 '객체' 유형입니다.문서에 따르면 다음을 시도할 수 있습니다.
df['column_new'] = df['column'].str.split(',')
질문에 직접 대답하지는 않지만 다른 사람에게 도움이 될 수 있습니다.
라는 칼럼이 있습니다.Volume
두 가지 모두를 가지다-
(잘못된/NaN) 및 형식이 지정된 숫자,
df['Volume'] = df['Volume'].astype('str')
df['Volume'] = df['Volume'].str.replace(',', '')
df['Volume'] = pd.to_numeric(df['Volume'], errors='coerce')
str.replace에 적용하기 위해서는 string에 캐스팅이 필요합니다.
판다.시리즈.스트럴리플레이스.
pandas.to _http://numeric
사용해 볼 수 있습니다.df['column'].str.
문자열 함수를 사용합니다.판다 문서에는 스플릿과 같은 문서가 포함되어 있습니다.
언급URL : https://stackoverflow.com/questions/33957720/how-to-convert-column-with-dtype-as-object-to-string-in-pandas-dataframe
'programing' 카테고리의 다른 글
장고: 외부 키 충돌에 대한 역방향 접근기 (0) | 2023.06.13 |
---|---|
C 또는 C++에서 함수를 문서화하는 위치는 어디입니까? (0) | 2023.06.13 |
Android 에뮬레이터에 텍스트 붙여넣기 (0) | 2023.06.13 |
IIS 구성 오류 - 이 구성 섹션은 이 경로에서 사용할 수 없습니다. (0) | 2023.06.13 |
C 전처리기 "문자열화"의 반대말 (0) | 2023.06.13 |