본문 바로가기

PYTHON16

멀티프로세싱 (Multiprocessing) w/ Python 빅데이터로 작업할 때 성능을 개선하는 방법 사이즈가 큰 데이터로 작업할 때 대부분의 경우 많은 양의 계산이 필요합니다. 코드가 돌다가 중간에 에러가 나서 멈춘다던가 혹은 결과를 기다리는 데 오랜 시간을 소비할 때 받는 스트레스란... 머신러닝이나 딥러닝 관련 모델링 작업을 할 때 데이터량이 GB 단위라면 를 처리하는 것은 시간이 많이 걸리게 됩니다. 이처럼 복잡하고 연산이 많이 필요한 작업의 성능 속도를 향상시키는 방법에는 크게 두 가지가 있습니다: 1. Vertical Scaling (수직적 스케일링) Vertical Scaling은 단순하게 컴퓨팅 파워를 늘리는 것입니다. 더 좋은 그래픽 카드를 사용하거나 CPU의 성능을 높이는 등 더 나은 하드웨어를 구매하는 방식으로 작업 속도를 향상 시킵니다. 자.. 2023. 1. 26.
[API] DALL·E 2 Python으로 사용해보기 ChatGPT를 개발한 OpenAI는 작년 4월에 Text to Image 모델인 DALL·E 2도 공개한 적이 있습니다. 최근에 그림을 그려주는 AI와 사진을 아니메 (Anime) 풍으로 변환을 해주는 각종 필터가 유행을 하고 있어서 이미지와 관련된 AI는 놀랍게 느껴지진 않을 수 있습니다. 하지만 단순한 설명만으로 저작권 없는 고퀄리티 이미지를 생성할 수 있기 때문에 아트 업계 쪽에서는 큰 위협이 될 수 도 있습니다. 개인적으로 AI가 불러오는 disruptive innovation의 가장 첫 번째 분야는 예술이 아닐까 싶습니다. OpenAI 홈페이지에서 체험을 하시려면 아래의 링크를 참고하시면 됩니다 DALL·E Experiment with DALL·E, an AI system by OpenAI l.. 2023. 1. 25.
Python으로 메일 보내기 [@gmail] 오늘은 Python으로 이메일을 보내는 방법에 대한 정리를 해보려고 합니다. "굳이 왜 Python으로 메일을 보내는 법을 알아야 합니까?"라고 묻는다면, 다음과 같은 장점이 있습니다: 1. 많은 사람에게 쉽게 보낼 수 있습니다. 1,000명의 이메일이 있는 엑셀 파일이 있습니다. 모든 사람들에게 메일을 발송하려면 지루한 반복 작업을 계속해야 하지만, Python을 사용한다면 1,000명이든 10,000명이든 많은 사람들에게 메일을 보낼 수 있습니다. 실제로 우리가 받는 스팸메일은 이런 방식으로 보내집니다. 2. 스케줄러나 crontab을 활용하여 정해진 시간에 정기적으로 메일 발송을 할 수 있습니다. 혹시 매일 아침 8시에 특정 정보가 들어간 뉴스레터를 받아보고 계신가요? 특정시간에 정기적으로 발송되는.. 2023. 1. 21.
[웹크롤링 1탄] requests와 bs4를 활용한 레시피 목록 크롤링 회사에서 혹은 개인 프로젝트를 진행할 때 데이터를 크롤링해 오는 경우가 종종 있습니다. 제품 데이터를 가져온다던지, 최근 2년 치의 경제 뉴스 기사를 모은다던지 등 웹사이트에서 데이터를 직접 수집하고 있습니다. 지금까지는 주로 requests와 bs4 라이브러리를 사용했고, JavaScript 비중이 높은 동적 웹사이트는 selenium을 통해 브라우저로 필요한 데이터를 가져오는 작업을 했습니다. 우연하게 requests 라이브러리를 제작한 사람들이 JavaScript지원을 하는 requests-html이라는 패키지를 만들었다는 것을 알게 되어서 이왕 테스트를 해보는 김에 크롤링하는 방법을 정리하는 시리즈 형 포스트를 작성하기로 했습니다. 이번 포스트에서는 requests와 bs4을 활용한 정적 웹페이지.. 2023. 1. 19.
반응형