하룹AI 플러그인 개발자 모집안내
하룹AI에 플러그인 개발자를 모집합니다.
안녕하세요 하룹AI 개발팀입니다. 하룹AI 개발팀에서 원격근무 및 재택근무로 가능한 서드파티 플러그인 개발자를 모집합니다. AI개발에 대한 업무를 하시는 분은, 부업으로도 추가수익을 창출 할 수 있는 좋은 기회일 수 있습니다.
서드파티 안내
신청 방법
하룹 공식홈페이지 문의하기를 통해, 문의를 주시면 하룹 인공지능 개발팀에서 직접 연락을 드립니다.
신청 조건
Python, Java, Javascript, 라마2, GPT-API, 팜2, 이외 LLM 오픈소스 인공지능 학습 및 개발이 가능한자
수익 책정 방식
플러그인당 수익, 사용량당 수익에 대한 책정
예를들어 모델의 사용빈도가 높은 경우 추가보상 수익
모델당 최소 데이터셋 5,000K 이상부터 출품가능
모델당 최소 500~2,000만원 지급 (양에 따라 이상 지급)
보상수익, 평균 이용 호출 이상기준부터 1건당, 0.1원 지급
쉽게 개발 가능한 도큐먼트를 지속적으로 제공합니다
하룹AI 플러그인 개발은 마음만 먹으면, 누구나 도전해 보실 수 있습니다. 복잡한 사항들이 있다면 이것은 대부분 API를 통해 처리되고 제공해 드릴 수 있으며, 어느정도의 개발 경력만 있다면, 그리 어렵지 않게 플러그인 개발이 가능합니다.
2023년 11월20일 (월)
하룹은 엄청난 원격근무 시스템을 갖추고 있습니다
하룹은 코로나 이전부터 재택근무 시스템과 원격근무 시스템 그리고 프리랜서 시스템과 인프라 시스템등 외부 협력에 있어서 엄청난 편리한 시스템과 외부 업무자분들의 우대 및 존중의 문화를 갖고 있습니다. 이로써 더욱 다양한 지원과 혜택과 함께 편하게 언제 어디서든지 업무를 하실 수 있습니다.
2023년 11월20일 (월)
하룹AI 플러그인 개발자문서
병원인공지능을 획기적으로 발전하는데 있어, 의미있는 업무로 수익을 창출 하세요.
하룹AI 구조이해
하룹 인공지능은 기본적으로 여러가지의 다양한 모델들이 합쳐져 있는 형태의 인공지능 모듈화를 이루고 있는 하나의 초거대 하이브리드AI 입니다. 즉, 사용자 요청에 따라 하룹AI는 호출모델을 결정할 수 있습니다. 기본적으로 하룹AI 초창기 인공지능이였던 하루비는 OpenAI 그리고 Microsoft Azure를 통한 방식이 베이직 구성을 기반으로 모델이 작동됩니다. 또한 GPT4보다는 GPT3.5를 선호하며, Palm2와 Anthropic Claude로 구성한 다양한 모델들이 사용자 이용 의도에 맞게 불러올 수 있습니다. 이는 비용최적화와 성능 최적화를 위한 멀티모달 하이브리드 AI 설계로, 중앙에 있는 하룹AI는 이 모든것을 연결하는 중앙 AI로써 작동되고 있습니다.
하룹AI 플러그인 파인튜닝 개발자 문서
하룹AI의 파인튜닝 과정은 특정 작업 및 도메인에 대한 모델의 성능을 최적화하는 복잡한 과정입니다. 이 과정은 다음과 같은 세부 사항을 포함합니다:
고급 데이터 전처리
파인튜닝 전에 데이터를 세밀하게 분석하고 전처리하여, 모델이 더 정확하고 효율적으로 학습할 수 있도록 합니다.
다중 모델 통합
GPT-3.5, Meta Llama2, Palm2 등의 다양한 모델들을 통합하여, 각 모델의 장점을 결합하고 상호 보완합니다.
동적 학습 알고리즘
하룹AI는 동적 학습 알고리즘을 사용하여, 실시간 데이터에 대응하고 지속적으로 성능을 개선합니다.
실시간 피드백 메커니즘
사용자의 피드백과 상호작용을 통해 모델을 지속적으로 개선하고, 사용자 경험을 향상시키는데 중점을 둡니다.
이러한 파인튜닝 과정은 하룹AI의 성능을 지속적으로 개선하고, 다양한 도메인과 작업에 대응할 수 있는 능력을 강화합니다. 개발자들은 이 문서를 통해 하룹AI의 파인튜닝 방식을 이해하고, 실제 프로젝트에 적용하는데 도움을 받을 수 있습니다.
하룹AI 임베딩 개발자 문서
하룹AI의 플러그인을 통한 임베딩 과정은 고도로 특화된 다양한 LLM 및 sLLM AI 모델들을 통합하는 복잡한 프로세스로, 여러 소스의 데이터를 효율적으로 활용하여 강력한 언어 이해 능력을 구축합니다. 이 과정은 다음과 같은 고급 기술과 방법론을 포함합니다:
크로스-모델 데이터 통합
서로 다른 AI 모델들로부터 얻은 데이터를 통합하여, 보다 풍부한 문맥 이해를 달성합니다. 이를 위해, 하룹AI는 각 모델의 특성을 분석하고, 이를 바탕으로 최적화된 임베딩을 생성합니다.
다중 모달 데이터 처리
텍스트, 이미지, 음성 등 다양한 형태의 데이터를 처리할 수 있는 멀티모달 접근 방식을 사용합니다. 이는 하룹AI가 보다 넓은 범위의 정보를 이해하고 활용할 수 있게 합니다.
동적 임베딩 생성
사용자의 요청과 상황에 맞춰 동적으로 임베딩을 생성하고 조정합니다. 이는 특정 도메인이나 작업에 대한 하룹AI의 반응을 더욱 정확하고 유연하게 만듭니다.
하룹AI 플러그인 파인튜닝 연결 및 임베딩
하룹AI 플러그인 임베딩은, 기본적으로 Microsoft Azure GPT3.5를 기반으로 하나, 그 어떠한 생성형 AI보다 병원마케팅 관련된 부분에 있어 결과치가 압도적으로 우수합니다. 이에 따라 프롬프트 엔지니어링도 상당히 중요한 요소입니다. 또한 하룹 RDS 데이터베이스에 각 과목별 데이터베이스에 병원마케팅 관련 데이터로부터 임베딩 데이터를 통합하며, OpenAI모델에서는 Pinecorn 벡터데이터를 이용합니다. 또한 플러그인을 연결하는 방식은 Python을 통해 아래와 같이 연결이 가능하며, 자신의 각 모델별 호출 API없이 구성하면 나머지는 하룹AI가 알아서 처리할 수 있습니다.
Python
import haroop_ai_module as haroop
from azure.ai.textanalytics import TextAnalyticsClient
from haroop.vectorizer import PinecornVectorizer
# Haroop AI 임베딩 초기화
haroop.initialize_embedding_model('GPT-3.5', 'Azure')
# Azure Text Analytics 클라이언트 설정
text_analytics_client = TextAnalyticsClient(endpoint="your_endpoint", credential="your_credential")
# Pinecorn 벡터 데이터 처리
pinecorn_vectorizer = PinecornVectorizer()
vectorized_data = pinecorn_vectorizer.vectorize('hospital marketing data')
# RDS 데이터베이스에서 데이터 추출 및 임베딩
rds_data = haroop.get_data_from_rds('hospital marketing', 'haroop_rds')
combined_embedding = haroop.create_dynamic_embedding(rds_data, vectorized_data)
# 임베딩 결과를 이용한 문맥 분석
context_analysis_result = haroop.use_embedding_for_task(combined_embedding, 'context analysis')
print(context_analysis_result)
플러그인을 연결할때 임베딩을 초기화 하고 싶을 수 있습니다. 이럴때는 임베딩 프로세스 초기화를 아래와 같이 진행한다면, 프로세스 초기화가 가능합니다. 또한 다중 데이터들을 불러올때는 한글로 표현이 가능합니다. 예를들어 {치과}라고 하면 치과와 관련된 데이터, {정형외과}라고 하면 정형외과 관련된 모든 데이터를 통한 모델개발이 가능합니다. 또한 이미지데이터에 경우는, 기존 하룹에서 작업한 디자인 이미지들을 {디자인이미지} 를 통해 불러올 수 있습니다. 이를 통해, 만드시는 목적에 따른 플러그인을 만드실 수 있으며, 그 결과값은 엄청나게 높은 퀄리티를 낼 수 있을 것입니다.
PHP
include 'haroop_ai.php';
// HaroopAI 임베딩 프로세스 초기화
$haroopAI = new HaroopAI();
$haroopAI->initEmbedding('GPT-3.5', 'Azure');
// 다중 데이터 소스 처리 예시 (다른 과목들도 {여기}에 입력만 하면 됩니다)
$textData = '{치과}';
$imageData = '{디자인이미지}';
$haroopAI->processMultimodalData($textData, $imageData);
// 치과 및 정형외과 관련 데이터 임베딩
$haroopAI->loadData('{정형외과}');
// 임베딩 결과 사용
$result = $haroopAI->analyzeContext();
echo "분석 결과: " . $result;
하룹AI 플러그인은 멘션을 지정하여 호출할 수 있습니다.
예를들어 "@"를 입력하는것만으로 해당 모델을 호출할 수 있으며
이를 위한 데이터 전송을 위한 프롬프트가 자동으로 표기됩니다.
예를들어 기본 베이스모델을 3가지를 선택한다고 치면
GPT3.5, meta lamma2 blog, palm2 이렇게 각 모델을 이용자 요청 답변값인
$haroop_ai_rp->query; 와 같은 방식으로 순차적으로 불러온뒤 모델을 연결하여 답변을 생성할 수 있습니다. 또한 이를 바로 실시간 임베딩을 시켜서 중앙AI인 하룹AI에게 전달할 수 있으며, 아래는 자바스크립트를 처리하는 방식을 보여줍니다.
JavaScript
import HaroopAI from 'haroop-ai-sdk';
// HaroopAI 초기화
const haroopAI = new HaroopAI();
// 멘션을 통한 모델 호출
const mention = "@";
let query = "";
// 멘션에 따른 모델 선택 및 프롬프트 설정
switch(mention) {
case "@GPT3.5":
query = "GPT3.5 모델로 요청 처리";
break;
case "@meta-lamma2-blog":
query = "Meta Lamma2 Blog 모델로 요청 처리";
break;
case "@palm2":
query = "Palm2 모델로 요청 처리";
break;
default:
query = "기본 모델로 요청 처리";
}
// 요청 처리 및 결과 반환
haroopAI.queryModel(query).then(response => {
const embeddedResponse = haroopAI.embedResponse(response);
console.log(embeddedResponse);
});
만약 토큰수가 100k 이상급에 데이터가 아니라면, 임베딩을 사용하지 않을 수 있습니다. 단순한 문장 정도면 세션을 이용해서 임시적으로 세션에 저장후 가져오면되지만, 문장수가 길어질경우, 세션으로 처리하는것은 한계가 있습니다. 그렇기에 이때는 임베딩이 아닌, 바로 RDS 혹은 제공하는 데이터베이스 테이블 (예, haroop_ai_plugin_name)에 자유롭게 칼럼들을 직접 추가하실 수 있으며, 데이터들에 형식 역시 자유롭게 지정하실 수 있습니다. 또한 데이터 삽입은 INSERT 등을 통해 각 구성된 칼럼들 (예를들어 id, text_data, haroopcenter_data, img_data 등등)로 INSERT가 가능하며, 출력후 Delete 문을 통해 자동삭제등에 처리를 하는것도 자유롭게 가능합니다.
SQL
-- 하룹AI 임베딩 데이터 저장
CREATE TABLE haroop_embedding_data (
id INT PRIMARY KEY,
text_data VARCHAR(255),
image_data VARCHAR(255),
embedding_output TEXT
);
-- 샘플 데이터 삽입
INSERT INTO haroop_embedding_data (id, text_data, image_data)
VALUES (1, '샘플 텍스트', '이미지 경로');
import HaroopDB from 'haroop-db';
// HaroopDB 인스턴스 생성
const db = new HaroopDB();
// 간단한 문장 처리
const simpleText = '간단한 문장';
db.storeTemporarySession(simpleText);
// 긴 문장 처리
const longText = '긴 문장 데이터';
if (longText.length > 100000) {
// RDS에 데이터 저장
db.insertInto('haroop_ai_plugin_name', {
id: 1,
text_data: longText,
haroopcenter_data: '여기에 하룹 센터 데이터',
img_data: '이미지 데이터 경로'
});
// 저장된 데이터 사용
db.query('SELECT * FROM haroop_ai_plugin_name WHERE id = 1', (result) => {
console.log('Query Result:', result);
// 사용 후 데이터 삭제
db.delete('DELETE FROM haroop_ai_plugin_name WHERE id = 1');
});
}
아래 쉘 스크립트는 하룹AI의 임베딩 프로세스를 실행하는 예시로, 텍스트와 이미지 데이터를 사용하여 임베딩을 생성하고 결과를 embedding_output.txt
파일에 저장하는 과정을 보여줍니다. 스크립트의 주요 단계는 다음과 같습니다:
데이터 준비
스크립트는 TEXT_DATA
와 IMAGE_DATA
변수에 각각 텍스트와 이미지 데이터의 경로를 저장합니다.
임베딩 프로세스 실행haroop_ai_embedding
명령어를 사용하여 하룹AI 임베딩 프로세스를 실행합니다. 이 명령어는 텍스트와 이미지 데이터를 입력으로 받아 임베딩을 생성합니다.
결과 저장
생성된 임베딩 결과는 embedding_output.txt
파일에 저장됩니다.
Linux 쉘 스크립트
#!/bin/bash
# 하룹AI 임베딩 프로세스 실행 스크립트
# 텍스트와 이미지 데이터 준비
TEXT_DATA="샘플 텍스트"
IMAGE_DATA="이미지 경로"
# HaroopAI 임베딩 프로세스 실행
haroop_ai_embedding --text "$TEXT_DATA" --image "$IMAGE_DATA" > embedding_output.txt