python run_multienv.py \ --headless \ --observation_type screenshot \ --model gpt-4-turbo \ --result_dir ./results_aws \ --test_all_meta_path evaluation_examples/test_small.json \ --region us-east-1